인하대학교 공학대학원(인공지능융합전공)/시계열 분석

3. Introduction to Forecasting_(2) (2026)

복리 엔지니어 2026. 3. 27. 00:02

📊 시계열 분석 핵심 정리 (강의 요약)

1. 시계열 분석의 시작: “그림을 먼저 그려라”

시계열 분석의 첫 단계는 데이터를 시각화하는 것이다.

  • 전체 흐름(패턴)을 파악
  • 특히 아래 2가지를 확인
    • Trend (추세): 장기적인 증가/감소 방향
    • Seasonality (계절성): 반복되는 패턴

👉 단, 그래프 해석은 주관적이기 때문에
반드시 이후에 수치적 방법으로 검증해야 한다.


2. 트렌드 & 계절성 파악 방법

✔ 트렌드 확인 방법

  • Smoothing (평활화)
  • 회귀선 (직선 fitting)

✔ 계절성 확인 방법

  • 일정한 주기로 반복되는 패턴 확인
    • 예: 매년 같은 시점에 피크 발생

3. Deterministic vs Stochastic

시계열을 보는 두 가지 관점

1️⃣ Deterministic (결정론적)

  • 시간(t)에 따라 값이 결정됨
  • 예: 선형 회귀 (y = at + b)

👉 쉽고 직관적 → 처음 분석할 때 사용


2️⃣ Stochastic (확률적)

  • 과거 값이 현재 값에 영향을 줌
  • 예: AR, ARMA, ARIMA

👉 더 현실적이지만 어려움


📌 핵심 흐름
👉 쉬운 것 → 복잡한 것 순서로 접근

Deterministic → Stochastic → ARIMA
 

4. 트렌드 제거 방법 (Detrending)

트렌드를 제거하는 방법은 2가지

방법 1️⃣ 회귀 기반 제거

  • 직선(또는 곡선)을 fitting 후 제거
  • → Deterministic 방식

방법 2️⃣ 차분 (Differencing)

  • 현재값 - 이전값
  • → Stochastic 방식

👉 둘 다 사용 가능하며,
결과적으로 계절성 패턴이 남는지 확인


5. 시계열 분석의 핵심 목표

👉 Trend + Seasonality를 제거하는 것

이 과정을 비유하면:

  • 트렌드 제거 → 큰 살 제거
  • 계절성 제거 → 잔여 패턴 제거
  • 최종 결과 → White Noise

✔ White Noise란?

  • 완전히 랜덤한 데이터
  • 더 이상 설명할 패턴이 없음

👉 즉,
모델이 완벽하게 설명한 상태


6. 모델링 프로세스 (Box-Jenkins 방법론)

시계열 분석의 대표적인 흐름

1️⃣ Identify (패턴 파악)

  • 그래프 확인
  • 트렌드 / 계절성 분석

2️⃣ Estimate (모델 추정)

  • ARMA / ARIMA 적용

3️⃣ Forecast (예측)

  • 미래 값 예측

7. 잔차(Residual) 분석의 중요성 ⭐

모델링에서 가장 중요한 포인트

👉 잔차 = 실제값 - 예측값

좋은 모델의 조건

  • 잔차가 랜덤해야 함
  • 패턴이 없어야 함

나쁜 모델 특징

  • 특정 패턴 존재
  • 한쪽으로 치우침

👉 즉,
잔차에 패턴이 남아 있으면 → 모델이 부족한 것


8. 모델 성능 평가 방법

✔ 가장 많이 쓰는 지표

1️⃣ MSE (Mean Squared Error)

  • 오차 제곱 평균
  • 가장 기본적인 지표

2️⃣ MAE (Mean Absolute Error)

  • 절대값 기준 오차

3️⃣ MAPE (주의 필요)

  • 비율 기반 오차

⚠️ 단점:

  • 값이 작은 구간에서 왜곡 발생

9. 시계열 데이터 검증 방법 (중요)

일반 ML과 차이점

❌ 랜덤 샘플링 불가능

→ 시간 순서 깨짐


✔ 해결 방법: Hold-out

예:

  • 앞 4년 → 학습
  • 마지막 1년 → 테스트

📌 추천 데이터 길이

  • 최소: 3~5년
  • 이유:
    • 계절성 반영
    • 안정적인 평가

10. 모델 선택 기준 (AIC)

✔ AIC (Akaike Information Criterion)

  • 모델의 성능 + 복잡도 고려

👉 공식 개념:

  • 잘 맞을수록 ↓
  • 복잡할수록 패널티 ↑

👉 선택 기준:
👉 AIC가 가장 작은 모델 선택


⚠️ 주의

  • 무작정 최소값 선택 ❌
  • 기본적으로 “괜찮은 모델들” 중에서 선택해야 함

11. Overfitting vs Underfitting

Underfitting

  • 학습도 못함
  • 너무 단순한 모델

Overfitting

  • 학습 데이터만 잘 맞음
  • 미래 예측 실패

👉 해결 방법

  • 테스트 데이터 검증 (Hold-out)

12. 실무에서 중요한 관점

✔ 데이터 분석의 전제

👉 “미래도 과거와 비슷하다”


⚠️ 하지만 현실은?

  • 코로나 같은 이벤트 발생
  • 시장 상황 변화

👉 이 경우:
👉 모델 다시 만들어야 함


🔥 핵심 한 줄 정리

👉 시계열 분석 = 패턴(Trend + Seasonality)을 제거하고, 남은 것을 설명하는 과정