📊 시계열 분석 핵심 정리 (강의 요약)
1. 시계열 분석의 시작: “그림을 먼저 그려라”
시계열 분석의 첫 단계는 데이터를 시각화하는 것이다.
- 전체 흐름(패턴)을 파악
- 특히 아래 2가지를 확인
- Trend (추세): 장기적인 증가/감소 방향
- Seasonality (계절성): 반복되는 패턴
👉 단, 그래프 해석은 주관적이기 때문에
반드시 이후에 수치적 방법으로 검증해야 한다.
2. 트렌드 & 계절성 파악 방법
✔ 트렌드 확인 방법
- Smoothing (평활화)
- 회귀선 (직선 fitting)
✔ 계절성 확인 방법
- 일정한 주기로 반복되는 패턴 확인
- 예: 매년 같은 시점에 피크 발생
3. Deterministic vs Stochastic
시계열을 보는 두 가지 관점
1️⃣ Deterministic (결정론적)
- 시간(t)에 따라 값이 결정됨
- 예: 선형 회귀 (y = at + b)
👉 쉽고 직관적 → 처음 분석할 때 사용
2️⃣ Stochastic (확률적)
- 과거 값이 현재 값에 영향을 줌
- 예: AR, ARMA, ARIMA
👉 더 현실적이지만 어려움
📌 핵심 흐름
👉 쉬운 것 → 복잡한 것 순서로 접근
Deterministic → Stochastic → ARIMA
4. 트렌드 제거 방법 (Detrending)
트렌드를 제거하는 방법은 2가지
방법 1️⃣ 회귀 기반 제거
- 직선(또는 곡선)을 fitting 후 제거
- → Deterministic 방식
방법 2️⃣ 차분 (Differencing)
- 현재값 - 이전값
- → Stochastic 방식
👉 둘 다 사용 가능하며,
결과적으로 계절성 패턴이 남는지 확인
5. 시계열 분석의 핵심 목표
👉 Trend + Seasonality를 제거하는 것
이 과정을 비유하면:
- 트렌드 제거 → 큰 살 제거
- 계절성 제거 → 잔여 패턴 제거
- 최종 결과 → White Noise
✔ White Noise란?
- 완전히 랜덤한 데이터
- 더 이상 설명할 패턴이 없음
👉 즉,
모델이 완벽하게 설명한 상태
6. 모델링 프로세스 (Box-Jenkins 방법론)
시계열 분석의 대표적인 흐름
1️⃣ Identify (패턴 파악)
- 그래프 확인
- 트렌드 / 계절성 분석
2️⃣ Estimate (모델 추정)
- ARMA / ARIMA 적용
3️⃣ Forecast (예측)
- 미래 값 예측
7. 잔차(Residual) 분석의 중요성 ⭐
모델링에서 가장 중요한 포인트
👉 잔차 = 실제값 - 예측값
좋은 모델의 조건
- 잔차가 랜덤해야 함
- 패턴이 없어야 함
나쁜 모델 특징
- 특정 패턴 존재
- 한쪽으로 치우침
👉 즉,
잔차에 패턴이 남아 있으면 → 모델이 부족한 것
8. 모델 성능 평가 방법
✔ 가장 많이 쓰는 지표
1️⃣ MSE (Mean Squared Error)
- 오차 제곱 평균
- 가장 기본적인 지표
2️⃣ MAE (Mean Absolute Error)
- 절대값 기준 오차
3️⃣ MAPE (주의 필요)
- 비율 기반 오차
⚠️ 단점:
- 값이 작은 구간에서 왜곡 발생
9. 시계열 데이터 검증 방법 (중요)
일반 ML과 차이점
❌ 랜덤 샘플링 불가능
→ 시간 순서 깨짐
✔ 해결 방법: Hold-out
예:
- 앞 4년 → 학습
- 마지막 1년 → 테스트
📌 추천 데이터 길이
- 최소: 3~5년
- 이유:
- 계절성 반영
- 안정적인 평가
10. 모델 선택 기준 (AIC)
✔ AIC (Akaike Information Criterion)
- 모델의 성능 + 복잡도 고려
👉 공식 개념:
- 잘 맞을수록 ↓
- 복잡할수록 패널티 ↑
👉 선택 기준:
👉 AIC가 가장 작은 모델 선택
⚠️ 주의
- 무작정 최소값 선택 ❌
- 기본적으로 “괜찮은 모델들” 중에서 선택해야 함
11. Overfitting vs Underfitting
Underfitting
- 학습도 못함
- 너무 단순한 모델
Overfitting
- 학습 데이터만 잘 맞음
- 미래 예측 실패
👉 해결 방법
- 테스트 데이터 검증 (Hold-out)
12. 실무에서 중요한 관점
✔ 데이터 분석의 전제
👉 “미래도 과거와 비슷하다”
⚠️ 하지만 현실은?
- 코로나 같은 이벤트 발생
- 시장 상황 변화
👉 이 경우:
👉 모델 다시 만들어야 함
🔥 핵심 한 줄 정리
👉 시계열 분석 = 패턴(Trend + Seasonality)을 제거하고, 남은 것을 설명하는 과정
'인하대학교 공학대학원(인공지능융합전공) > 시계열 분석' 카테고리의 다른 글
| 6. R 기초 & 시계열 시각화— Time Plot & Smoothing (0) | 2026.05.21 |
|---|---|
| 5. Advanced Forecast Models for Autocorrelated Time Series (2026) (0) | 2026.05.08 |
| 4. Simple Forecast Models (2026) (0) | 2026.04.17 |
| 2. Introduction to Forecasting_(2) (2026) (0) | 2026.03.20 |
| 1. Introduction to Forecasting (2026) (0) | 2026.03.13 |