[빅데이터/인공지능 목차]

 

시계열분석의 정의

- 시간의 흐름에 따른 데이터의 변화추이 또는 패턴을 찾아 미래를 예측하는 분석기법

 

시계열데이터의 4가지 요인

변동요인 설명
추세변동요인 인구변화, 기술변화, 생산성 증대 등 장기적인 변동으로 통상 10년 이상의 변동주기를 가지는 변동요인
순환변동요인 경기순환 등에 따라 반복되는 변동으로 2년~5년 주기로 변화하는 변동요인
계절변동요인 계절의 변화 및 각종 관습에 의해 생성되는 1년 주기로 반복되는 변동 요인
불규칙 변동요인 추세, 순환, 계절 변동요인이 아닌 돌발적이거나 원인불명의 요인에 의거하여 발생하는 변동요인

 

시계열데이터의 정상성(Stationary)

- 시계열의 수준과 분산에 체계적인 변화가 없고 엄밀하게 주기적 변동이 없다는 것으로 미래는 확률적으로 과거와 동일하다는 성질

  1. 평균이 일정
  2. 분산이 시점에 의존하지 않음
  3. 공분산은 단지 시차에만 의존하고, 시점 자체에는 의존하지 않음
    γk=Cov(Zt , Zt+k)

 

정상성 확보 기법

- 일반적으로 평균이 일정하지 않을 때(추세가 존재) 차분을 수행하고 , 분산이 일정하지 않을 때 변환을 수행하여 정상성을 갖추도록 함

 

시계열 분석 기법

  • 시계열 분석 기법으로는 자기회귀모형, 자기이동평균모형, 자기회귀이동평균모형, 자기회귀누적이동평균모형이 있음

모형 설명
AR
  • Auto Regression(자기회귀모형)
  • 현 시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명되는 모형
MA
  • 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합으로 이루어진 모형
ARMA
  • Auto Regression Moving Average(자기회귀이동평균모형)
  • AR, MA 모형을 동시에 포함하여 시계열모형의 모수를 줄여서 보다 효율적인 시계열 분석을 수행하는 모델 기법
ARIMA
  • Auto Regressive Integrated Moving Average(자기회귀누적이동평균모형)
  • 시계열을 차분해서 ARMA 모형이 되는 모형

 

+ Recent posts