BookmarkSubscribeRSS Feed

[ SAS 활용 노하우 ] Time Series Forecasting part3

Started ‎03-26-2021 by
Modified ‎03-26-2021 by
Views 1,120

 

이번 게시글은 [ SAS 활용 노하우 ] TimeSeries Forecasting part2에 이어지는 글입니다.

 

 

 

8. ARIMAX 

 

두 시계열사이의 관계를 회귀모형의 형태로 표현한 모형을 ARLMAX 또는 전이함수모형이라 합니다.

 

* ARIMAX 모형 예시

 

그림1.png 

그림1.png

 

 

* 주요특성

1. ARIMA 모형과 달리 반응변수에 독립변수와의 관계를 반영하여 시계열예측입니다.

2. 회귀분석은 미래값을 예측할 때 반드시 독립변수의 미래값을 알아야 하지만 ARIMAX 모형에서는 독립변수를 예측해서 모형에 반영하기 때문에 미래값을 알지 못하여도 예측가능 반응변수가 하나인 단변량 ARIMA 모형보다 좋은 분석 결과를 얻을 수 있습니다.

 

* 활용방안

1. 인과관계가 존재하는 시계열 데이터들에 대하여 모형을 만들고 싶을 경우 사용 ( Ex: 매출과 계량경제지표 등)

2. 반응변수와 독립변수의 동적관계를 규명할 경우 사용

3. 경제 시계열 분석시 IMF나 Subprime Mortage 사태 같은 외부적 충격에 대한 설명력 및 예측력을 반영한 모델을 생성할 시에 유용하게 활용가능입니다.

 

 

 

9. VAR Model

 

시계열 분석의 특징과 회귀분석의 특징을 결합하여 상관관계와 인과관계를 추정할 수 있는 다변수 시계열 모형입니다.

 

* VAR Model로 분석 가능한 시계열 예시

 

그림1.png

 

* 주요 특성

1. 단일 시계열 분석에서 AR 모형이 주로 이용되는 거소가 같이 여러 형태의 벡터 시계열모형 중에서 추정 및 예측이 쉽고 변수 사이의 동태적인 관계를 분석하는데 유용합니다.

2. 모든 변수가 내생변수이므로 특정한 조건 없이 예측을 실행할 수 있는 장점이 있으나 추정해야 할 모수가 과도하게 많아져 예측력 저하될 가능성이 존재합니다.

 

* 활용방안

1. 변수들 사이에 이론적 관계를 고려하지 않고 간단한 예측 실행 가능합니다.

2. 경제변수들 사이의 관계에 대한 가정을 고려하지 않고 모형을 구축할 수 있는 방법을 사용하지만, 변수들 사이의 다양한 동태적 관계를 점검 가능

 

 

 

10. UCM

 

시계열 자료에서 특정 구성 요소들(가장 대표적인 것이 계절)로 나누어서 모형화를 한 다음, 이를 연결하여 하나의 모형으로 만드는 방법

 

[ 대표적인 UCM 분석 방법 ]

 

그림1.png

 

* 주요특성

  • 일반적 시계열 예측 방법 중 여러 가지 요소(추세변동, 계절변동, 불규칙변동 등)로 분해 후 각각 예측 후 결합하는 분해법
  • 분해법 종류 - 전통분해법 X11, X12
  • 과거의 시계열의 형태를 이해하는데 매우 유리함

 

* 활용방안

  • 추세/순환성, 계절성 패턴이 잘 나타나는 경우 활용 가능합니다.
  • 단기 예측에 주로 활용합니다.

 

 

11. Model Validation Method

 

모델검증 방법은 선택된 모델에 의하여 미래 값을 예측하고 실제 값과 비교하는 과정입니다.

 

* 모델검증 개념 설명

 

그림1.png

 

모형 비교  모형 평가
  • 데이터 종류 - 분석데이터 (Train) 사용
  • 모형판단 기준 - 분석데이터 기준 하에 적합률 판단
  • 데이터 종류 - 검증데이터(Test) 사용
  • 모형판단 기준 - 과적합 여부 판단

 

1. 모형비교에서는 적합통계량 기준으로 모형을 선택하고 최종 선전된 모형으로 예측을 수행합니다.

2. 모형평가에서는 예측값과 실제값을 비교하여 Overfitting되지 않은 Robust한 모형여부 판단됩니다.

 

* 주요 특성

1. 분석데이터에 대한 모형 적합률이 아닌 검증데이터의 모형 적합률을 통계량 지표로 사용

2. 검증데이터의 적합통계량은 분석데이터에 대한 적합통계량 보다 성능이 낮음

3. 분석 구간에 대한 설정에 따라서 검증데이터의 적합통계량 성능이 좌우되기 쉬움

( 분석 구간을 다양하게 변화하면서 모형을 생성하고 비교해서 최적 구간을 찾아야 함)

 

* 활용방안

  • 모형에 대한 최종선택여부 판단에 활용
  • 실제값과 예측값을 비교하여 모형의 과적합 여부 또는 예측력을 판단 ( 과적합되지 않으며 예측력 또한 좋은 모형을 선택해야 합니다.)
Version history
Last update:
‎03-26-2021 09:57 PM
Updated by:
Contributors

sas-innovate-white.png

🚨 Early Bird Rate Extended!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.

 

Lock in the best rate now before the price increases on April 1.

Register now!

Article Labels
Article Tags