BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 불안정 시계열 모형 검정

Started ‎01-27-2022 by
Modified ‎01-27-2022 by
Views 648

 

 

앞에서 다룬 시계열 모형에서 불안정석 Nonstationary 에 대해 언급하지는 않았지만 실제로 AR(1) 모형에서 |a| < 1 이라고 가정한 것은 모형의 안정성, Staionary 를 보장하기 위한 것입니다.

만약 |a| >= 1 이라면, AR(1) 모형은 불안정한 AR(1) , 즉 Nonstationary AR(1) 시계열 모형이 됩니다.

예를들어, 아래 AR(1) 모형은 불안정 AR(1) 입니다.

 

 

image.png

 

위의 식은 Random Walk 라고 불리는 불안정 시계열모형이며 주식가격을 시계열모형으로 표시할 때 자주 사용되는 모형입니다. 위에서 설명한 AR(1)의 경우 Yt-1 의 계수 a 값이 -1 < a < 1을 만족한다는 가정을 했는데,

위의 식에서 a = 1의 경우 위에서 분석한 안정적 시계열 AR(1) 과 다른 통계적 특성을 갖고 있는 불아정시계열 모형, Non-Staionary Time Series Model 이기 때문에 좀더 깊이 있는 분석을 해야합니다.

 

 

위의 식을 MA(∞) 로 전환하면 아래와 같습니다.

 

image.png

 

위의 식에서 볼 수 있는 바와 같이 Yt 값은 백색잡음 et들의 무한 합으로 이 합은 이전의 AR(1)과 같이 가중치가 곱해진 합이 아닌, 가중치가 모두 1이라서 , t 기에서 먼 백색잡음이나, t 기에 가까운 백삭잡음 모두 동일하게 가중치 1을 가지고 있습니다. 다시 말하면 어떤 특성의 백색잡음은 Yt 에 가중치 없이 100% 영향을 미치며 이 영향은 사라지지 않고 영원히 남아있습니다. 그래서 이 랜덤워크의 백색잡음 et 를 랜덤트렌드 Random Trend 라고 하기도 합니다.

 

image.png

 

위 (1) 식을 다시 표현하면 식 (3)과 같이 됩니다.

 

 

image.png

 

 

안정 시계열 모형과 불안정 시계열 모형을 구분해주는 통계적 특성은 " 어떤 특성 백색잡음이 종속변수 Yt+k 에 미치는 영향의 크기가 시간이 지날수록 (= k가 증가할수록) k가 증가할 수록 점점 작아지는지 아니면 전혀 작아지지 않고 그대로인지에 따라 구분됩니다.

어떤 특성 백색잡음의 영향이 세월의 흐름과 함께 점점 작아지는 현상을 갖고 있으면 그 시계열은 안정시계열 모형이 되고, 세월이 가는데도 불구하고 그 영향의 크기가 전혀 감소하지 않는 시계열은 불안정시계열모형이 됩니다.

식 (1) 에 상수항 m을 추가하면 아래의 식 (5)가 됩니다.

 

image.png

 

 

 

그러므로 식 (5)가 아래와 같이 식 (6) 으로 표현 될 수 있습니다.

 

image.png

 

 

 

식 (6)은 불안정시계열모형의 특징이 무엇인지를 잘 보여주는 식입니다.

즉, AR 모형을 MA 모형으로 변환하고자 한다면 상수항 m과 백색잡음 e 와 그 과거값들이 지속적으로 더해진다는 사실입니다. 우선 상수항이 지속적으로 더해지기 때문에 식 (6)의 종속변수 Yt 는 상수항 m 값에 따라 지속적으로 상승하거나 하락하는 트랜드이고, km 에 백색잡음은 계속 더해지는 시계열이 됩니다.

그러므로 Yt 플롯은 기울기가 m인 직선에 랜덤워크 시계열모형이 더해진 복잡한 형태를 띨 것입니다.

불안정시계열모형을 검정하는 방법으로 잘 알려진 것은 디기-풀러(Dickey-Fuller) 검정, DF Test 입니다.

DF Test 는 다음과 같은 3가지 회귀모형을 이용합니다.

3가지 모형을 이용하는 이유는 각 모형마다 95% 검정임계치, 95% Critical Value of Hypothesis Test 가 다르기 때문입니다.

 

 

 

 

image.png

 

 

식 (7) 은 보통의 AR(1) 모형입니다. 만약 |p| < 1 이라면 안정시계열모형 AR(1)이 됩니다.

식 (8) 은 AR(1) 모형에 상수항, Constant 가 있는 모형입니다.

식 (9)는 식 (8) 의 AR(1) 모형에 타임트랜드 rt 항이 추가된 모형입니다.

여기서 t는 자연수 1,2,3, .... 입니다. 위 3가지 모형을 이용하여 시계열자료가 불안정인지 아닌지를 검정하는 방법은 귀무가설 p = 1 을 검정하는 것 입니다. 3개의 모형 모두 귀무가설 p = 1 을 검정하는 것인데, 3개의 모형을 각각 제시한 이유는 모형에 따라 검정통계치 ( Test Statistic) , t = n ( p - 1)의 점근적 분포, Asymptotic Distribution 이 3개 모두 다르기 때문입니다.

 

 

 

 SAS CODE

 

많이 사용한 미국의 산업 생산 데이터 ip 데이터에 Log 를 씌운 Logip 자료가 불안정 시계열자료인지 아닌지를 검정하기 위해 식 (8) 과 식 (9) 를 사용하여 검정을 진행한 코드가 아래에 있습니다.

 

 

data ip;
infile '/home/u45061472/ip.prn';
input mon ip;
logip = log(ip);
logip1 = lag(logip);
ipg = dif(logip)*1200;
ipg1 = lag(ipg);
if mon < 19590101 then delete;
num = _N_;
run;

proc reg data=ip;
model logip = logip1;
model logip = num logip1;
model ipg = ipg1;
run;

 

 

4번째 줄은 ip 자료에 자연로그 log 베이스 e 를 붙이는 작업입니다.

5번째 줄은 logip의 전기값, (t-1) 기 값에 logip1 이라는 이름을 붙이는 명령입니다.

6번째 줄은 logip 변수의 1차 차분값을 구하는 명령이며 어떤 변수에 LOG 값을 구한 후 이 값의 1차 차분값을 구하면, 그변수의 성장률이 되므로 ip의 성장률, 즉 ipg를 구하는 명령입니다.

7번째 줄은 ipg의 전기값, (t-1)기 값에 ipg1 이라는 이름을 붙이는 명령입니다.

8번째 줄은 1959년 1월 이전의 데이터는 삭제하라는 명령입니다.

11번째 줄은 Regression 분석이 시작됨을 알리고 있습니다.

12번째 줄은 첫 번째 회귀분석 모형 식 (8) 을 정의하였습니다.

 

 

 

결과

 

 

스크린샷_2021-12-20_오후_10.39.56.png

 

 

 

위 SAS 결과는 MODEL logip = logip1; 12번째 줄의 MODEL 의 결과입니다.

우선, 이 회귀분석에 이용한 데이터 수는 715개 입니다.

여기서 주의할 점은 만약 lopgip 데이터가 불안정시계열 자료 즉, p = 1이라면 p 추정치는 샘플 수가 무한히 증가하다라도 Asymptotic 정규분포를 갖지 못합니가. 그러므로 위 SAS 결과에 나오는 F 값이나 t 값들은 왜곡된 값으로 사용할 수 없는 것 입니다. 그러므로 F 나 t 값들에 의미를 부여할 필요가 없습니다.

 

 

스크린샷_2021-12-20_오후_10.50.05 (1).png

 

 

logip 변수가 불안정시계열변수라면 lopip1 변수의 계수추정치 ( p hat)은 점진적 정규분포 Asymptotic Normal Distribution 을 갖지 않기 대문에 아래 나타나 있는 Standard Error, T value , Pr > | t | 값들은 사용할 수 없는 값들입니다.

 

 

스크린샷_2021-12-20_오후_10.53.34.png

 

 

ipg 데이터는 우상향 트랜드가 있을 가능성을 제시하고 있습니다. 그러므로 불안정시계열 검정모형에도 시차 트랜드 Time Trend 변수를 고려하는 것이 맞다는 주장을 할 수 있습니다 .이러한 견해를 반영하여 회귀분석한 결과가 위의 Parameter Estimates 입니다.

위 결과를 보면 Time Trend변수를 나타냅니다. 이 값은 Dickey-Fuller Table 샘플 수 500, 유의수준 0.05 컬럼에 있는 임계치 -21.5 보다 상당히 크기 대문에 귀무가설 p = 1을 기각하지 못합니다. 즉, logip 데이터는 불안정시계열 데이터로 Non-Staionary Time Series Data 라고 판단할 수 있습니다. 결국 logip 데이터에 대해 2가지 모형을 이용하여 불안정시계열 검정을 실행한 결과는 모두 불안정시계열데이터라를 점을 강조한다고 판단할 수 있습니다.

 

 

Version history
Last update:
‎01-27-2022 12:38 AM
Updated by:
Contributors

sas-innovate-white.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.

 

Early bird rate extended! Save $200 when you sign up by March 31.

Register now!

Article Labels
Article Tags