BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 회귀모형 오차항의 자기상관 검정 - 더빈 h 검정

Started ‎11-21-2021 by
Modified ‎11-21-2021 by
Views 1,086

 

회귀분석은 설명하는 독립변수와 설명되어지는 종속변수가 모두 연속형 변수일 때, 이들 변수들 간의 함수적 관계를 규명하기 위해 모형을 가정하고 변수들로부터 가정한 모형을 추정하는 분석입니다.

 

 

스크린샷 2021-11-21 오후 11.32.47.png

 

 

1개의 독립변수의 값에 의해서 측정가능한 종속변수에 대해 아래와 같이 단순선형 회귀모형은 아래와 같습니다.

 

 

스크린샷 2021-11-21 오후 11.32.53.png

 

이 회귀모형은 다음과 같은 가정을 합니다.

 

1) 독립변수 X와 Y의 관계는 선형이다.

2) 오차항은 정규분포를 따른다.

3) 오차항의 분산은 동일한 값을 가진다.

4) 오차항은 서로 확률적으로 독립이다.

 

회귀분석에서의 추정과 검정을 신뢰하기 위해서는 자료가 위와 같은 가정에 부합하는지 검토할 필요가 있습니다.

그 중 4번째 가설 '오차항은 서로 독립이다.'라는 가정은

회귀모형을 이용하여 자료를 분석할 때는 일반적으로 오차항이 최소한 상관성이 없다는 전제를 합니다. (의미: 오차항 간 상관계수는 -)

하지만 오차항의 독립성 가정이 지켜지지 않고 자기상관이 존재할 경우, 회귀분석의 최소제곱추정량에 대한 정당성은 깨지게 됩니다.

 

그래서 오차항에 대한 독립성 검정을 실시합니다.

방법 1. 더빈 왓슨(Durbin Watson) 검정

방법 2. 더빈의 h 검정

이번 게시글은 더빈 h 검정에 관한 글 입니다.

 

                                                                                                                                                              

 

분석에 사용할 데이터

 

이번 게시글에서 사용할 데이터 fyff(the U.S Federal funds interest rate)로 미국 연방기금 금리에 대한 자료와 'monthly industrial production(산업생산)의 연간 성장률' 데이터를 날짜를 기준으로 merge한 데이터 입니다.

 

 

스크린샷_2021-10-24_오후_12.31.53.png

 

fyff 데이터 일부

 

스크린샷_2021-11-17_오후_10.57.23.png

 

ip 데이터 일부

 

데이터 형식은 첫번째 칼럼은 일자가 나와있으며 두번째 칼럼은 미국의 금리와 산업생산 연간률 지수 입니다.

 

                                                                                                                                                            

 

더빈 h 검정

 

더빈의 h 검정은 설명변수에 확률변수(Random Variable)가 있을 경우에 DW d 검정은 할 수 없습니다. 그래서 대신 더빈의 h 검정(Durbin's h test)이 많이 사용되고 있습니다.

더빈의 h 검정은 다음과 같이 수행할 수 있습니다.

step 1. 아래 식 회귀모형의 계수들을 최소자승법을 사용하여 추정한 잔차 et 를 구한다.

 

 

 

스크린샷 2021-11-21 오후 11.33.19.png

 

 

여기서 Xt-4는 4달 전의 fyff(미국금리)에 대한 자료이고, Yt-1은 종속변수Yt 의 한달 전 값, 즉 ipg 1입니다.

종속변수 Yt는 항상 확률변수(Random Variable)이고따라서 Yt-1 도 확률변수가 됩니다.

그러므로, 위의 회귀식의 에러텀 ui 자기상관을 검정하기 위해 더빈-왓슨 d 검정은 사용할 수가 없습니다. 더빈-왓슨 d 검정은 '설명변수가 상수 값을 가진다.'라는 가정을 만족시켜야 하기 때문입니다.

그러므로, 위 회귀식 에러텀 ui에 대한 자기 상관을 검정하기 위해서는 더빈의 h 검정을 실시해야 합니다.

step 2. 계수들을 최소자승법으로 추정하고 나서 얻은 잔차(residual) et 를 사용하여 다음 회귀모형 식의 계수들을 최소자승법으로 추정합니다.

 

 

 

스크린샷 2021-11-21 오후 11.33.25.png

 

 

step 3. γ1(감마)의 최소자승법 추정치의 t value나 p value를 사용하여 귀무가설 γ1 = 0 을 검정합니다. 만약 귀무가설 γ1 = 0 이 기각되면 회귀모형의 에러텀 ut 에 자기상관이 없다는 귀무가설은 기각됩니다. γ1 = 0이 기각될 수 없다면 회귀모형의 에러텀 ut 에 자기상관이 없다는 귀무가설도 기각할 수 없습니다.

위에서 설명한 것과 같이 더빈의 h test는 회귀모형 2개를 최소자승법으로 추정하여 두 번째 회귀모형에 있는 계수 γ1이 0인지를 테스트하면 됩니다.

 

 

 

                                                                                                                                                                  

 

SAS CODE

 

위 식의 계수들을 추정하기 위해 필요한 SAS 프로그램은 아래와 같습니다.

 

data ip;
infile '/home/u45061472/ip.prn';
input mon ip;
logip = log(ip);
ipg = dif(logip)*1200;
ipg1 = lag(ipg);
if mon < 19590101 then delete;
run;


data fyff;
infile '/home/u45061472/fyff.prn';
input mon fyff;
fyff4 = lag(fyff);
if mon < 19590101 then delete;
run;

data all;
merge ip fyff;
by mon;
if mon < 20080101 then delete;
run;

proc reg data = all;
model ipg = fyff4 ipg1;
output OUT = out1 R = resid;
run;

data all;
set out1;
resid1 = lag(resid);
run;

proc reg data = all;
model resid = resid1 fyff ipg1;
run;

 

 

결과

 

결과는 아래와 같습니다.

 

image.png

 

 

위의 결과는 설명변수에 종속변수의 한달 이전 변수 ipgt-1이 있는 공식1 로, 금융위기 이후 데이터를 128개에 실행하여 얻은 결과 입니다.

fyff4 계수 추정치는 -1.71163이며 t value는 -1.68 입니다.

이 값들은 설명변수에 ipg1이 없고 fyff4만 있는 회귀모형에서 얻은 계수추정치 -2.90, t-value 3.61과 비교하면 절대값들이 줄었다는 것을 알 수 있습니다.

의미는 설명변수 ipg1이 fyff4의 ipg에 대흔 설명력을 떨어뜨리고 있다는 것을 알 수 있습니다.

즉, 종속변수의 한달 전 변수인 ipg1의 계수추정치는 0.30887 이고, t value는 3.65로 fyff4의 t-value 절대값보다 더 크다는 것을 알 수 있습니다. 이는 종속변수의 한달 전 변수가 fyff4 보다 ipg를 더 잘 설명하고 있다는 것을 의미합니다.

 

Version history
Last update:
‎11-21-2021 07:34 PM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags