이전 게시글을 통해서 선형회귀에 대한 개념에 대해서 알아보았습니다 .
이번 게시글은 회귀 중 단순선형회귀에 대해서 알아보겠습니다.
■ 단순선형 회귀(Simple Linear Regression)
설명변수가 하나인 회귀식은 단순회귀식이라고 합니다.
proc reg data = data-set;
model 종속변수=독립변수;
plot 종속변수*독립변수;
run;
회귀계수를 추정하기 위해서는 위의 statement 를 활용합니다.
이번에는 sashelp의 shoes 데이터를 활용해 단순성형회귀분석에 대해서 알아보겠습니다 .
proc reg data = sashelp.shoes;
model sales=stores;
plot sales*stores;
run;
Number of Observarions Read와 Number of Observations Used 는 읽어들인 데이터와 분석에 사용한 데이터의 수가 395개로 같다는 것을 의미합니다.
이는 단순회귀분석에서 사용했던 두 변수가 모두 결측값이 존재하지 않는다는 것을 의미합니다.
위의 Analysis of Variance(=분산분석표)에는 SST (=관측된 데이터에 총 변동), SSR(=회귀모형에 의해 설명되는 변동), SSE(= 회귀모형에 의해 설명되지 않는 변동)를 확인할 수 있습니다.
여기서 F값은 아래의 귀무가설과 대립가설에 대한 유의확률을 나타냅니다.
귀무가설: 모든 회귀계수가 0이다.
대립가설: 모든 회귀계수가 0이 아니다.
유의확률이 <0.0001이 유의수준 0.05보다 작기 때문에 귀무가설을 기각합니다.
결론은 적어도 하나의 회귀계수는 0이 아니다라고 할 수 있으며 Stores는 Sales의 변동성을 통계적으로 유의미하게 설명하고 있습니다.
R-Square는 결정계수로 설명변수가 종속변수의 변동석을 얼마나 많이 설명하고 있는지를 나타내는 척도입니다 .
결정계수가 0.1796은 설명변수가 종속변수의 변동성을 17.96% 설명한다는 의미입니다.
Parameter Estimates는 추정된 회귀계수에 대해 '회귀계수는 0이다'라는 귀무가설을 검정할 수 있습니다.
유의확률이 0.1543으로 0.05보다 크기 때문에 회귀계수에는 통계적으로 유의하지 않습니다 .
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Lock in the best rate now before the price increases on April 1.