안녕하세요. 이번 시간에는 단순선형회귀분석에 대하여 알아보겠습니다.
단순선형회귀(Simple Linear Regression)
단순히 두 변수간의 상관관계를 측정 하기보다는 한 변수와 다른 변수의 관계를 나타내는 함수를 얻고자 할 때가 있습니다. 이를 통해 한 변수의 값을 알 때 다른 변수의 값을 예측할 수 있습니다. 함수를 얻는 과정은 산점도에 관측된 데이터에 가장 잘 맞는 직선을 찾는 과정과 같습니다.
\
위와 같이 단순선형회귀 모델을 설정하고, 직선의 기울기와 절편 를 추정합니다.
아래의 절차에 따라 SASStudio에서 단순선형회귀분석을 수행할 수 있습니다.
<그림1>
<그림2>
<그림3>
선형회귀분석을 실행하면 우선, 그림 1의 분산분석표가 출력됩니다. y(종속변수)의 변동을 모형에 의한 변동과 오차항에 의한 변동으로 나누어서 설명합니다. 에 대한 F-test 결과를 보면 유의확률은 약 0.13으로 유의수준 0.05하에서 귀무가설을 기각하지 못하고 기울기가 0이 아니라는 증거가 없다고 결론지을 수 있습니다. 이는 앞서 진행했던 상관분석에서 수행한 가설검정과 동치입니다. 그림2의 R-square는 두 변수 사이의 상관계수에 제곱을 취한 값으로, 설명 변수가 종속변수의 변동을 얼만큼 설명하는지 알려주는 값입니다. 결과를 보면 R-square값은 0.0476으로 키 변수에 의해 설명되는 혈압 변수의 변동은 약 5%에 불과하다고 해석할 수 있습니다. 그림2의 두 번째 표에는 모형의 기울기와 절편의 추정값이 출력되어있습니다. 기울기에 대한 추정값은 약 0.21로 이는 키 1cm가 증가할 때 혈압이 약 0.21증가함을 의미합니다. 그림3에는 산점도와 추정한 회귀직선이 출력되어있습니다.
이번 시간에는 지난 시간에 상관분석을 수행한 데이터를 이용하여 단순선형회귀분석을 직접 수행하여보았습니다. 다음시간에는 단순선형회귀분석에 대해 더 자세하게 알아보겠습니다.
Reference
도서 - Essential Statistics Using SAS University Edition / Der, Geoff, Everitt, Brian S. / SASInstitute
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.