안녕하세요.
MYSAS 홍보대사 최준입니다.
학계의 교수님과 학생들의 간편한 SAS 사용을 위하여 SAS University Edition 무료 소프트웨어가 출시되었습니다.
SAS University Edition은 직관적인 UI 환경이기 때문에 쉽게 사용할 수 있지만,
아직까지 많은 홍보가 되지는 않은 것 같습니다.
그래서 제가 미흡하지만, SAS University Edition 사용법, 및 기능에 대해서 연재해보고 있습니다.
이번에는 SAS University를 이용하여 회귀분석 하는 방법에 대해서 살펴보겠습니다.
작업 -> 통계량 -> 선형회귀를 드래그 한 후에
데이터 : SASHELP.CARS / 종속 변수 : Horsepower / 설명 변수 : EngineSize
로 설정하면 다음과 같은 코드가 형성됨을 확인할 수 있습니다.
옵션탭으로 들어가 보면 회귀분석에서 적용할 수 있는 다양한 옵션이 있습니다.
보다 쉽게 오차에 대한 가정이 독립성을 만족하는지 확인하기 위해서
"자기상관 : Durbin-Watson 통계량" 을 체크해보았습니다.
코드를 실행해보면 다음과 같은 결과가 나옵니다.
유의수준 a를 0.05로 기준 설정 한 후에 결과를 해석해본다면,
모델의 유의확률이 <0.001로 유의수준 0.05보다 작기 때문에 회귀모형 전체가 유의함을 알 수 있습니다.
마찬가지로 절편(Intercept)과 독립 변수(EngineSize) 또한 유의함을 확인할 수 있습니다.
하지만 R-square 값이 약 60% 밖에 안되기 때문에 모형의 설명력은 조금 아쉽습니다.
Durbin-Watson 값이 1.012로 자기상관관계가 있음을 의심해 볼 수 있습니다.
그 외에도 진단 도표를 통해서 선형성, 정규성, 등분산성, 영향점과 같은 정보도 확인할 수 있습니다.
모델의 설명력이 약 60%로 아쉽기 때문에 변수를 하나 더 추가해보겠습니다.
설명 변수에 invoice 변수를 추가해 보았습니다. 그 결과 오른편 코드에 Invoice 변수가 추가되었음을 확인할 수 있습니다.
방법탭에 들어가 보면 변수 선택에 대한 옵션도 있음을 확인할 수 있습니다.
지금은 독립 변수를 2개밖에 설정안했기 때문에 따로 옵션 지정을 하지는 않겠습니다.
코드를 실행해보면 다음과 같은 결과가 나옵니다.
유의수준 a를 0.05로 기준 설정 한 후에 결과를 해석해본다면,
모델의 유의확률이 <0.001로 유의수준 0.05보다 작기 때문에 회귀모형 전체가 유의함을 알 수 있습니다.
마찬가지로 절편(Intercept)과 독립 변수(EngineSize, Invoice)들 또한 유의함을 확인할 수 있습니다.
R-square 값 또한 62%에서 83%로 모형의 설명력이 상승했음을 확인할 수 있습니다.
지금까지 회귀분석에 대해서 살펴보았습니다.
기타 궁금하신 점이 있으시다면
언제든지 저에게 쪽지 or 댓글로 문의해주시면 친절하게 답변해드리겠습니다.
감사합니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.