R Square는 결정계수로 회귀 분석에 사용하는 수치로 회귀 모델의 성능에 대한 평가 지표를 의미합니다.
회귀 모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지 보여주는 지표입니다.
결정계수가 높을수록 독립변수가 종속 변수를 잘 설명한다라는 의미입니다.
sashelp 라이브러리에 있는 class 데이터를 사용해서 Simple Linear Regression 예시로 최적의 직선을 찾으려고 합니다.
몸무게(weight)와 키(Height)를 사용해 단순 선형 회귀 분석을 수행합니다.
proc reg data=sashelp.class;
model Weight = Height;
run;
quit;
종속변수 Weight와 독립변수 Height를 사용하여 회귀 모델을 추정합니다.
즉, 키에 따른 몸무게 변화를 예측하는 선형식을 예측합니다.
회귀계수(Parameter Estimates)를 통해 추정한 회귀식은 다음과 같습니다.
위 식은 키가 1증가할 때 마다 몸무게가 3.90 증가한다라는 것을 의미합니다.
결정계수(R Square)값은 0.7705로, 이는 모델이 데이터 변동을 77.05% 설명한다라는 의미입니다.
1에 가까울수록 모델이 데이터를 잘 설명하는 것으로 해당 모델은 높은 설명력을 가진다라고 할 수 있습니다.
April 27 – 30 | Gaylord Texan | Grapevine, Texas
Walk in ready to learn. Walk out ready to deliver. This is the data and AI conference you can't afford to miss.
Register now and save with the early bird rate—just $795!