R Square는 결정계수로 회귀 분석에 사용하는 수치로 회귀 모델의 성능에 대한 평가 지표를 의미합니다.
회귀 모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지 보여주는 지표입니다.
결정계수가 높을수록 독립변수가 종속 변수를 잘 설명한다라는 의미입니다.
sashelp 라이브러리에 있는 class 데이터를 사용해서 Simple Linear Regression 예시로 최적의 직선을 찾으려고 합니다.
몸무게(weight)와 키(Height)를 사용해 단순 선형 회귀 분석을 수행합니다.
proc reg data=sashelp.class;
model Weight = Height;
run;
quit;
종속변수 Weight와 독립변수 Height를 사용하여 회귀 모델을 추정합니다.
즉, 키에 따른 몸무게 변화를 예측하는 선형식을 예측합니다.
회귀계수(Parameter Estimates)를 통해 추정한 회귀식은 다음과 같습니다.
위 식은 키가 1증가할 때 마다 몸무게가 3.90 증가한다라는 것을 의미합니다.
결정계수(R Square)값은 0.7705로, 이는 모델이 데이터 변동을 77.05% 설명한다라는 의미입니다.
1에 가까울수록 모델이 데이터를 잘 설명하는 것으로 해당 모델은 높은 설명력을 가진다라고 할 수 있습니다.
Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.