상관계수는 continuous variable(ex: 키, 온도) 간의 선형 관계 정도를 검정하는 분석 방법입니다.
자주 사용하는 상관관계는 피어슨 상관계수와 스피어만 상관계수가 있다.
공분산은 두 변수의 개별 관측값들이 평균들로부터 얼마나 떨어져 있는지를 나타내는지를 의미하는데 공분산을 표준화한 값이 상관계수입니다.
피어슨 상관계수는 선형 상관 관계이지만 스피아만 상관계수는 두 변수가 선형적인 관계를 갖지 않아도 되서 더 자주 사용됩니다.
귀무가설: 상관계수는 0이다. (=상관 관계가 없다.)
대립가설: 상관계수는 0이 아니다. (-상관 관계가 있다.)
스피어만 상관계수를 알아보기 위해 사용한 데이터는 sashelp 라이브러리에 있는 BWEIGHT 데이터를 활용합니다.
해당 데이터는 신생아들의 몸무게 데이터와 관련된 변수들로 구성되어 있습니다.
proc corr data=sashelp.bweight spearman rank;
run;
두 변수의 상관 관계를 수치화한 결과입니다.
결과값은 -1 ~ 1 사이의 값을 가지며 양의 상관 관계가 있을수록 1에 가깝고 음의 상관 관계가 있을수록 -1에 가깝습니다.
Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.