SAS Tech & Tip

BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 상관분석 part1

Started ‎12-11-2022 by
Modified ‎12-11-2022 by
Views 369

 

상관분석은 부모와 자식 간의 키의 관계, 백화점 판매수익과 기온의 관계, 게임시간과 수익의 관계 등 '한쪽이 증가하면 다른 한쪽은 감소한다' 또는 '한쪽이 증가하면 다른 쪽도 증가한다.' 와 같은 직선적인 관계를 상관이라고 합니다.

상관계수(coefficient of correlation)는 변수간 선형적인 관계 정도를 측정하는 통계량으로 두 변수 간의 관련성 또는 상관이 얼마나 강한지를 나타내는 지표입니다.

상관분석 전에 시각적 도구로 산점도를 통해서 변수들 간의 관계성을 보여줄 수도 있습니다.

 

상관계수는 아래와 같은 특성을 가지고 있습니다.

 

  • -1 ≤ 상관계수 (ρ) ≤ 1

  • 양의 상관: 0보다 큰 값으로 양수의 값을 가지며 '한쪽이 증가하면 다른 쪽이 증가한다.' 또는 '한쪽이 감소하면 다른 쪽도 감소한다.' 라고 할 수 있습니다. 산포도상의 점은 오른쪽 위에 분포한다.

  • 음의 상관: 0보다 작은 값을 가지며 '한쪽이 증가하면 다른 쪽은 감소한다.' 또는 '한쪽이 감소하면 다른 쪽은 증가한다.'라고 할 수 있습니다. 산포도상의 점은 오른쪽 아라에 분포한다.

  • 상관이 존재하지 않는다. : 선형적인 관계가 존재하지 않을수록 0에 가깝다.

  • 양 극단 값: 선형적인 관계가 매우 높다.

 

 

상관분석은 이상치에 크게 영향을 받기때문에 숫자만을 보고 변수간의 관계를 판단하는 것은 위험할 수 있습니다.

그래서 상관계수 이전에 산점도를 통해 시각적으로 판단해 데이터에 대한 추세를 확인해야 합니다.

 

 

 

  • SAS 옵션

 

SAS Studion 에서 상관분석 옵션에 대해 설명하겠습니다.

 

image.png

 

 

 

* 분석변수(Analysis variables): 필수로 넣어야되는 변수 중 하나로 이 변수에 대해 상관계수가 생성된다.

* 상관 대상(Correlate with): 필수로 넣어야 되는 변수로 분석변수와 상관 분석을 하게 된다. 상관 대상에 변수를 집어 넣지 않으면 분석변수간의 상관분석이 진행된다.

 

 

image (1).png

 

 

 

* 빈도 수: 필수 옵션은 아니지만 변수가 할당되면 관측치 1개가 n(관측치에 대한 빈도)개의 관측치를 나타낸다.

* 가중: 각 행의 값이 곱적률 상관계수(product moment correlation coefficients)의 계산에 사용된다.

*그룹 분석 변수: 할당된 변수를 기준으로 테이블이 정렬되고, 상관 테이블이 생성된다. 하나 이상의 변수를 지정할 수 있다. 

Version history
Last update:
‎12-11-2022 07:46 AM
Updated by:
Contributors

sas-innovate-white.png

Our biggest data and AI event of the year.

Don’t miss the livestream kicking off May 7. It’s free. It’s easy. And it’s the best seat in the house.

Join us virtually with our complimentary SAS Innovate Digital Pass. Watch live or on-demand in multiple languages, with translations available to help you get the most out of every session.

 

Register now!

Article Labels
Article Tags