BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 왜도와 첨도

Started ‎03-26-2023 by
Modified ‎03-26-2023 by
Views 1,369

분포의 형태를 왜도(skewness) 와 첨도(kurosis)를 통해서 알 수 있습니다. 

■ 왜도

왜도는 비대칭성을 나타내는 지표입니다. 

정규분포의 경우 좌우가 대칭을 이루지만 그렇지 않은 분포도 많습니다.

오른쪽 꼬리가 긴 경우 (왼쪽으로 치우쳐 있는 정도), 왼쪽 꼬리가 긴 경우(오른쪽으로 치우쳐 있는 정도), 분포가 좌우로 치우친 정도(비대칭도)를 나타내는 지표가 왜도이다.

 

image (15).png

 

 

참조: https://dining-developer.tistory.com/17

왜도의 계산식은 아래와 같습니다. n은 데이터의 수, s는 표준편차입니다.

 

image (16).png

 

 

 

 

 

 

 

■ 첨도

첨도란 분포의 뾰족한 정도를 나타내는 지표이다. 

첨도가 양인 경우 정규분포와 비교했을 때, 정점의 뾰족한 부분이 가늘고 얇습니다.

첨도가 음인 경우 분산이 완만하게 커지는 경향이 있습니다. 

첨도의 식은 아래와 같습니다. 

왜도 식을 4제곱으로 바꾸고 3을 빼기만 하면 됩니다.

 

image (17).png

 

 

 

 

 

 

왜도가 첨도가 0에서 크게 벗어난 경우 값이 극단적으로 크거나 작은 수치 등 이상치가 있을 경우가 높습니다.

 

 

proc univariate data=air.scoredata;
var gpa avg_income;
histogram gpa avg_income/ normal(mu=est sigma=est);
run;

 

Proc Univariate Statement 를 통해서 첨도와 왜도의 값을 알 수 있습니다.

 

 

 image (18).pngimage (19).png

 

 

Air라이브러리의 Scoredata 데이터의 왜도를 보면 -0.9로 왜도가 음의 나타낸다.

히스토그램을 보면 분포의 뾰족한 정도가 오른쪽으로 치우쳐있고 꼬리는 왼쪽으로 기울어진 형태를 확인할 수 있습니다.

 

 

image (20).png

 

image (21).png

 

 

Avg_Income 변수의 첨도값을 보면 0.6 의 값을 가진다. 

해당 값은 정규분포보가 급격히 작아지는 경향이 있습니다.

 

 

Version history
Last update:
‎03-26-2023 06:07 AM
Updated by:
Contributors

sas-innovate-white.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.

 

Early bird rate extended! Save $200 when you sign up by March 31.

Register now!

Article Labels
Article Tags