BookmarkSubscribeRSS Feed

[SAS 프로그래밍] PROC FREQ 결과 표현하기 (2)

Started ‎06-17-2020 by
Modified ‎06-17-2020 by
Views 244

 

[SAS 프로그래밍] PROC FREQ 결과 표현하기 (2)

 

 

안녕하세요^^

 

이번시간에는 SAS의 PROC FREQ 프로시저를 사용한 빈도표를 이용한 dot plot을 그려보로독 하겠습니다.

또한 PROC FREQ 프로시저를 사용하여 적합도 검정을 시행하고, plot을 그려보도록 하겠습니다.

 

 

▶ PROC FREQ 프로시저 사용하여 DOT PLOT 그리기

 앞서 사용한 예제 데이터에 대한 dot plot을 그려보도록 하겠습니다.

 

 

다운로드 - 2020-06-18T102440.729.png

 

▷ coding

Dot plot은 모든 빈도 또는 교차분석 테이블을 출력하는 tables 문장에 옵션으로 사용할 수 있습니다.

PLOTS 옵션을 사용하여 plot의 방향(세로 또는 가로), 크기, 레이아웃을 지정할 수 있습니다.

특히 TYPE= DOTPLOT 옵션은 dot plot을 지정하며, plot을 생성하기 전에 ods graphics를 활성화해야 합니다.

SCALE = PERCENT 옵션은 빈도 수 대신 백분율을 표시하는 옵션입니다.

SCALE = LOG 및 SQRT 옵션을 사용할 수 있는데, 이는 로그 빈도와 제곱근을 각각 그릴 수 있습니다.

 

▷ One-way frequency dot plot

 

다운로드 - 2020-06-18T102441.626.png

 

다운로드 - 2020-06-18T102442.505.png

 

▷ Two-way frequency dot plot (EYES와 HAIR)

 

다운로드 - 2020-06-18T102443.634.png

 

다운로드 - 2020-06-18T102445.042.png

 

다운로드 - 2020-06-18T102445.937.png

 

▷ Two-way frequency dot plot (REGION과 HAIR)

 

다운로드 - 2020-06-18T102447.122.png

 

다운로드 - 2020-06-18T102448.098.png

 

다운로드 - 2020-06-18T102449.290.png

 

▶ PROC FREQ 프로시저 사용하여 적합도 검정하기

 위의 예제 데이터에 대한 적합도 검정 및 PLOT을 그려보도록 하겠습니다.

 

다운로드 - 2020-06-18T102450.521.png

 

 

▷ coding

두 개의 지역(region)에 대해 아동의 머리색이 지정된 다항분포를 갖는지 알아보기 위해 가설검정을 시행합니다.

가정된 분포는 30%의 fair, 12%의 red, 30%의 medium, 25%의 dark, 3%의 black입니다..

각 지역에 대한 가설을 검정하기 위해 데이터셋은 먼저 지역별로 정렬합니다.

그런 다음 PROC FREQ 프로시저를 사용하여 BY REGION에 대해 별도의 결과 테이블을 생성합니다.

 

CHISQ 옵션은 HAIR의 빈도 테이블에 대해 카이제곱 적합도 검정을 시행합니다.

TESTP = 옵션은 카이제곱 검정에 대한 가설의 백분율을 지정하며, 해당 변수 수준이 빈도 테이블에 나타나는 순서와 같은 순서로 지정합니다.

PLOTS = 옵션은 카이제곱 검정과 관련된 편차(deviation) plot을 그립니다.

 

 

다운로드 - 2020-06-18T102451.754.png

 

다운로드 - 2020-06-18T102453.025.png

 

▷ 결과

가설의 상대 편차를 보여주는 지역 1의 deviation plot을 보여줍니다.

수준의 상대 편차는 관찰된 값과 가설의 백분율을 테스트 백분율로 나눈 값의 차이입니다.

 

다운로드 - 2020-06-18T102454.545.png

 

다운로드 - 2020-06-18T102455.658.png

 

 

▷ 결과

가설의 상대 편차를 보여주는 지역 2의 deviation plot을 보여줍니다.

카이제곱 통계는 지역 2에 대해서는 0.05 수준에서 유의하지만, 지역 1에 대해서는 유의하지 않습니다.

즉, 이는 지역 2는 가정된 백분율과 유의미한 차이가 있음을 나타냅니다.

 

 

 

 

이상으로 SAS의 PROC FREQ 프로시저를 사용한 빈도표를 이용한 dot plot을 그려보고,

​적합도 검정을 시행하고, 적합도 검정의 plot을 그려보았습니다.

 

감사합니다^^

 

 

[reference]

https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_freq_sect02...

https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_freq_sect02...

 

 

 

 

Version history
Last update:
‎06-17-2020 10:35 PM
Updated by:
Contributors

sas-innovate-white.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.

 

Early bird rate extended! Save $200 when you sign up by March 31.

Register now!

Article Labels
Article Tags