BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 변수 사용빈도

Started ‎01-29-2023 by
Modified ‎01-29-2023 by
Views 668

 

PROC MEANS Syntax를 사용해서 각 변수의 사용빈도를 알 수 있습니다.

 

image.png

 

 

사용할 데이터는 donor 라이브러리에 있는 donor_score_data를 사용하였습니다.

donor_score_data는 48개의 칼럼과 총 2,148개의 데이터로 구성되어 있습니다.

 

 

proc means data=donor.donor_score_data noprint nway;
class urbanicity;
output out = donor2 mean= cluster_code;
run;

proc print data = donor2;
run;

 

image (1).png

 

 

SAS에서는 PROC MEANS syntax를 이용해서 기초통계량 결과값을 출력할 수 있습니다. 

기초통계량은 관측값 수, 최솟값, 최댓값, 평균, 4분위수 등을 알 수 있습니다.

Urbanicity 변수는 6개의 level로 구성되어 있습니다.

PROC MEANS에서 CLASS 옵션을 사용하게 되면, 분류변수를 지정할 수 있으며 BY option 과 유사하지만, BY option 의 경우 sort가 되어있어야 합니다.

NOPRINT 옵션은 결과를 출력창으로 출력하지 않는다는 옵션으로, 출력창에 출력하지 않고, 데이터 셋을 통해 출력하는 경우 사용합니다. 

OUT = 옵션을 사용하여 해당 결과값은 donor2 데이터 셋으로 저장됩니다.

NWAY 옵션은 가장 높은 _TYPE_ 값을 가진 통계량만을 output으로 출력하는 옵션입니다.

 

결과값을 보면 _FREQ_ 변수가 자동으로 생성되었습니다.

이는 자동적으로 생성되는 것으로 분류하기로 한 변수의 수를 나타내는 것 입니다.

Version history
Last update:
‎01-29-2023 08:30 AM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags