BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 변수 사용빈도

Started ‎01-29-2023 by
Modified ‎01-29-2023 by
Views 769

 

PROC MEANS Syntax를 사용해서 각 변수의 사용빈도를 알 수 있습니다.

 

image.png

 

 

사용할 데이터는 donor 라이브러리에 있는 donor_score_data를 사용하였습니다.

donor_score_data는 48개의 칼럼과 총 2,148개의 데이터로 구성되어 있습니다.

 

 

proc means data=donor.donor_score_data noprint nway;
class urbanicity;
output out = donor2 mean= cluster_code;
run;

proc print data = donor2;
run;

 

image (1).png

 

 

SAS에서는 PROC MEANS syntax를 이용해서 기초통계량 결과값을 출력할 수 있습니다. 

기초통계량은 관측값 수, 최솟값, 최댓값, 평균, 4분위수 등을 알 수 있습니다.

Urbanicity 변수는 6개의 level로 구성되어 있습니다.

PROC MEANS에서 CLASS 옵션을 사용하게 되면, 분류변수를 지정할 수 있으며 BY option 과 유사하지만, BY option 의 경우 sort가 되어있어야 합니다.

NOPRINT 옵션은 결과를 출력창으로 출력하지 않는다는 옵션으로, 출력창에 출력하지 않고, 데이터 셋을 통해 출력하는 경우 사용합니다. 

OUT = 옵션을 사용하여 해당 결과값은 donor2 데이터 셋으로 저장됩니다.

NWAY 옵션은 가장 높은 _TYPE_ 값을 가진 통계량만을 output으로 출력하는 옵션입니다.

 

결과값을 보면 _FREQ_ 변수가 자동으로 생성되었습니다.

이는 자동적으로 생성되는 것으로 분류하기로 한 변수의 수를 나타내는 것 입니다.

Version history
Last update:
‎01-29-2023 08:30 AM
Updated by:
Contributors

hackathon24-white-horiz.png

The 2025 SAS Hackathon Kicks Off on June 11!

Watch the live Hackathon Kickoff to get all the essential information about the SAS Hackathon—including how to join, how to participate, and expert tips for success.

YouTube LinkedIn

Article Labels
Article Tags