BookmarkSubscribeRSS Feed

[BASE SAS기초] Producing Summary Reports(3)

Started ‎06-15-2020 by
Modified ‎06-15-2020 by
Views 387

[BASE SAS기초] Producing Summary Reports(3)

 

안녕하세요^^

오늘은 producing Summary Reports 세 번째 시간으로 PROC MEANS 프로시저에 대해 공부해보도록 하겠습니다.

​지난 자료에서는 PROC FREQ문을 사용하여 REPORT를 작성하는 방법과 TABLES문에서 사용하는 다양한 옵션들에 대해 알아보았습니다.​

PROC MEANS 프로시저는 요약통계량을 report하며, PROC FREQ문과 마찬가지로 OUT문 또는 OUTPUT OUT문을 사용하여 결과표를 데이터셋으로 만들 수 있습니다.

​또한 그룹 내의 모든 변수에 대한 기술통계량을 계산하여 report해줍니다​.

 

PROC MEANS DATA = SAS-data-set <statistic(s)><option(s)>;</option(s)></statistic(s)>

VAR analysis-variable(s);

CLASS classification-variable(s);​​

RUN;

 

 PROC MEANS 프로시저는 default로 모든 수치형 변수에 대해 결축값이 아닌 관측치의 개수, 평균, 표준편차, 최소값, 최대값을 report해줍니다.

 

 

p106_1.png

 

VAR 문장은 PROC MEANS의 분석 변수와 분석 순서를 결정짓습니다.

 

p106_2.png

 

위의 코드에서 분석변수로 black과 boy를 지정해주었고,

​코딩된 순서가 black, boy 순이므로 작성된 report에서도 black, boy순으로 요약 통계량이 정리된 것을 확인하실 수 있습니다.

또한 CLASS문에서는 분석 변수의 subgroup을 정의할 수 있습니다.

 

p106_3.png

 

분석변수인 black의 subgroup으로 visit를 지정하여 visit의 값에 따른 분석변수의 요약통계량 값을 report해줍니다.

또한,​

 

p106_4.png

 

class문에 여러 개의 변수를 지정하여 subgroup을 더 세부적으로 나눌 수 있습니다.

PROC MEANS 프로시저문에 특정한 통계량 값을 지정할 수 있습니다.

 

p106_5.png

 

PROC MEANS 프로시저에 sum, mean, range 옵션을 지정하여 결과표에 합계, 평균, 레이블(범위)이 지정된 것을 확인하실 수 있습니다.

PROC MEANS의 옵션은 아래의 표에 기록된 것처럼 다양하게 존재합니다.

 

p106_6.png

 

PROC MEANS의 또 다른 옵션으로는 MAXDEC= , FW= , NONOBS가 있습니다.

 

MAXDEC는 보여지는 통계량 값의 소수점 자리수를 결정짓습니다​.

 

p106_7.png

 

예를들어, maxdec 옵션을 사용하여 2자리 소수점을 지정해 주면, report에는 소수점 둘째 자리까지 작성되는 것을 확인하실 수 있습니다.

FW= 옵션은 통계량을 보여주는 표의 너비를 조절해주는 옵션입니다.

 

p106_8.png

 

예를들어, FW옵션을 사용하여 숫자 10을 지정해주었다면, 너비가 10이 되며, 앞서 MAXDEC옵션을 사용했을 때와 비교해서 더 많은 소수점 자리수를 report한 것을 확인하실 수 있습니다.

​이는 표의 너비 10에 해당하는 결과입니다.

NONOBS옵션은 관측치수를 제거하는 옵션입니다.

 

p106_9.png

 

예를들어, 위의 요약통계량을 nonobs옵션을 사용하여 표로 작성한다면, 관측치 수가 제외된 표를 얻으실 수 있습니다.

PROC MEANS문에서는 PROC FREQ문과 마찬가지로 OUTPUT OUT문장을 이용하여 결과를 데이터 셋으로 내보낼 수 있습니다.

​이 때, 자동으로 _TYPE_과 _FREQ_ 변수가 생성됩니다​.

 

OUTPUT OUT=SAS-data-set ;

 

 Output out 문장은 위의 form으로 작성할 수 있습니다.

 

p106_10.png

 

위의 코딩에서 proc means 문장에 쓰인 sum, mean, range는 데이터셋으로 만들어지는 것이 아니고 report에만 작성됩니다.

Output out을 사용하여 만들어지는 데이터셋은 default 값으로 N, MIN, MAX, MEAN, STD 통계량이 만들어집니다.

하지만,

 

p106_11.png

 

Output out 문장 뒤에 작성하는 특정한 통계량은 새로 생성되는 데이터 셋에 만들어집니다.

​위의 예에서 output out 문장 뒤에 min, max, sum, mean 통계량을 작성하였기 때문에,

새로 생성되는 bweight_w 데이터 셋에 min, max, sum, mean이 각각 minblack, maxblack, sumblack, meanblack의 변수명으로 작성됩니다.

​​

이상 PROC MEANS 프로시저와 옵션들에 대해 알아보았습니다.

다음 시간에는 PROC TABULATE 문장에 대해 공부하도록 하겠습니다.

읽어주셔서 감사합니다^^

Version history
Last update:
‎06-15-2020 10:14 PM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags