BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 기초통계량 - PROC MEANS

Started ‎09-17-2023 by
Modified ‎09-17-2023 by
Views 2,391

SAS 프로그램은 Data-Step 과 Procedure-Step 으로 나뉜다.

Data-Step은 데이터셋의 생성 및 자료값의 변형 등 데이터에 대한 조작을 수행하고,

Procedure-Ste은 데이터셋에 대한 연산과 분석을 수행하고 분석된 결과를 출력하고 새로운 데이터셋을 생성하는 기능을을 합니다.

Procedure 단계에서 아래와 같은 일반적인 Syntax를 사용합니다.

PROC statement 를 사용하고, 호출하고자 하는 프로시저 이름과 분석에 필요한 SAS 데이터셋을 지정합니다.

 

 

PROC procedure-name DATA = data-set options;

 

 

 

 

■ 기초통계량

기초통계량은 데이터의 특성을 요약하고 설명하기 위해 통계적인 지표를 의비합니다.

기초통계량만으로도 데이터를 이해하고 데이터간의 패턴을 파악하거나 비교를 할 수 있습니다.

평균, 중앙값, 최빈값, 분산, 표준편차, 범위, 사분위수 등이 숫자형 변수의 기초통계량이고, 범주형 변수의 기초통계량의 경우에는 빈도수, 백분율, 상대 빈도 등을 통계량으로 요약할 수 있습니다.

■ 기초통계량 - PROC MEANS

PROC MEANS statement 는 숫자변수에 대한 일변량 기술통계량을(descriptive statistic) 출력합니다.

일변량 기술통계량은 단일 변수의(하나의 변수) 특성을 설명하는 통계적 기법입니다.

 

 

image.png

 

 

PROC MEANS statemt의 예시를 위해, SASUSER library 에 있는 HTWT 데이터를 사용합니다.

HTWT 데이터는 10명의 이름, 성별, 전공, 나이, 키, 몸무게 데이터 입니다.

 

 

proc means data=sasuser.htwt maxdec=3 mean std cv range;
class dept;
var age height weight;
title ' 전공별 일변량기술통계량';
run;

 

image.png

 

 

위의 PROC MEANS statement 예시에 대한 옵션 설명은 아래와 같습니다.

  • MASDEC: 결과에 대해 최대 소수점의 자릿수를 결정한다. 위의 예에서는 3자리까지 설정해서 결과값이 소수점 3자리수까지 출력되는 것을 확인할 수 있다.

  • MEAN(평균값), STD(표준편차), CV(변이계수), RANGE(범위)를 지정하듯이 지정한 명령어만을 출력할 수 있다. 지정된 명령어가 아니라 어떤 통계량도 지정하지 않으면 N(결측값이 아닌 개체 수), MEAN, STD, MIN, MAX 등이 출력된다.

  • CLASS: 변수의 자룟값에 대한 개별 통계량을 구하고자 하는 변수 지정

  • VAR: 분석에 사용할 숫자변수들을 지정한다. VAR statement 를 생략하게되면 데이터에 있는 모든 숫자변수에 대한 분석을 수행한다.

 

Version history
Last update:
‎09-17-2023 01:35 AM
Updated by:
Contributors

SAS Innovate 2025: Call for Content

Are you ready for the spotlight? We're accepting content ideas for SAS Innovate 2025 to be held May 6-9 in Orlando, FL. The call is open until September 25. Read more here about why you should contribute and what is in it for you!

Submit your idea!

Article Labels
Article Tags