PROC MEANS를 통해서 기초통계량을 확인하고 데이터의 전반적인 특성을 확인할 수 있습니다.
data class_data;
input name $ gender $ age course major $;
datalines;
Janny M 58 101 STAT
Amy F 28 101 HIST
Liz F 27 301 STAT
Jhon M 68 301 ENGG
Peter M 54 201 STAT
James M 35 101 HIST
Thomas M 34 301 ENGG
Pat F 23 201 STAT
Liz F 45 101 HIST
Tom M 56 301 ENGG
;
run;
class_data 라는 데이터셋은 총 10명의 학생 데이터가 포함되어 있으며 이름, 성별, 나이, 과목, 전공 정보가 있습니다.
■ PROC MEANS
수치형 변수의 기초 통계량을 계산하는 프로시저로, 별도의 옵션을 지정하지 않으면 기본 통계값들이 자동 출력됩니다.
기본 통계량은 N(관측치 개수), MEAN(평균), MIN(최솟값), MAX(최대값), Std Dev(표준편차) 값입니다.
proc means data = class_data;
var age;
run;
■ 출력할 통계량 지정
proc means data = class_data n min max;
var age;
run;
PROC MEANS 는 수치형 변수의 다양한 통계값을 계산하는 statement 입니다.
data = class_data: 분석할 데이터셋을 지정
출력할 통계량을 지정
N: 데이터 개수
MIN: 최솟값
MAX: 최댓값
VAR age : 분석 대상 변수를 지정
■ 그룹별 통계
PROC MEANS 에서 CLASS syntax로 그룹별로 나눠서 기초통계량을 확인할 수 있습니다.
'성별에 따라 나이가 어떻게 다른가?'를 확인하기 위해서 CLASS gender Syntax로 남자, 여자 각각의 평균 나이를 확인할 수 있습니다.
proc means data=class_data;
class gender;
var age;
run;
proc means data=class_data;
class gender major;
var age;
run;
여러 변수로 동시에 그룹을 나눌 수도 있습니다.
성별과 전공별로 평균 나이를 계산한 코드입니다.
Dive into keynotes, announcements and breakthroughs on demand.
Explore Now →