proc 명령어는 procedure로 미리 정의된 명령어를 절차에 맞게 실행해주는 명령어입니다.
'PROC' 뒤에 사용할 SAS 기능명을 붙여서 사용할 수 있습니다.
출력데이터에서 변수가 한글로 나와있는 경우 컬럼 레이블로 되어 있는 경우이고, 실제 변수는
'컬럼 이름(변수명)'으로 되어있습니다.
데이터 셋을 단순 출력할 수 있습니다.
proc print data = 라이브러리.데이터셋;
var 변수명 변수명;
run;
proc print data = work.subject_test1_1;
run;
proc print data = work.subject_test1_1;
var name subject;
run;
var을 사용하여 실제 데이터에서 보고 싶은 데이터만 출력할 수 있습니다.
연속형 숫자형 변수들에 대한 평균, 표주편차, 최댓값, 최솟값을 표시하는 방법입니다.
proc means data = 라이브러리.데이터셋;
var 변수명 /* 통계량이 알고싶은 변수*/
by 변수명 /*변수별 정렬 통계*/
class 변수명 /*정렬할 필요 없고 변수별 통계*/
run;
명시하지 않은 경우 모든 수치에 대해 기초통계량을 구합니다.
proc means data = work.subject_test1_1;
run;
proc means data = work.subject_test1_1;
var score;
run;
새로운 기초 통계량을 위해 새로운 'subject_score' Table을 선언합니다.
data work.subject_score;
input id name $9. one two three;
datalines;
1 이호준 92 81 32
2 이효중 80 95 91
3 이길동 90 42 42
4 이준호 86 71 41
;
run;
proc print data = work.subject_score;
run;
proc means data=work.subject_score;
var one;
by id;
run;
proc means data = work.subject_test1_1;
var score;
class name;
run;
데이터셋에 관한 상세한 정보를 보여줍니다. 보통 데이터를 가공하기 전에 변수들이 어떤 것이 있는지 확인할 경우 사용합니다.
by에서 정해준 변수를 기준으로 정렬해줍니다.
proc sort data = 라이브러리.데이터셋;
by 변수;
run;
proc print에서 그룹을 설정하는 경우 By 구분은 오름차순 순서대로 정렬돼 있어야 합니다.
그렇지 않을 경우 에러가 발생합니다.
Descending : 내림차순으로 정렬을 해줍니다.
proc sort data = work.subject_score;
by descending id;
run;
proc print data = work.subject_score;
run;
freq문 : 빈도 조회를 해줍니다.
- 분할표를 그려줍니다.
- 빈도, 백분울, 누적빈도, 누적백분율을 보여줍니다.
table : 알고 싶은 변수를 분석해줍니다.
proc freq data = work.subject_test1_1;
table class_;
run;
table 변수명 * 변수명은 2차원 분할표가 나옵니다.
proc freq data = work.subject_test1_1;
table class_*subject;
run;
평균, 중앙값, 표준편차, 최대값, 최소값, 사분위수, 백분위수 등에 대한 기초통계량을 나타냅니다.
알고 싶은 변수들의 통계량을 전부 출력해줍니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.