BookmarkSubscribeRSS Feed

[ SAS 활용 노하우 ] PROC / PRINT / MEANS / CONTENTS / FREQ / UNIVARIATE

Started ‎06-20-2021 by
Modified ‎06-20-2021 by
Views 2,633

 

 

1. PROC

proc 명령어는 procedure로 미리 정의된 명령어를 절차에 맞게 실행해주는 명령어입니다.

'PROC' 뒤에 사용할 SAS 기능명을 붙여서 사용할 수 있습니다.

출력데이터에서 변수가 한글로 나와있는 경우 컬럼 레이블로 되어 있는 경우이고, 실제 변수는

'컬럼 이름(변수명)'으로 되어있습니다.

 

 

2. PRINT

데이터 셋을 단순 출력할 수 있습니다.

proc print data = 라이브러리.데이터셋;

var 변수명 변수명;

run;

proc print data = work.subject_test1_1;
run;

1.png

 

 

proc print data = work.subject_test1_1;
var name subject;
run;

 

2.png

 

var을 사용하여 실제 데이터에서 보고 싶은 데이터만 출력할 수 있습니다.

 

3. MEANS(기초통계량)

연속형 숫자형 변수들에 대한 평균, 표주편차, 최댓값, 최솟값을 표시하는 방법입니다.

proc means data = 라이브러리.데이터셋;

var 변수명 /* 통계량이 알고싶은 변수*/

by 변수명 /*변수별 정렬 통계*/

class 변수명 /*정렬할 필요 없고 변수별 통계*/

run;

명시하지 않은 경우 모든 수치에 대해 기초통계량을 구합니다.

 

proc means data = work.subject_test1_1;
run;

3.png

 

 

 

proc means data = work.subject_test1_1;
var score;
run;

 

4.png

 

 

4. By, Class

새로운 기초 통계량을 위해 새로운 'subject_score' Table을 선언합니다.

 

 

data work.subject_score;
input id name $9. one two three;
datalines;
1 이호준 92 81 32
2 이효중 80 95 91
3 이길동 90 42 42
4 이준호 86 71 41
;
run;

​

proc print data = work.subject_score;
run;

 

BY
 
proc means data=work.subject_score;
var one;
by id;
run;
5.png
 
 
 
- CLASS
 
proc means data = work.subject_test1_1;
var score;
class name;
run;
 
6.png
 
 

5. CONTENTS

데이터셋에 관한 상세한 정보를 보여줍니다. 보통 데이터를 가공하기 전에 변수들이 어떤 것이 있는지 확인할 경우 사용합니다.

 
7.png
 
 

 

6. SORT

 

by에서 정해준 변수를 기준으로 정렬해줍니다.

proc sort data = 라이브러리.데이터셋;

by 변수;

run;

proc print에서 그룹을 설정하는 경우 By 구분은 오름차순 순서대로 정렬돼 있어야 합니다.

그렇지 않을 경우 에러가 발생합니다.

Descending : 내림차순으로 정렬을 해줍니다.

 

 

proc sort data = work.subject_score;
by descending id;
run;

proc print data = work.subject_score;
run;

 

8.png

 
 

7. FREQ

freq문 : 빈도 조회를 해줍니다.

- 분할표를 그려줍니다.

- 빈도, 백분울, 누적빈도, 누적백분율을 보여줍니다.

table : 알고 싶은 변수를 분석해줍니다.

 

9.png

 

 

proc freq data = work.subject_test1_1;
table class_;
run;

 

table 변수명 * 변수명은 2차원 분할표가 나옵니다.

 

proc freq data = work.subject_test1_1;
table class_*subject;
run;

10.png

 

 

 

8. UNIVARIATE

평균, 중앙값, 표준편차, 최대값, 최소값, 사분위수, 백분위수 등에 대한 기초통계량을 나타냅니다.

알고 싶은 변수들의 통계량을 전부 출력해줍니다.

 

11.png

Version history
Last update:
‎06-20-2021 11:01 AM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags