SAS 실전 활용 가이드 1
- Article History
- RSS Feed
- Mark as New
- Mark as Read
- Bookmark
- Subscribe
- Printer Friendly Page
- Report Inappropriate Content
이번 글은 실무에서 활용할 수 있는 다앙한 SAS 문법과 로직을 소개할 예정입니다.
SAS를 처음 접하는 분들부터 실무에서 활용하고 싶은 분들까지 도움이 되는 내용을 공유하겠습니다!
■ PROC PRINT statement 로 상세한 보고서 만들기
STEP1. 데이터셋 가져오기: SAS IMPORT 활용
PROC IMPORT
DATAFILE='C:/sales.xlsx'
DBMS=XLSX
REPLACE
OUT=WORK.IMPORT;
GETNAMES=YES;
RUN;
-
PROC IMPORT : 외부의 데이터를 가져오는 statement 입니다.
-
DATAFILE = : 불러올 데이터 파일의 경로를 지정합니다.
-
DBMS = : 불러올 데이터의 파일 형식을 지정합니다. 파일이 XLS 형식이면, 'DBMS = XLS', CSV면 'DBMS = CSV' 로 설정해야합니다.
-
REPLACE: 기존에 동일한 형식의 데이터셋이 있을 경우에는 덮어쓰기를 한다라는 옵션입니다. 해당 옵션이 없고, 동일한 이름의 데이터셋이 있을 경우에는 오류가 발생합니다.
-
OUT = : SAS 내부의 데이터셋으로 저장할 수 있도록 합니다. 위 코드에서는 SALE이라는 데이터셋으로 저장했습니다.
PROC PRINT DATA = WORK.SALE; RUN;
-
PROC PRINT: 데이터를 출력하는 statement 로 데이터를 테이블 형식으로 출력합니다. 그 결과로 칼럼은 21개, 전체 행은 2999개의 데이터가 출력됐습니다.
PROC PRINT DATA = WORK.SALE (obs=20); RUN;
'OBS = ': 최대 N개의 행만 출력할 수 있는 옵션으로, 위 코드는 처음 20개 행만 출력하는 코드입니다.
위 데이터를 출력한 결과를 보면, OBS라고 칼럼처럼 보이는 칼럼이 있습니다.
OBS는 칼럼이 아니라 Observations의 약어로 행 번호를 의미합니다. ;
데이터셋의 칼럼인 Row_ID, Order_ID의 데이터는 흰색으로 표시되는 반면, OBS는 살짝 파란색으로 표시도어 행 번호임을 알 수 있습니다.
PROC PRINT DATA = WORK.SALE (obs=20) NOOBS; RUN;
만약 행 번호 없이 데이터만 출력하고 싶다면 'NOOBS'라는 옵션으로 데이터를 출력할 수 있습니다.