SAS를 처음배우거나 실무에 활용할 때 기본이 되는 문법 중 하나가 데이터 불러오기(import), 요약 통계, 정렬입니다.
이번 글에서는 SAS 코드를 활용해 PROC IMPORT, PROC MEANS, PROC SORT 절차를 중심으로 각각의 역할과 어떤 작업을 수행하는지에 대해 자세히 알아보려 합니다.
각 코드별로 자세한 해석과 함께 실무나 과제에서 어떻게 활용할 수 있을지 정리하였습니다.
proc import out = baseball datafile='C:/baseball.xlsx' dbms=xlsx replace;
getnames = yes;
RUN;
PROC IMPORT: csv, xlsx 등 데이터 파일 형태로 되어 있는 데이터셋을 PROC IMPORT statemt 를 통해서 sas내에서 읽는 구문입니다.
OUT: 가져온 데이터 파일을 SAS 내에서 baseball 로 설정합니다.
DBMS: 읽을 데이터 파일의 포맷을 설정합니다.
REPLACE: baseball 이라는 데이터셋이 이미 존재한다면 교체한다라는 의미입니다.
GETNAMES = yes: 첫번째 행을 변수 이름으로 사용합니다.
proc means data = baseball; run;
PROC MEANS: baseball 이라는 수치형 변수들에 대해서 기술 통계량을 자동으로 계산해줍니다. 관측치수, 평균, 표준편차, 최소값, 최대값에 대한 통계량이 출력됩니다.
① 내림차순으로 정렬
proc sort data = baseball; by descending nHome; run;
PROC SORT: 데이터 셋을 정렬하는 Statement 입니다.
BY DESCENDING: nHome이라는 변수를 내림차순으로 정렬합니다.
② 데이터 셋 일부 관측치만 확인
proc sort data = baseball(obs = 5); by descending salary ; run;
PROC SORT: 데이터를 정렬하는 statement 입니다. OBS = 5는 Observation 으로 4개 행만 사용한다라는 의미입니다.
By DESCENDIING: salary 변수를 기준으로 내림차순으로 정렬합니다.
Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.