BookmarkSubscribeRSS Feed

SAS 실전 활용 가이드 6

Started 3 weeks ago by
Modified 3 weeks ago by
Views 375

 

SAS를 처음배우거나 실무에 활용할 때 기본이 되는 문법 중 하나가 데이터 불러오기(import), 요약 통계, 정렬입니다.

이번 글에서는 SAS 코드를 활용해 PROC IMPORT, PROC MEANS, PROC SORT 절차를 중심으로 각각의 역할과 어떤 작업을 수행하는지에 대해 자세히 알아보려 합니다.

 

각 코드별로 자세한 해석과 함께 실무나 과제에서 어떻게 활용할 수 있을지 정리하였습니다.

 

 

image.png

 

 

1. 데이터 Import

 

proc import out = baseball datafile='C:/baseball.xlsx' dbms=xlsx replace;
getnames = yes;
RUN;

 

  • PROC IMPORT: csv, xlsx 등 데이터 파일 형태로 되어 있는 데이터셋을 PROC IMPORT statemt 를 통해서 sas내에서 읽는 구문입니다.

  • OUT: 가져온 데이터 파일을 SAS 내에서 baseball 로 설정합니다.

  • DBMS: 읽을 데이터 파일의 포맷을 설정합니다.

  • REPLACE: baseball 이라는 데이터셋이 이미 존재한다면 교체한다라는 의미입니다.

  • GETNAMES = yes: 첫번째 행을 변수 이름으로 사용합니다.

 

image.png

 

 

 

2. 데이터 분포 확인하기

 

proc means data = baseball; run;

 

 

  • PROC MEANS: baseball 이라는 수치형 변수들에 대해서 기술 통계량을 자동으로 계산해줍니다. 관측치수, 평균, 표준편차, 최소값, 최대값에 대한 통계량이 출력됩니다.

 

 

 

 image.png

 

 

3. 데이터 정렬

① 내림차순으로 정렬

 

proc sort data = baseball; by descending nHome; run;

  

  • PROC SORT: 데이터 셋을 정렬하는 Statement 입니다.

  • BY DESCENDING: nHome이라는 변수를 내림차순으로 정렬합니다.

 

 image.png

 

 

 

 

② 데이터 셋 일부 관측치만 확인

 

proc sort data = baseball(obs = 5); by descending salary ; run;

 

 

  • PROC SORT: 데이터를 정렬하는 statement 입니다. OBS = 5는 Observation 으로 4개 행만 사용한다라는 의미입니다.

  • By DESCENDIING: salary 변수를 기준으로 내림차순으로 정렬합니다.

 

image.png

 

Version history
Last update:
3 weeks ago
Updated by:
Contributors

sas-innovate-white.png

Missed SAS Innovate in Orlando?

Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.

 

Register now

Article Labels
Article Tags