BookmarkSubscribeRSS Feed

[SAS 활용 노하우] Data-Step & Procedure-Step

Started ‎09-02-2023 by
Modified ‎09-02-2023 by
Views 546

SAS 프로그램은 코딩을 하기 위해서 여러개의 Data-Step 과 Procedure-Step 으로 구성된다.

 

/*data step*/
DATA WORK.EXAM;
INPUT ID $ NAME $ MID FINAL;
CARDS;
001 김철수 10 40
002 이영희 15 10
001 강민호 50 15
001 박지수 20  .
;
RUN;

/*procedure step*/
PROC MEANS DATA=WORK.EXAM;
VAR MID FINAL;
RUN;

 

 

■ Data-Step

 

Data-step 은 DATA, INPUT, IF, CARDS, PROC, RUN 등의 키워드와 데이터셋의 이름(위의 코드에서는 work.exam을 의미한다.)

주로, 데이터 셋의 생성이나 자룔값의 연산과 같은 데이터에 대한 조작을 수행할 수 있다.

데이터셋의 이름은 공백이나, ?, # 등과 근은 특수문자 사용은 불가능하나, 중간에는 숫자 사용은 가능하다.

 

아래의 설명은 데이터 분석을 수행할 때, Data-step에서 데이터셋은 만들기 위해 자주 등장하는 구조이다.

 

 

 

1) 변수 선언

 

데이터 분석에 사용하는 변수는 문자형(character type)과 숫자형(numeric type)으로 나눌 수 있다.

문자형은 문자, 숫자, 특수문자, 기호로 구성되어 있으며(변수 이름 뒤에 $를 표시한다.), 숫자형은 숫자로만 구성되어 있다.

위의 변수에서는 ID와 Name이 문자형 변수이며, MID 와 FINAL은 숫자형 변수이다.

 

 

 

2) Observation

 

위의 예제에서 데이터셋은 변수와 관측치라는 2개의 차원인 직사각형 배열로 구성되어 있다.

데이터셋의 한 행이 한 개의 관찰개체이다. 이 개체는 결측값이 포함될 수 있다.

 

 

 

3) 외부파일 읽기

 

DATA test1;
INFILE '외부파일경로';
INPUT ID $ NAME $ MID FINAL;
RUN;

 

 

SAS 라이브러리에 있는 데이터가 아닌 외부데이터를 가지고, SAS 데이터셋으로 읽어 분석을 수행할 수 있다.

가장 먼저 데이터셋의 이름을 설정한다. (위의 코드에서는 test1이라는 데이터 셋을 설정하였다.)

그 다음으로는 외부파일을 읽기 위해서는 외부파일을 읽은 경로와 파일 이름을 선언한다.

 

 

■ Procedure-Step

 

Procedure-Step은 PROC statement 와 Procedure stament 로 구성된다.

Procedure statement을 통해서 통계분석, 그래프, 보고서 작성 등을 수행할 수 있다. 이때, PRINT, PLOT, MEANS 등과 같은 명령문을 사용한다. 이 명령문을 통해서 통계분석이나 그래프 그리기 등을 수행할 수 있다.

 

 

Version history
Last update:
‎09-02-2023 08:33 AM
Updated by:
Contributors

Ready to join fellow brilliant minds for the SAS Hackathon?

Build your skills. Make connections. Enjoy creative freedom. Maybe change the world. Registration is now open through August 30th. Visit the SAS Hackathon homepage.

Register today!
Article Labels
Article Tags