BookmarkSubscribeRSS Feed

[SAS 활용 노하우] Data-Step & Procedure-Step

Started ‎09-02-2023 by
Modified ‎09-02-2023 by
Views 610

SAS 프로그램은 코딩을 하기 위해서 여러개의 Data-Step 과 Procedure-Step 으로 구성된다.

 

/*data step*/
DATA WORK.EXAM;
INPUT ID $ NAME $ MID FINAL;
CARDS;
001 김철수 10 40
002 이영희 15 10
001 강민호 50 15
001 박지수 20  .
;
RUN;

/*procedure step*/
PROC MEANS DATA=WORK.EXAM;
VAR MID FINAL;
RUN;

 

 

■ Data-Step

 

Data-step 은 DATA, INPUT, IF, CARDS, PROC, RUN 등의 키워드와 데이터셋의 이름(위의 코드에서는 work.exam을 의미한다.)

주로, 데이터 셋의 생성이나 자룔값의 연산과 같은 데이터에 대한 조작을 수행할 수 있다.

데이터셋의 이름은 공백이나, ?, # 등과 근은 특수문자 사용은 불가능하나, 중간에는 숫자 사용은 가능하다.

 

아래의 설명은 데이터 분석을 수행할 때, Data-step에서 데이터셋은 만들기 위해 자주 등장하는 구조이다.

 

 

 

1) 변수 선언

 

데이터 분석에 사용하는 변수는 문자형(character type)과 숫자형(numeric type)으로 나눌 수 있다.

문자형은 문자, 숫자, 특수문자, 기호로 구성되어 있으며(변수 이름 뒤에 $를 표시한다.), 숫자형은 숫자로만 구성되어 있다.

위의 변수에서는 ID와 Name이 문자형 변수이며, MID 와 FINAL은 숫자형 변수이다.

 

 

 

2) Observation

 

위의 예제에서 데이터셋은 변수와 관측치라는 2개의 차원인 직사각형 배열로 구성되어 있다.

데이터셋의 한 행이 한 개의 관찰개체이다. 이 개체는 결측값이 포함될 수 있다.

 

 

 

3) 외부파일 읽기

 

DATA test1;
INFILE '외부파일경로';
INPUT ID $ NAME $ MID FINAL;
RUN;

 

 

SAS 라이브러리에 있는 데이터가 아닌 외부데이터를 가지고, SAS 데이터셋으로 읽어 분석을 수행할 수 있다.

가장 먼저 데이터셋의 이름을 설정한다. (위의 코드에서는 test1이라는 데이터 셋을 설정하였다.)

그 다음으로는 외부파일을 읽기 위해서는 외부파일을 읽은 경로와 파일 이름을 선언한다.

 

 

■ Procedure-Step

 

Procedure-Step은 PROC statement 와 Procedure stament 로 구성된다.

Procedure statement을 통해서 통계분석, 그래프, 보고서 작성 등을 수행할 수 있다. 이때, PRINT, PLOT, MEANS 등과 같은 명령문을 사용한다. 이 명령문을 통해서 통계분석이나 그래프 그리기 등을 수행할 수 있다.

 

 

Version history
Last update:
‎09-02-2023 08:33 AM
Updated by:
Contributors

SAS Innovate 2025: Call for Content

Are you ready for the spotlight? We're accepting content ideas for SAS Innovate 2025 to be held May 6-9 in Orlando, FL. The call is open until September 25. Read more here about why you should contribute and what is in it for you!

Submit your idea!

Article Labels
Article Tags