SAS 프로그램은 코딩을 하기 위해서 여러개의 Data-Step 과 Procedure-Step 으로 구성된다.
/*data step*/
DATA WORK.EXAM;
INPUT ID $ NAME $ MID FINAL;
CARDS;
001 김철수 10 40
002 이영희 15 10
001 강민호 50 15
001 박지수 20 .
;
RUN;
/*procedure step*/
PROC MEANS DATA=WORK.EXAM;
VAR MID FINAL;
RUN;
■ Data-Step
Data-step 은 DATA, INPUT, IF, CARDS, PROC, RUN 등의 키워드와 데이터셋의 이름(위의 코드에서는 work.exam을 의미한다.)
주로, 데이터 셋의 생성이나 자룔값의 연산과 같은 데이터에 대한 조작을 수행할 수 있다.
데이터셋의 이름은 공백이나, ?, # 등과 근은 특수문자 사용은 불가능하나, 중간에는 숫자 사용은 가능하다.
아래의 설명은 데이터 분석을 수행할 때, Data-step에서 데이터셋은 만들기 위해 자주 등장하는 구조이다.
1) 변수 선언
데이터 분석에 사용하는 변수는 문자형(character type)과 숫자형(numeric type)으로 나눌 수 있다.
문자형은 문자, 숫자, 특수문자, 기호로 구성되어 있으며(변수 이름 뒤에 $를 표시한다.), 숫자형은 숫자로만 구성되어 있다.
위의 변수에서는 ID와 Name이 문자형 변수이며, MID 와 FINAL은 숫자형 변수이다.
2) Observation
위의 예제에서 데이터셋은 변수와 관측치라는 2개의 차원인 직사각형 배열로 구성되어 있다.
데이터셋의 한 행이 한 개의 관찰개체이다. 이 개체는 결측값이 포함될 수 있다.
3) 외부파일 읽기
DATA test1;
INFILE '외부파일경로';
INPUT ID $ NAME $ MID FINAL;
RUN;
SAS 라이브러리에 있는 데이터가 아닌 외부데이터를 가지고, SAS 데이터셋으로 읽어 분석을 수행할 수 있다.
가장 먼저 데이터셋의 이름을 설정한다. (위의 코드에서는 test1이라는 데이터 셋을 설정하였다.)
그 다음으로는 외부파일을 읽기 위해서는 외부파일을 읽은 경로와 파일 이름을 선언한다.
■ Procedure-Step
Procedure-Step은 PROC statement 와 Procedure stament 로 구성된다.
Procedure statement을 통해서 통계분석, 그래프, 보고서 작성 등을 수행할 수 있다. 이때, PRINT, PLOT, MEANS 등과 같은 명령문을 사용한다. 이 명령문을 통해서 통계분석이나 그래프 그리기 등을 수행할 수 있다.
Are you ready for the spotlight? We're accepting content ideas for SAS Innovate 2025 to be held May 6-9 in Orlando, FL. The call is open until September 25. Read more here about why you should contribute and what is in it for you!