INFILE & IMPORT
지금까지는 PROC step만을 이용하여 코딩을 해보았는데요 이번시간에는 DATA step을 이용해보겠습니다.^^
그리고 간단하게 Excel파일 가져오는 법에 대해 알아보겠습니다.^^
1. INFILE이란?
DATA step을 이용하여 raw data를 SAS data set으로 만드는 작업입니다.
이번시간에 해볼 INFILE방법은 column input과 formatted input이 되겠습니다.
2. Column input
DATA 라이브러리.SAS data set명; INFILE 'raw data위치‘; INPUT 변수명 <$> 시작열-끝나는열;
RUN;
|
- 변수명은 새로 만들어지는 SAS data set의 변수명입니다.
$는 변수가 문자타입일 경우 붙입니다.
* 숫자 입력시 콤마(,)가 포함된 경우(비표준데이터)는 숫자로 읽지 못합니다.
100, -100, 100.0, +100.94, 1.40E23 (<-표준데이터)인 경우에만 숫자로 읽을 수 있습니다.
Ex) D:\ex\address.txt 파일을 아래와 같이 만듭니다.
1______8_10__13_15_________25_27________36 <- column |
20061234 Haha 01011142000 Math 20071248 hong 01012121234 Statistics 20041372 You 01021601000 Statistics 20101662 Don 01035671111 Bio 20110119 Park 01088442100 Math 20082143 Gil 01076541212 Math 20081579 Jun 01094239000 Law 20101200 Gae 01088774321 Music 20112003 Song 01066661235 Media 20112009 Woo 01039786010 Music |
- aa라이브러리에 오른쪽과 같은 SAS data set이 생성됩니다.
3. Formatted input
DATA 라이브러리.SAS data set명;
INFILE 'raw data위치‘;
INPUT @시작열 변수명 informat;
RUN;
|
- Formatted input은 표준, 비표준데이터 모두 읽을 수 있습니다.
- raw data에 날짜가 있을 경우 informat에 format에서 사용했던 날짜포맷(MMDDYY10., DATE7. 등)을 사용하면 됩니다.
* Format vs. Informat
- Format : 출력형식
- Informat : 입력형식
INFILE에서 column input과 formatted input을 혼합하여 사용해도 무방합니다.
4. Excel파일 가져오기
- Default 상태로 두시고 Next> 를 선택하세요.
- 가져올 Excel파일의 위치를 지정합니다.
- $ 있으면 : 시트전체
$ 없으면 : 지정영역
- Member : 생성되는 SAS data set 이름 입력
- Finish를 누루면 Excel파일을 SAS data set으로 가져오기 완료
※ SAS 9.1 버전은 Excel 2007이상버전은 가져오지 못합니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.