BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 데이터 추출

Started ‎10-29-2023 by
Modified ‎10-29-2023 by
Views 1,528
PROC IMPORT DATAFILE = '가져올 데이터 파일의 경로'
DBMS = '데이터 소스 타입'
OUT = '저장할 데이터 셋 이름';
GETNAMES = 'YES or NO' /*첫번째 행에 변수명이 포함되어 있으면 yes , 안되어 있으면 no'*/
RUN;

 

PROC IMPORT statment 는 데이터를 가져오고 데이터 파일을 sas 데이터 셋으로 변환하는데 사용합니다.

PROC IMPORT DATAFILE: '가져올 데이터 파일의 경로'

DBMS : '데이터 소스 타입'

OUT : '저장할 데이터 셋 이름';

GETNAMES : 'YES or NO' *첫번째 행에 변수명이 포함되어 있으면 yes , 안되어 있으면 no'*

DATAROW = 특정 행 부터 데이터 읽기, 위 코드는 10행부터 데이터를 읽습니다.

RUN;

 

 

  • 인덱스를 활용핸 행 추출

 

proc import datafile= '/home/u45061472/sasuser.v94/hotel.csv'
dbms= csv
out = work.testdata2;
getnames= yes;
DATAROW= 10;
run;

proc print data = work.testdata2;
run;

 

사용한 데이터는 hotel.csv 데이터로 첨부파일로 다운로드 받을 수 있습니다.

첫번째행부터 특정행까지 불러오고 싶다면 PROC IMPORT statement 앞에 아래와 같은 명령문을 사용할 수 있습니다.

 

OPTIONS OBS = n;

 

 

● 조건에 따른 데이터 행 추출

PROC SQL은 SQL문을 활용하여 데이터를 분석하기 위한 프로시저입니다.

대부분 SQL 문과 비슷한 쿼리를 사용하지만, 코드 마지막에는 'QUIT'문을 사용해 조건에 따른 데이터 분석 수행을 마친다

SELECT 문: 열을 선택하고, 원하는데이터를 지정한다.

WHERE: 특정 조건을 충족하는 행을 선택한다.

GROUP BY: 데이터를 그룹화한다.

JOIN: 데이터 집합의 결합을 한다.

UPDATE/DELETE: 데이터를 수정하거나 삭제한다.

INTO: 새로운 SAS 데이터 집합에 저장한다.

 

 

proc sql;
create table work.testdata2 as
select *
from work.testdata
where  checkin_date between '01jan2016'd and '01jan2018'd;
quit;

01JAN2016 과 01JAN2018 사이의 데이터만 추출한다.

Version history
Last update:
‎10-29-2023 07:16 AM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags