안녕하세요. 오늘은 DATASET OPTIONS(데이터셋 옵션)에 대해 알아보겠습니다. 데이터셋 옵션은 데이터 단계나 프로시져 단계에서 유용하게 사용될 수 있습니다. 자주 사용되는 옵션들은 다음과 같습니다.
KEEP= : 데이터셋에 포함될 변수들을 지정
DROP= :데이터셋에 포함되지 않을 변수들을 지정
RENAME=(oldname=newname) : 변수명을 변경
FIRST OBS=n : n번째 개체부터 데이터를 불러옴
OBS=n : n번째 개체까지만 데이터를 불러옴
Data Step
데이터셋에 포함될 변수와 포함시키지 않을 변수를 지정할 때 KEEP옵션과 DROP옵션이 사용됩니다. 예시에 사용될 데이터는 다음과 같습니다.
============================================================
예시로 만든 두개의 데이터를 MERGE문을 통해 가로결합을 하는 과정에서 데이터셋 옵션을 사용해보겠습니다.
Test데이터셋에는 KEEP옵션을 사용하여 id, name, height 변수만을 OBS옵션으로 3번째 개체까지만 남겼습니다. Test_1데이터셋에는 DROP옵션을 사용하여 score 변수를 제거하고 RENAME옵션으로 dept변수명을 test로 변경한 것을 확인하였습니다.
데이터셋 옵션의 장점은 기존데이터셋을 변경하는 것이 아니라 새로운 데이터셋을 만들 때만 임시적으로 작동하는 것이기 때문에 기존데이터를 보존할 수 있다는 것입니다. 또한 반드시 데이터셋 옆에 함께 쓰이지않고도 독립적으로 사용할 수도 있습니다.
Procedure Step
프로시져 단계에서도 데이터셋 옵션을 사용할 수 있습니다.
Proc print문에 사용되는 dataset에 FIRSTOBS옵션을 사용하여 3번째 개체부터, DROP옵션을 사용하여 gender변수를 빼고 데이터를 읽어온 것을 확인 하였습니다.
마치며
오늘은 데이터 단계와 프로시져 단계에서 데이터셋을 불러올 때 사용할 수 있는 데이터셋 옵션에 대해 알아보았습니다. 독립적으로 사용할 수도 있긴 하지만 두개 이상의 데이터셋을 불러올 때는 편리하게 원하는 처리를 할 수 있는 장점이 있고 또한 원데이터를 보존하면서 진행하는 장점도 있습니다.
Reference
김기영 외 3인. 『예제로 배우는 SAS프로그래밍 입문』. 자유아카데미. 2016.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.