BookmarkSubscribeRSS Feed

CH4. 데이터 다루기

Started ‎06-08-2020 by
Modified ‎06-08-2020 by
Views 1,703

————————————————————————————————————————————————————————— 

앞으로 MYSAS 커뮤니티 유저분들에게 SAS UE의 데이터 핸들링, 분석 그리고 시각화 등의 사용법에 대해 전해드리려고 합니다.


MYSAS 커뮤니티 사이트 뿐만 아니라 SAS Korea 유튜브 채널*에서도 해당 컨텐츠의 동영상을 제공하고 있습니다.

(*SAS Korea 유튜브 채널: https://www.youtube.com/user/saskorea)


모든 학계의 교수님들과 학생들이 사용하는 제품인 만큼, 어느 누구라도 보기 쉬우며 따라할 수 있는 컨텐츠를 제작하겠습니다.
—————————————————————————————————————————————————————————
CH4. 데이터 다루기 동영상: https://youtu.be/rg_QvRaHEXE

 

4-1.PNG

이번 컨텐츠는 "Ch4. 데이터 다루기" 이며, 데이터 핸들링에 있어 사용되는 구문들과 실습데이터를 가지고 해당 구문들을 실제 적용하는 법에 대해 알려드리겠습니다.

 

먼저 데이터 핸들링을 하기 위한 구문들에 대해 설명 드리겠습니다.
여기서 설명드릴 구문들은 대부분 Data Step에서 쓰이는 구문입니다.

 

 

4-2.PNG

Format과 Label은 데이터 출력시에 데이터 변수의 이름과 보여지는 값의 형태를 변경할 수 있는 구문입니다.

 

 

4-3.PNG

Keep & Drop 구문은 저장할 데이터 셋에 입력할 변수들을 선택할 수 있게 해줍니다.
그리고 Case 구문은 입력 된 변수를 대소문자로 변경해주는 것으로, Upcase는 입력 된 변수를 모두 대문자로, Lowcase는 입력 된 변수를 모두 소문자로, 마지막으로 Propcase는 첫글자는 대문자 그리고 나머지 글자는 소문자로 데이터가 변경됩니다.

 

 

4-4.PNG

데이터 분석에 있어 상당히 중요한 부분을 차지하는 파생변수 만들기 입니다.
기존 변수들을 계산하여 새로운 변수를 만드는 작업으로 기존 변수를 함수 또는 연산자를 이용하여 새로운 파생 변수를 만들 수 있습니다.

 

다음은 Output 구문입니다.

 

4-5.PNG

Output 구문은 특정 조건이 참일때, 데이터를 저장할 데이터 셋으로 보내는 역할을 합니다.

 

데이터 핸들링의 꽃 조건문입니다. 조건문은 다음과 같이 Where과 If 두 가지를 소개하도록 하겠습니다.

 

4-6.PNG

Where과 If 조건문은 둘다 조건에 맞는 데이터를 출력하는 구문입니다. 하지만 두 조건문은 조건을 적용하여 출력하는 시점의 차이가 있습니다.
Where의 경우 Set구문으로 부터 데이터셋이 불려올때 조건을 적용하며, If의 경우 Set구문으로 부터 전체 데이터 셋이 불려온 뒤에 조건이 적용됩니다.

 

 

4-7.PNG

Contains와 Like는 조건문 안에서 해당 값을 포함하는 데이터를 추출하는 구문으로 보통 문자를 추출할 때 사용됩니다.
특히, Like 구문의 경우 추출할 값에 _(한 자리) 와 %(전체)를 사용함으로써 다양한 데이터를 추출 할 수 있습니다.

(ex. A_:A뒤에 한자리의 글자만 올 수 있음 ; A%:맨앞글자가 A인 모든 글자)

 

마지막으로 정렬하기 입니다. 정렬하기는 Proc Step에서 사용하며, 다음과 같이 사용합니다.

 

4-8.PNG

Proc Sort의 Default는 오름차순이며, By Descending을 사용하여 내림차순을 적용할 수 있습니다.
또한 By 변수1 변수2 를 할 경우, 변수1로 오름차순한 다음 변수2로 오름차순을 적용합니다.

(ex. By Descending V1 V2 V3; V1변수를 먼저 내림차순, 그다음 V2내림차순 마지막으로 V3내림차순 진행)

 

이제는 위의 데이터 핸들링 구문을 이용하여 실제 데이터를 가지고 적용해보도록 하겠습니다.

 

4-9.PNG

해당 문제에 대한 코드는 첨부파일에 올려놓도록 하겠습니다.
직접 코드를 통해 원하는 결과물이 출력됨으로써 생기는 희열을 느끼셨으면 합니다.


이상, 데이터 핸들링을 하기위해 사용되는 구문들에 대해 소개한 “Ch4. 데이터 다루기”였습니다.
 
컨텐츠에 대해 궁금한 사항은 댓글로 남겨주시면 감사 하겠습니다.

 

앞으로 더 좋은 컨텐츠를 가지고 여러분들을 MYSAS를 통해 찾아 뵙겠습니다.

 

감사합니다.

Version history
Last update:
‎06-08-2020 05:52 AM
Updated by:
Contributors

hackathon24-white-horiz.png

The 2025 SAS Hackathon Kicks Off on June 11!

Watch the live Hackathon Kickoff to get all the essential information about the SAS Hackathon—including how to join, how to participate, and expert tips for success.

YouTube LinkedIn

Article Tags