BookmarkSubscribeRSS Feed

SAS VDMML 시작하기(2) 결측값 처리

Started ‎06-09-2020 by
Modified ‎06-09-2020 by
Views 487

안녕하세요 MYSAS 시샵 입니다.

이번 시간에는 VDMML의 visual pipeline을 통해서 결측값을 처리하는 방법에 대해 알아보겠습니다. 

 

 

 

저번 시간에 설명한 데이터 설정 단계를 지나면 파이프라인을 볼 수 있습니다.

[ 데이터 마이닝 사전 처리 ]에는 데이터를 정제에 대한 기능들이 있습니다.SE22019051510442070.png

 

 

 

 

 

 

 

SE22019051510463370.png

 

왼쪽에서 원하는 기능을 파이프라인 화면으로 가져오면 됩니다파이프라인에서 원하는 부분으로 기능을 가져오면 자동적으로 파이프라인이 생성되기 때문에 쉽게 분석을 진행할 수 있습니다.

각 단계는 기본적인 default값으로 설정되어 있습니다. 설정을 바꾸고 싶을 땐, 노드를 클릭하게 되면 화면 오른쪽에 나타납니다. 

 

 

 

 

 

여러 사전 처리 중에서 가장 기본적이면서도 중요한 결측값 처리를 해보겠습니다.

SE22019051510520170.png



class입력변수와 interval입력변수의 결측값을 각각 다른 방법으로 처리할 수 있습니다.

 

 

단일표시자와 고유표시자를 설정할 수 있는데이 옵션은 결측값이 의미가 있을 경우 선택해주면 됩니다단일표시자는 모든 입력변수에 대해 결측값이 존재하는지를 표시해주고고유표시자는 각 변수에 대해 결측값이 존재하는지 나타내줍니다.

결과를 보면

SE22019051510501270.png

 

결측값 처리를 한 변수는 ‘IMP_변수명’으로 생성되었고, 결측임을 나타내는 표시자 변수는 ‘M_변수명’으로 생성되었습니다. 전체 변수에 대한 표시자 변수는 ‘M_VARIABLE’로 설정되었습니다.

 

 

 

파이프라인을 눈으로 확인하면서 데이터를 정제를 쉽게 할 수 있다는 것이 큰 장점입니다~ 

Version history
Last update:
‎06-09-2020 09:17 PM
Updated by:
Contributors

sas-innovate-white.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.

 

Early bird rate extended! Save $200 when you sign up by March 31.

Register now!

Article Labels
Article Tags