BookmarkSubscribeRSS Feed

Enterprise Miner를 이용한 Tree Analysis (1)

Started ‎06-11-2020 by
Modified ‎06-11-2020 by
Views 138

 

Introduction

지난 Clustering 분석을 통해서 DMR 출판사의 고객을 살펴봤습니다. 포괄적 분석에서 가장 좋은 첫 번째 단계는 바로 고객을 이해하는 것입니다.

이번에는 과거 행동과 특징에서 패턴을 발견하여 미래의 행동을 예측하는 방법을 다루려고 합니다. 이 과정에서 사용할 방법은 Decision Tree 입니다. Decision Tree의 장점은 강력한 예측 도구가 될 뿐 아니라, 이해하고 설명하기 수월하다는 것입니다. 그러므로 분석가와 마케팅 담당자들이 이 기법을 선호합니다.

DMR 출판사의 리더십팀은 한 권 이상의 잡지를 구독하는 고객의 특성을 알아보려고 합니다. 우리가 이 리더십팀의 팀원이 돼서 SAS Enterprise Miner를 사용하여 분석해 보도록 하겠습니다.

 

프로젝트 시작하기

자, 새로운 마음으로 시작해 볼까요!?

SAS Enterprise Miner를 열고, [새로운 프로젝트…]를 클릭합니다.

[그림 1-1]

SE22019030217455170.png

 

프로젝트 이름과 SAS Server 디렉터리는 자유롭게 설정 후 [다음] 버튼을 클릭합니다.

 

[그림 1-2]

SE22019030217460270.png

 

새로운 프로젝트 정보를 확인하신 후 [마침]을 클릭하시면 됩니다.

 

Create the Library

먼저, 우리가 분석할 데이터를 EM으로 가져오기 위해 라이브러리를 생성하겠습니다.

[Ctrl+Shift+L] 키를 눌러 바로 생성해도 되고, 메뉴바에서 [파일 > 새로 만들기 > 라이브러리…]를 클릭해도 됩니다.

[그림 1-3]

SE22019030217461170.png

 

[그림 1-4]

SE22019030217462170.png

 

[새로운 라이브러리 생성]을 선택 후 [다음] 버튼을 클릭합니다.

[그림 1-5]

SE22019030217463370.png

 

라이브러리 이름을 설정(8byte 이하)하고, 해당 데이터가 있는 경로를 설정해줍니다.

[그림 1-6]

SE22019030217470070.png

 

속성을 확인 한 후 [마침] 버튼을 클릭합니다.

 

Input the Data Source

이번엔 해당 라이브러리에 있는 데이터를 EM으로 끌어오겠습니다.

[그림 1-7]과 같이 [데이터 소스]에 우클릭 후 [데이터 소스 생성]을 클릭합니다.

[그림 1-7]

SE22019030217471670.png

 

[그림 1-8]

SE22019030217472970.png

“dmr_customer_base_kr.sas7bdat” 데이터를 소스로 사용하기 위해 “SAS 테이블”을 선택한 후 [다음] 버튼을 클릭합니다.

 

[그림 1-9]

SE22019030217474170.png

 

왼쪽 라이브러리 패널에서 “Dmrdt” 라이브러리를 더블 클릭 한 후 “dmr_customer_base_kr”을 선택하고 [확인] 버튼을 클릭합니다.

[그림 1-10]

SE22019030217475270.png

 

“DMRDT.DMR_CUSTOMER_BASE_KR” 테이블이 잘 들어 왔는지 확인 한 후 [다음] 버튼을 클릭합니다.

[그림 1-11]

SE22019030217480670.png

 

변수가 7개 이고, 관측치가 16,019개인 데이터가 들어왔습니다. [다음] 버튼을 클릭합니다.

[그림 1-12]

SE22019030217481970.png

 

메타데이터 관리자 옵션은 “고급”을 선택 후 [다음]을 클릭합니다.

[그림 1-13]

SE22019030217484470.png

 

“수익성”, “구독부수”, “고객연수”는 DMR출판사의 실적관련 변수이므로 역할에서 “Rejected”를 선택하여, 고객 정보인 “성별”, “소득”, “나이”만 Decision Tree에 사용하겠습니다. [다음] 버튼을 클릭합니다.

[그림 1-14

SE22019030217485870.png

 

표본 데이터는 생성하지 않고, [다음] 버튼을 클릭하겠습니다.

 

[그림 1-15]

SE22019030217491270.png

 

역할은 “Raw”로 설정하고 [다음] 버튼을 클릭합니다.

[그림 1-16]

SE22019030217493770.png

 

작업 요약을 확인 후 [마침] 버튼을 클릭합니다.

Decision Tree 첫 시작 시간으로 라이브러리 설정과 데이터 가져오기 작업을 해봤습니다. Clustering 때와 거의 유사한 작업이라 수월하게 따라오셨을 것으로 예상됩니다.

재료를 다 준비 했으니 다음 시간에는 타겟 설정 및 데이터 분할 작업을 해보도록 하겠습니다.

감사합니다.

 

오늘까지 작업한 emp를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Miner 14.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]​  

Version history
Last update:
‎06-11-2020 12:05 AM
Updated by:
Contributors

SAS Innovate 2025: Register Now

Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!

Article Labels
Article Tags