BookmarkSubscribeRSS Feed

Enterprise Miner를 이용한 Cluster Analysis (2)

Started ‎06-10-2020 by
Modified ‎06-10-2020 by
Views 135

안녕하십니까, 전보배 입니다.

우리는 DMR 출판사 고객 데이터로 clustering 분석을 통해 고객을 분류하려고 합니다.

 

지난 시간 분석할 데이터를 불러오기 위해 라이브러리를 생성하는 부분까지 했습니다.

 

먼저, 지난 작업을 불러오는 것 먼저 해볼까요?

Enterprise Miner를 열고, 초기화면에서 [프로젝트 열기]를 클릭 합니다.

 

[그림 2-1]

SE22019010722575870.png

 

 

[그림 2-2]

SE22019010722581770.png

 

저번 시간 [새로운 프로젝트]를 만들면서, 서버 디렉터리 위치 설정을 “D:\TEMP\DMR_전략팀” 으로 하고, 프로젝트 명을 “DMR_CLUSTERING”로 설정했었지요?

그렇게 설정하면, 따로 저장을 하지 않아도 “D:\TEMP\DMR_전략팀\DMR_CLUSTERING” 위치에 우리가 했던 작업들이 저장이 됩니다.

[프로젝트 열기…]를 클릭하신 후에 “D:\TEMP\DMR_전략팀\DMR_CLUSTERING”를 찾아가셔서 “Prject.emp”를 선택하시면, 마지막 작업까지 고스란히 불러올 수 있습니다.

[그림 2-3]

SE22019010722583170.png

 

이제 분석을 할 공간인 다이어그램을 생성하고, 데이터 소스를 불러오는 작업을 해보겠습니다.

우선, 메뉴바에서 [파일 > 새로 만들기 > 다이어그램…] 으로 접근하실 수 있습니다.

[그림 2-4]

SE22019010722584670.png

 

아니면, 아래 [그림 2-5]과 같이 다이어그램을 생성할 수 있습니다.

[그림 2-5]

SE22019010722585670.png

 

[그림 2-6]

SE22019010722590770.png

 

다이어그램 이름은 “EX_CLUSTER”로 설정하겠습니다.

아래 [그림 2-7]과 같이 오른쪽에 다이어그램 창이 생겼다면 잘 하고 계신 겁니다 ^^

[그림 2-7]

SE22019010722592070.png

 

작업할 공간 설정도 해두었으니, 이제 데이터를 불러오겠습니다.

마찬가지로 메뉴바에서 [파일 > 새로 만들기 > 데이터 소스…] 로 접근하실 수도 있지만, 조금 더 빠른 방법으로 좌측 상단 박스에서 [데이터 소스]를 우클릭 한 후 [데이터 소스 생성]을 선택하겠습니다.

[그림 2-8]

SE22019010722593270.png

 

[데이터 소스 생성]을 클릭 후 소스는 SAS 테이블만 존재하므로 [다음] 버튼을 누릅니다.

[그림 2-9]

SE22019010722595370.png

 

[찾아보기] 버튼을 눌러 분석하고자 하는 테이블을 찾겠습니다.

[그림 2-10]

SE22019010723000970.png

 

저번 시간에 미리 만들어 둔 “DMR” 라이브러리가 보이시나요? “DMR”을 클릭하면 “dmr_customer_base_kr” 테이블을 찾으실 수 있습니다.

[그림 2-11]

SE22019010723002070.png

 

“DMR.DMR_CUSTOMER_BASE_KR” 을 확인한 후 [다음] 버튼을 클릭합니다.

[그림 2-12]

SE22019010723003370.png

 

불러온 테이블 속성을 한번 더 확인 하시고, [다음] 버튼을 누릅니다.

[그림 2-13]

SE22019010723004470.png

 

우리는 처음 해보는 분석이니 기본 설정으로 선택하고 [다음] 버튼을 클릭하겠습니다.

[그림 2-14]

SE22019010723005570.png

 

아래 [그림 2-15] 처럼 [역할]을 펼쳐서 각 변수의 역할을 수정하도록 하겠습니다.

[그림 2-15]

SE22019010723011170.png

 

레이블로 “수익성”과 “구독부수”칼럼을 이번 분석에서 제외 시키려고 합니다. 역할을 “Rejected” 변경하시기 바랍니다.

[그림 2-16]

SE22019010723012470.png

 

표본 데이터셋은 생성하지 않도록 하겠습니다. [다음] 버튼 클릭해 주시기 바랍니다.

[그림 2-17]

SE22019010723014070.png

 

데이터 소스 역할을 [Raw]로 설정하고, [다음] 버튼을 클릭합니다.

[그림 2-18]

SE22019010723015270.png

 

이제 메타데이터가 완료되었습니다. 속성들을 확인하시고, [마침] 버튼을 누르겠습니다.

[그림 2-19]

SE22019010723020270.png

 

자, 마지막으로 좌측 박스에 [데이터 소스]에 “DMR_CUSTOMER_BASE_KR”이 생성된 것 보이시죠? 그 테이블을 클릭하여 쭉 끌어다가 오른쪽 다이어그램에 놓겠습니다.

[그림 2-20]

SE22019010723021170.png

 

그리고 아래 [그림 2-21]과 같이 노드 우클릭 후 실행 버튼을 누르시거나, 노드 선택 후 [F3]을 누르시면, 실행이 됩니다. 그러면, 분석을 할 모든 준비가 완료 된 것입니다.

[그림 2-21]

SE22019010723022270.png

 

이제 clustering을 할 준비가 다 되었습니다.

다음 시간이 기다려.. 지실.. 까요? ㅠㅠ

새해 복 많이 받으세요!!

 

오늘까지 작업한 emp를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Miner 14.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Gui

Version history
Last update:
‎06-10-2020 10:40 PM
Updated by:
Contributors

Ready to join fellow brilliant minds for the SAS Hackathon?

Build your skills. Make connections. Enjoy creative freedom. Maybe change the world. Registration is now open through August 30th. Visit the SAS Hackathon homepage.

Register today!
Article Labels
Article Tags