SAS Tech & Tip

BookmarkSubscribeRSS Feed

Enterprise Miner를 이용한 Cluster Analysis (6)

Started ‎06-10-2020 by
Modified ‎06-10-2020 by
Views 230

지난 시간까지 우리는 EM을 이용하여 Clustering을 했습니다.

이번에는 이 결과를 군집별로 평가하고, 각 군집을 차별화 하는 요인들을 쉽게 확인하기 위해 세그먼트 프로파일링 노드를 이용하겠습니다.

이 노드가 없었을 때에는 결과 데이터를 받아서 각 군집별로 통계량들을 수집하여, 그래프를 도출하였습니다. 현업에서 분석하시는 분들이 매우 만족하는 기능 입니다.

이제 지난 작업을 열어보겠습니다.

 

 

Build Segment Profiles

[그림6-1]

SE22019021814352770.png

 

다이어그램 위 툴바에서 [평가] 탭의 [세그먼트 프로파일링] 노드를 쭉 끌어서 클러스터링 옆에 놓은 후 화살표를 [그림 6-1]과 같이 이어 줍니다.

그리고 바로 실행을 시켜봅니다.

[그림6-2]

SE22019021814354170.png

 

[그림6-3]

SE22019021814354970.png

 

[그림 6-2], [그림 6-3]은 [결과] 창 중 오른쪽 상단에 있는 [프로파일 : _SEGMNET_] 입니다.

이 곳에는 각 군집의 특성이 군집의 크기 순서 대로 표시됩니다.

 

SEGMENT 4

세그먼트 4에는 가장 많은 4,885명의 고객으로 구성됩니다. LOG_AGE 즉, 나이가 가장 강력한 예측 요인이 됩니다. 파란색 막대 그래프는 각 군집 내의 분포를 나타내며, 빨간색 실선으로 된 그래프는 데이터의 전체 분포를 나타냅니다. 세그먼트 4의 LOG_AGE를 보면 전체 분포보다 오른쪽으로 치우쳐진 것을 확인하실 수 있습니다. 연령대가 높은 고객이 세그먼트 4를 이루고 있다고 파악하시면 됩니다.

LOG_YEARS 요인 또한 오른쪽으로 치우쳐져 있습니다. 전체 평균보다 긴 기간 동안 고객들이 세그먼트 4에 있습니다.

세 번째 특징은 성별이 모두 남성입니다.

마지막으로 소득은 평균보다 높은 것으로 나타납니다.

(그래프를 더블클릭 하시면 큰 화면으로 확인 하실 수 있습니다. 우클릭 하여, [그래프 속성]을 클릭하시면 범례 및 그래프 속성을 볼 수 있습니다.)

 

SEGMENT 5

SEGMENT 5에는 4,354명의 고객이 있으며, 평균보다 더 젊은 고객으로 이루어져 있습니다. 고객이 된 기간이 짧은 편이며, 남성입니다. 가계소득은 낮은 경향을 보입니다.

 

SEGMENT 1

SEGMENT 1에는 3,111명의 고객이 있습니다. 여성고객이며, 평균보다 높은 연령대 입니다. 고객이 된 기간은 길며, 가계 소득은 평균입니다.

 

SEGMENT 2

SEGMENT 2는 2,941명의 고객이 있으며, 연령대도 낮고, 고객이 된 기간도 짧습니다. 소득도 평균 이하 입니다.

 

SEGMENT 3

SEGMENT 3은 499명으로만 이루어져 있으며, 성별을 모르는 사람으로만 이루어져 있습니다.                

 

다른 결과물인 왼쪽 하단의 [변수 Worth : _SEGMET_]를 보겠습니다.

[그림6-4]

SE22019021814363870.png

 

군집을 나누는데 기여한 요인을 확인할 수 있습니다. SEGMENT 4는 “나이” 팩터이며, 그 다음은 “고객기간”, “성별”, “소득”이 뒤를 따릅니다.

 

 

Cluster 분석 후 마케팅, 상품 개발에 관한 insight

 

이 분석 결과는 DMR 출판사에 연령별, 충성도, 성별, 소득수준에 따라 마케팅과 상품 개발이 필요하다는 정보를 주고 있습니다.

가장 규모가 큰 ‘SEGMENT 4’ 분석 결과를 주목해서 볼 수도 있습니다. 그런데, ‘SEGMENT 4’  ‘SEGMENT 1’ 은 유사한 점이 하나 있습니다. 두 그룹은 모두 충성도가 높으며, 평균보다 연령대가 많고, 소득도 많은 편입니다. 다른 것은 성별뿐입니다. 두 그룹은 DMR 출판사의 50%를 차지하고 있습니다. 이럴 때에는 두 그룹을 묶어서 접근하는 방법이 있습니다.

‘Men’s health’나 ‘여성잡지’처럼 성별로 구분해서 도서를 발행하되, 각 연령대에 맞추어 잡지표지나 광고를 달리하는 것입니다.

아니면, 성별을 고려하지 않고 요리책, 여행잡지, 경제잡지 같은 분류로 발행하는 방법도 있습니다.

두 번째로 큰 ‘SEGMENT 5’ 는 또 다른 기회를 잡을 수 있게 해준다. 이 그룹은 어린 남성 그룹입니다. 만약 DMR 출판사에 아직 게임이나 스포츠 관련 잡지가 없다면, 어서 제안할 필요가 있습니다.

segment profiles는 각 군집을 잘 설명해줍니다. 분석을 통해 경험해 봤듯이, 군집의 패턴들은 마케팅을 하고, 제품을 생산하고, 서비스를 제공하는 데에 통찰력을 줍니다.

기존 데이터를 통해 현재 고객을 이해했지만, 더 많은 고객 데이터가 생긴다면 더 풍부한 분석과 결과를 얻을 수 있습니다. 예를 들면, 고객의 취미, 흥미, 소비 패턴, sns 정보 등을 추가하여 군집분석을 한다면, 우리가 했던 분석보다 더 강력한 마케팅 전략과, 제품개발 방향성 제안을 할 수 있을 것입니다

 

이렇게 CLUSTERING을 함께 해보았습니다.

다음 시간에는 Enterprise Miner를 이용하여 Decision Tree 분석을 해보도록 하겠습니다.

 

 

오늘까지 작업한 emp를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Miner 14.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]​  

Version history
Last update:
‎06-10-2020 10:57 PM
Updated by:
Contributors

sas-innovate-white.png

Our biggest data and AI event of the year.

Don’t miss the livestream kicking off May 7. It’s free. It’s easy. And it’s the best seat in the house.

Join us virtually with our complimentary SAS Innovate Digital Pass. Watch live or on-demand in multiple languages, with translations available to help you get the most out of every session.

 

Register now!

Article Labels
Article Tags