지난 시간까지 우리는 EM을 이용하여 Clustering을 했습니다.
이번에는 이 결과를 군집별로 평가하고, 각 군집을 차별화 하는 요인들을 쉽게 확인하기 위해 세그먼트 프로파일링 노드를 이용하겠습니다.
이 노드가 없었을 때에는 결과 데이터를 받아서 각 군집별로 통계량들을 수집하여, 그래프를 도출하였습니다. 현업에서 분석하시는 분들이 매우 만족하는 기능 입니다.
이제 지난 작업을 열어보겠습니다.
Build Segment Profiles
[그림6-1]
다이어그램 위 툴바에서 [평가] 탭의 [세그먼트 프로파일링] 노드를 쭉 끌어서 클러스터링 옆에 놓은 후 화살표를 [그림 6-1]과 같이 이어 줍니다.
그리고 바로 실행을 시켜봅니다.
[그림6-2]
[그림6-3]
[그림 6-2], [그림 6-3]은 [결과] 창 중 오른쪽 상단에 있는 [프로파일 : _SEGMNET_] 입니다.
이 곳에는 각 군집의 특성이 군집의 크기 순서 대로 표시됩니다.
SEGMENT 4
세그먼트 4에는 가장 많은 4,885명의 고객으로 구성됩니다. LOG_AGE 즉, 나이가 가장 강력한 예측 요인이 됩니다. 파란색 막대 그래프는 각 군집 내의 분포를 나타내며, 빨간색 실선으로 된 그래프는 데이터의 전체 분포를 나타냅니다. 세그먼트 4의 LOG_AGE를 보면 전체 분포보다 오른쪽으로 치우쳐진 것을 확인하실 수 있습니다. 연령대가 높은 고객이 세그먼트 4를 이루고 있다고 파악하시면 됩니다.
LOG_YEARS 요인 또한 오른쪽으로 치우쳐져 있습니다. 전체 평균보다 긴 기간 동안 고객들이 세그먼트 4에 있습니다.
세 번째 특징은 성별이 모두 남성입니다.
마지막으로 소득은 평균보다 높은 것으로 나타납니다.
(그래프를 더블클릭 하시면 큰 화면으로 확인 하실 수 있습니다. 우클릭 하여, [그래프 속성]을 클릭하시면 범례 및 그래프 속성을 볼 수 있습니다.)
SEGMENT 5
SEGMENT 5에는 4,354명의 고객이 있으며, 평균보다 더 젊은 고객으로 이루어져 있습니다. 고객이 된 기간이 짧은 편이며, 남성입니다. 가계소득은 낮은 경향을 보입니다.
SEGMENT 1
SEGMENT 1에는 3,111명의 고객이 있습니다. 여성고객이며, 평균보다 높은 연령대 입니다. 고객이 된 기간은 길며, 가계 소득은 평균입니다.
SEGMENT 2
SEGMENT 2는 2,941명의 고객이 있으며, 연령대도 낮고, 고객이 된 기간도 짧습니다. 소득도 평균 이하 입니다.
SEGMENT 3
SEGMENT 3은 499명으로만 이루어져 있으며, 성별을 모르는 사람으로만 이루어져 있습니다.
다른 결과물인 왼쪽 하단의 [변수 Worth : _SEGMET_]를 보겠습니다.
[그림6-4]
군집을 나누는데 기여한 요인을 확인할 수 있습니다. SEGMENT 4는 “나이” 팩터이며, 그 다음은 “고객기간”, “성별”, “소득”이 뒤를 따릅니다.
Cluster 분석 후 마케팅, 상품 개발에 관한 insight
이 분석 결과는 DMR 출판사에 연령별, 충성도, 성별, 소득수준에 따라 마케팅과 상품 개발이 필요하다는 정보를 주고 있습니다.
가장 규모가 큰 ‘SEGMENT 4’ 분석 결과를 주목해서 볼 수도 있습니다. 그런데, ‘SEGMENT 4’ 와 ‘SEGMENT 1’ 은 유사한 점이 하나 있습니다. 두 그룹은 모두 충성도가 높으며, 평균보다 연령대가 많고, 소득도 많은 편입니다. 다른 것은 성별뿐입니다. 두 그룹은 DMR 출판사의 50%를 차지하고 있습니다. 이럴 때에는 두 그룹을 묶어서 접근하는 방법이 있습니다.
‘Men’s health’나 ‘여성잡지’처럼 성별로 구분해서 도서를 발행하되, 각 연령대에 맞추어 잡지표지나 광고를 달리하는 것입니다.
아니면, 성별을 고려하지 않고 요리책, 여행잡지, 경제잡지 같은 분류로 발행하는 방법도 있습니다.
두 번째로 큰 ‘SEGMENT 5’ 는 또 다른 기회를 잡을 수 있게 해준다. 이 그룹은 어린 남성 그룹입니다. 만약 DMR 출판사에 아직 게임이나 스포츠 관련 잡지가 없다면, 어서 제안할 필요가 있습니다.
segment profiles는 각 군집을 잘 설명해줍니다. 분석을 통해 경험해 봤듯이, 군집의 패턴들은 마케팅을 하고, 제품을 생산하고, 서비스를 제공하는 데에 통찰력을 줍니다.
기존 데이터를 통해 현재 고객을 이해했지만, 더 많은 고객 데이터가 생긴다면 더 풍부한 분석과 결과를 얻을 수 있습니다. 예를 들면, 고객의 취미, 흥미, 소비 패턴, sns 정보 등을 추가하여 군집분석을 한다면, 우리가 했던 분석보다 더 강력한 마케팅 전략과, 제품개발 방향성 제안을 할 수 있을 것입니다
이렇게 CLUSTERING을 함께 해보았습니다.
다음 시간에는 Enterprise Miner를 이용하여 Decision Tree 분석을 해보도록 하겠습니다.
오늘까지 작업한 emp를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Miner 14.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르면 실행되지 않습니다.
참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!