BookmarkSubscribeRSS Feed

Enterprise Miner 활용 하기 (12) : 연관성분석 노드2

Started ‎06-10-2020 by
Modified ‎06-10-2020 by
Views 228

안녕하세요 MYSAS 홍보대사 최준입니다.

 

저번 시간에 이어서 이번에는

연관성분석 노드를 통해 구매되는 상품의 연관성 패턴을 찾아보도록 하겠습니다.

 

SE22015080307540370.png

데이터 분석에서 가장 먼저 해야할 일은 통계량 탐색입니다.

하지만 현재 데이터는 역할이 transaction으로 되어있기 때문에 바로 통계량 탐색노드를 이용할 수 없습니다!

 

따라서 데이터의 속성패널 -> 역할 : Raw로 변경해 준 후에, 통계량 탐색 노드를 이용해야만 합니다.

(혹은 속성패널 -> 역할 : Train으로 변경해도 괜찮습니다.)

 

SE22015080307580770.png

이제 본격적으로 연관성분석을 실행해보겠습니다.

(데이터의 역할 : Transaction으로 설정해 놓아야 연관성 분석을 진행할 수 있습니다)

 

SE22015080308000170.png

연관성분석 속성탭에서

최대항목 옵션 : '3' 으로 설정하여 연관성 규칙에서 고려되는 최대 항목 수를 3개로 지정해 보겠습니다.

ID를 기준으로 규칙 내보내기 옵션 : '예'로 설정하여 ID와 관련된 규칙을 식별하는 규칙변수로 구성하는 데이터셋을

분석 데이터셋으로 내보내도록 한 뒤 연관성분석 노드를 실행해 보겠습니다.

 

SE22015080308092370.png

 

연관성분석 노드 실행 결과 위와 같이 통계량도표, 규칙행렬, 통계량 선 도표와 출력창을 볼 수 있습니다.

 

통계량 도표에서 항목을 3개 포함하면서 신뢰도가 40% 이상인 규칙 영역을 선택하면

다른 영역에서도 굵게 표시되는 것을 확인할 수 있습니다.

 

SE22015080308121570.png

 

상단의 메뉴에서 "보기 -> 규칙 -> 규칙 테이블"을 선택하여 신뢰도, 지지도, 향상도 등을 확인할 수 있습니다.

 

SE22015080308131370.png

시각적인 특성을 가지고 연관성분석의 결과를 보다 알기 쉽게 하기 위해서는

"보기 -> 규칙 -> 연결그래프"를 선택하여 링크로써 연관성을 표현한 그래프를 확인할 수 있습니다.

 

SE22015080308211770.png

 

뿐만 아니라 그래프를 오른쪽 버튼을 클릭하여 그래프속성을 선택, 여러가지 옵션을 지정하면

보다 Insight 있는 그래프를 만들 수 있습니다.

 

transaction 데이터의 연관성분석 노드 결과를 보면

Magazine & reeting Cads를 구매하는 고객은 Candy Bar를 많이 선택하며(신뢰도 45.86%),

여타 품목보다 Candy Bar를 선택할 경우가 약 2배(향상도 2.68) 많음을 확인해 볼 수 있습니다.

 

지금까지 연관성분석 노드에 대해서 살펴보았습니다.

 

 

기타 궁금하신 점이 있으시다면

언제든지 저에게 쪽지 or 댓글로 문의해주시면 친절하게 답변해드리겠습니다.

 

감사합니다.

Version history
Last update:
‎06-10-2020 02:51 AM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags