BookmarkSubscribeRSS Feed

Enterprise Guide를 이용한 Market Analysis (3)

Started ‎06-09-2020 by
Modified ‎06-09-2020 by
Views 128

 

[그림 3-1]

SE22018121121484870.png

 

작업 공간에 위 [그림 3-1] 과 같은 플로우를 그리고 계시지요? 오늘도 egp를 열고, 라이브러리 할당과 [연령대] 질의 빌더를 실행한 후 작업을 이어가도록 해보겠습니다.

 

 

Sum Performance Variables

 

“WORK.DMR_AGE_GRP” data set은 16,019개의 데이터로 이루어져 있습니다.

DMR 출판사의 데이터인 이 data set을 출판 업계 전체 데이터인 “MKT.PUBLISHING_MARKET_KR”와 join하여 비교해 보는 것이 Market Analysis의 목표 입니다.

그러기 위해서 “WORK.DMR_AGE_GRP”을 “MKT.PUBLISHING_MARKET_KR”와 같은 레벨(연령대, 성별)로 요약하려고 합니다.

 

이 작업은 [질의빌더]에서 하겠습니다. 작업공간에서 “WORK.DMR_AGE_GRP”을 선택한 후 우클릭 하여 [질의빌더]를 선택합니다.

 

[그림 3-2]

SE22018121121505770.png

 

저희는 함께 작업하고 있기 때문에 편의성을 위하여, [질의 이름]은 “요약통계량”으로 [출력 이름]은 “WORK.DMR_SUM”으로 설정하겠습니다. 그리고, 기준이 되는 연령대와 성별 칼럼을 [데이터 선택] 창으로 가져오겠습니다.

 

우리가 이 질의빌더에서 만들고자 하는 요약 칼럼들은 연령대와 성별을 기준으로

①     구독자수 합

②     구독부수 합

③     고객의 수익 합

입니다.

 

먼저, 구독자수 합을 구하기 위해서 고객번호 하나당 한 사람의 고객을 뜻하기 때문에 고객번호를 세어 오려고 합니다.

 

[그림 3-3]

SE22018121121512570.png

 

[그림 3-3]과 같이, 고객번호를 [데이터 선택] 창으로 끌어온 뒤 [요약] 줄에서 “COUNT DISTINCT”를 선택합니다.

그러면, 아래 [그림 3-4]와 같이 [데이터 선택] 창 아래에 [그룹 요약] 이라는 창이 하나 더 생깁니다.

 

[그림 3-4]

SE22018121121513770.png

 

어떤 칼럼을 기준으로 해당 데이터를 요약할 것인가를 표시해 줍니다. 그런데, 자동으로 우리가 원하는 성별, 연령대 칼럼이 선택됐습니다.

 

하지만, 현실에서 작업하실 때에는 수동으로 그 기준을 잡아줘야 할 경우도 생깁니다. 그럴 경우에는 [자동으로 그룹 선택] 체크 박스를 풀어 주시고 바로 오른 쪽에 보이는 [그룹 편집] 버튼을 클릭합니다.

 

[그림 3-5]

SE22018121121515270.png

 

[그룹 편집] 창이 나타나면, 우리가 원하는 “성별”, “연령대” 칼럼을 다시 더블 클릭해서 선택해 줍니다.

 

[그림 3-6]

SE22018121121520470.png

 

 “연령대”, “성별”은 label이므로 실제 칼럼명인 “age_grp”, “gender”가 와도 당황 하시면 안됩니다 ^^

다시 확인 버튼을 누르시면, [자동으로 그룹 선택]이 아니지만, 아까와 똑 같은 결과가 나타납니다.

 

[그림 3-7]

SE22018121121522070.png

 

이제 [그룹 요약] 부분이 이해되시지요? 이렇게 제가 자세하게 설명하는 이유는 당연히! 실무에서 많이 쓰이기 때문입니다.

 

자 이제 나머지 칼럼들도 요약하러 가보겠습니다. 이젠 쉽게 하실 수 있을 거예요.

 

[그림 3-8]과 같은 결과가 나오도록, “구독부수”, “수익성” 칼럼을 [데이터 선택]창으로 끌어다 놓은 후 [요약] 줄을 “SUM”으로 바꿔 줍니다.

 

[그림 3-8]

SE22018121121523570.png

 

자, 실행해 볼까요??

 

[그림 3-9]

SE22018121121524470.png

 

출판 업계 데이터와 유사하게 연령대와 성별로 요약한 데이터가 나왔습니다. 다음 시간에는 두 data set을 join 작업으로 붙여 보도록 하겠습니다.

 

 

감사합니다.

 

 

 

오늘까지 작업한 EGP를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Guide 7.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르거나 불러오기 파일 위치(D:\Trea_SYSOP\Enterprise Guide를 이용한 Business Analytics)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]​  

Version history
Last update:
‎06-09-2020 05:06 AM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags