INTRODUCTION
오늘부터 시장분석을 해보도록 하겠습니다.
먼저, 저는 아직도 DMR출판사 전략팀 신입사원으로 가정하겠습니다. 다행히 저번 분석이 유효했는지 퇴사를 당하지 않았습니다 ^^;;
그래서 이번에는 여러분과 함께 시장분석을 통해 이 회사에서 저의 입지를 더 단단히 굳히고 싶습니다.
DMR출판사가 수익 증대를 위해 어떤 부분을 개선해야 할지 알고 싶다면 어떻게 해야 할까요? 이것은 모든 회사들의 기본적인 고민들입니다. 그래서 우리는 출판 업계에서 DMR출판사가 차지하는 비중이 얼마나 되는지 data를 뽑아보려고 합니다.
PROJECT OVERVIEW
저번 시간에 다루었던 DMR출판사의 데이터를 기억 하시나요? 그 데이터와 우리나라 전체의 출판사 데이터를 비교하여 DMR출판사가 전체에서 차지하는 비중을 구하려고 합니다. (참조하는 책인 [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide] 에서는 미국 data라고 소개 되었으나, 여러분의 이해를 돕기 위해 data 변환 후 한국 data라고 설명 드리고 있습니다.)
이 프로젝트는 8개의 단계로 진행됩니다.
① SAS Enterprise Guide 7.1 시작
② 시장 data 가져오기
③ 프로젝트에 DMR출판사 data 추가
④ 질의빌더 이용해서 새로운 칼럼 생성
⑤ DMR출판사 data를 성별과 연령대 기준으로 요약
⑥ 시장 data와 DMR출판사 data 병합
⑦ 연령별 data로 요약
⑧ 시장 분석 수행
시장분석
시장 분석을 통해서 고객들의 특징을 알아보는 것이 가장 중요합니다. 가능하다면, 전체 시장과 우리 출판사에서 비슷한 특징을 갖고 있는 고객층을 비교해 볼 수 있습니다.
우리는 General List Company에서 우리나라 전체 출판사의 성별, 연령대별로 구독부수, 연수익이 들어 있는 data를 구매했습니다.
우리의 목표는 이 data를 이용하여 성별, 연령대별로 DMR출판사와 전체 출판업계의 성과를 비교해 보는 것입니다.
프로젝트 시작하기
SAS Enterprise Guide 아이콘을 더블 클릭 하시거나, [윈도우창 > 모든 프로그램 > SAS > SAS Enterprise Guide]를 클릭하여 EG를 시작하겠습니다.
[그림 1-1]
이제는 친숙해진 EG 초기 화면이 나타났습니다.
Library 할당
먼저, 여러분 각자 결과 data set을 저장할 폴더에 Library를 할당하겠습니다. 저는“D:\TEMP\DMR_전략팀” 위치에 “MKT”라는 이름으로 할당하겠습니다.
[메뉴바 > 도구 > 프로젝트 라이브러리 할당]을 클릭하시면 됩니다. 저는 아래 그림 순서대로 작업했습니다. (이미 이전 글에서 상세하게 설명한 부분은 작업 스크린 샷으로 설명을 대체하도록 하겠습니다.)
[그림 1-2]
[그림 1-3]
[그림 1-4]
[그림 1-5]
몇 주전 했던 내용이지만, 다시 해보시니 기억이 새록새록 나시죠? 그래도 다시 복습하고 싶으신 분들은 “Enterprise Guide를 이용한 Business Analytics (1)”을 다시 보시면 되겠습니다.
DATA 가져오기
General List Company에서 구매한 우리나라 전체 출판업계 data는 Publishing_Market_kr.xlsx” 입니다. 이 글의 처음 부분의 우측 상단에서 다운로드 하여 사용하실 수 있습니다.
총 18개의 데이터로, 구독자수, 성별, 연령대, 수익, 구독부수가 들어 있습니다. 이 엑셀 파일을 EG에서 sas data set으로 가져오기 해보겠습니다.
[그림 1-6]
“클릭하고 끌어다 놓기!” 기억하시죠?
[그림 1-7]
라이브러리는 “MKT”, 데이터셋은 “Publishing_Market_kr”로 설정 합니다.
[그림 1-8]
[그림 1-9]
[그림 1-10]
이름은 그대로 두지만, 이 후 편의를 위해서 레이블만 [그림 1-10]과 같이 바꿔 보도록 하겠습니다. 그리고 [마침] 버튼을 클릭합니다.
[그림 1-11]
여러분들도 [그림 1-11]과 같이 “수익” 칼럼의 몇 개 data 들이 “***”로 표시 되셨나요?
이는 [그림 1-10]에서 “수익”의 결과 출력형식이 “NEGPAREN12.”으로 되어있기 때문입니다. 이 출력형식은 콤마, 음수를 나타내는 형식 중 하나로 12byte 길이를 지원합니다. 즉, data가 12byte의 길이보다 더 길어져서 “***”로 data가 보이지 않게 된 것입니다.
[그림 1-12]
[그림 1-12]위치에서 툴바의 “작업 수정” 버튼을 클릭하시면, 출력형식 부분을 수정 하실 수 있습니다.
[그림 1-13]
[필드 속성 정의] 부분으로 이동하셔서 [그림 1-13]과 같이 “수익”의 출력형식 부분을 클릭하고 […] 버튼을 누릅니다.
[그림 1-14]
위의 [그림 1-14]와 같이 “COMMA32.”으로 수정 하신 뒤 [확인] 버튼을 누릅니다.
다시 “데이터 가져오기” 창의 [마침] 버튼을 누르시면, 실행이 됩니다.
[그림 1-15]
“수익” 칼럼의 모든 숫자가 다 보이시나요? 실제로 우리나라의 원화가 단위가 크기 때문에 실무에서 이런 경우를 종종 만나게 됩니다. 그 때 마다 적절하게 형식을 변형시켜 주시면 되는데, 보통 길이만 충분히 증가 시켜줘도 해결하실 수 있습니다.
(여기로 이동하시면, 더 많은 format에 대해 찾아 보실 수 있습니다.)
그리고 첨부된 파일인 “dmr_customer_base_kr.sas7bdat”은 라이브러리를 할당한 폴더에 다운로드 해주시기 바랍니다.
자 이제 분석을 위한 준비가 다 되었습니다. 다음 시간부터는 이 재료들을 가지고 재미있는 작업들을 해보도록 하겠습니다.
오늘까지 작업한 EGP를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Guide 7.1, Local 환경에서 작업했습니다.
하위 버전이거나, 서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전, 같은 환경이어도, 라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르거나 불러오기 파일 위치(D:\Trea_SYSOP\Enterprise Guide를 이용한 Business Analytics)가 다르면 실행되지 않습니다.
참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.