지난 시간까지 “DMR_Customer_Base_kr.xlsx”라는 Excel 데이터를 가져와서 sas data set으로 바꾸는 작업을 했습니다.
오늘은 생성된 테이블로 프로파일링을 하기 전에 라이브러리 할당과 sas 명명 규칙에 대해 알려드리겠습니다.
우리 DMR출판사 전략팀은 sas data set을 ‘dmr_st’ 라는 라이브러리에 저장한다고 합니다.
저희는 저번주에 디폴트로 "work"라는 임시라이브러리에 생성된 테이블을 저장했거든요.
임시 라이브러리에 저장된 테이블들은 EG세션을 닫으면 다 지워져 버립니다.
만약 데이터가 매우 커서 20분 실행 후 작업이 완료됐는데 EG를 닫아 버렸다면, 여러분은 다시 20분을 기다리셔야 원하시는 데이터를 얻으실 수 있으십니다.
하지만, 영구라이브러리에 저장해두었다면, 해당 라이브러리만 다시 잡아주면 데이터는 바로 보실 수 있습니다.
헷갈리신다구요? 실습해보시면 감이 오실 겁니다.
지난 시간에 라이브러리는 SAS 파일의 저장장소로 파일 시스템 경로에 별명을 지어준 것이며, 영구라이브러리와 임시라이브러리가 있다고 했습니다.
저희는 “D:\TEMP\DMR_전략팀” 이 경로를 “dmr_st”라는 별명을 지어주려고 합니다. 이 작업을 EG에서는 [라이브러리 할당]이라고 부릅니다.
저번시간 작업에 이어서 해볼까요?
[그림 3-1]
우선, 이 상태의 작업을 저장해 보도록 하겠습니다. 다른 프로그램들과 똑같이 [ctrl+s]를 누르시면 저장 하실 수 있습니다. 저는 "DMR.egp" 라는 이름으로 저장했습니다.
라이브러리 할당을 하기 위해서는 [메뉴바 > 도구 > 프로젝트 라이브러리 할당] 으로 가시면 됩니다.
[그림 3-2]
그러면 [그림 3-3]과 같은 팝업창이 나타납니다.
[그림 3-3]
라이브러리 이름 규칙은 다음과 같습니다.
① 8byte 이내
② 첫 번째 문자는 영문자 또는 밑줄
③ 이후 문자는 영문자, 숫자, 또는 밑줄
④ 빈 칸, 특수문자, 확장문자 허용 안됨
⑤ SASHELP, SASMSG, SASUSER, WORK는 이미 EG안에 예약된 라이브러리라 사용할 수 없음
복잡 하지요?
만약 여러분이 틀린 이름을 기입하신다면, EG는 [그림 3-4]와 같은 경고창을 내보내니 굳이 외우시지 않으셔도 됩니다.
[그림 3-4]
저희는 “dmr_st”라는 이름으로 라이브러리를 할당하기로 했지요?
라이브러리 이름은 대소문자 구분을 하지 않으니 “DMR_ST”라고 지으셔도 상관 없습니다.
[그림 3-5]
서버는 “Local”로 선택되어 있습니다.
만약 서버상에서 작업하시는 분들은 해당 서버명이 나타나겠지요?
아니! 로컬이랑 서버가 무엇인지 궁금하시다고요??? 잠깐 멈추고 설명 드리겠습니다.
Enterprise Guide, 즉, EG는 하나의 터미널일 뿐이며, 실제로는 작업을 하는 엔진이 꼭 필요합니다.
[그림 3-6]
[그림 3-6]처럼 우리는 EG에서 작업을 하지만 사실 작업이 돌아가는 곳은 SAS SYSTEM이라는 엔진이죠.
저는 지금 그 엔진 중 Local Computer, 더 정확하게 말하자면 제 컴퓨터에 설치된 base sas로 돌리고 있습니다. 만약, 여러분이 저와 같은 환경에서 작업을 하시려면, EG와 sas base를 함께 설치 하시면 됩니다.
서버에 붙는 경우도 있습니다. EG 작업공간 우측 하단을 보시면 [그림 3-7]과 같은 내용이 있습니다.
[그림 3-7]
[프로파일을 선택하지 않음] 상태는 제가 local, base sas에서 작업하고 있다는 뜻이며, 그 부분을 클릭하셔서 서버정보를 입력하시면, 해당 서버로 EG를 작업하실 수 있습니다.
(서버 입력 가이드는, https://www.sas.com/content/dam/SAS/ko_kr/doc/productbrief/2013QA_guide.PDF 의 page 93 부터 아주 자세하게 나와 있습니다.)
다시 제자리로 돌아가 [그림 3-5] 상태에서 [다음] 키를 눌러 주시면, 아래와 같은 화면이 나타납니다.
[그림 3-8]
경로 쪽에 “D:\TEMP\DMR_전략팀”라고 적어주시거나, 경로 적는 칸에 [찾아보기] 버튼을 누르셔서 해당 경로를 찾아가셔도 무방합니다.
다시 [다음] 버튼을 누르면, 아래와 같은 창을 보실 수 있습니다.
[그림 3-9]
라이브러리에 대한 권한 설정 등의 옵션을 설정하실 수 있는 곳입니다. 저희는 [다음]을 클릭하겠습니다.
[그림 3-10]
엔진, 경로, 서버 모두 이해 되시지요?
[마침] 버튼을 눌러서 해당 작업을 마무리해 보도록 하겠습니다. 아마 [라이브러리 할당] 아이콘 주위가 형광연두색으로 잠깐 변하고 아무런 일도 일어나지 않을 것입니다.
하지만, [그림 3-11] 처럼 서버리스트 쪽으로 가서 플러스 기호를 확장하면 새로운 라이브러리가 생성 되어 있음을 확인하실 수 있습니다.
[그림 3-11]
만약 보이지 않으신다면, [라이브러리]를 선택하시고 [새로고침] 버튼을 누르면 “DMR_ST”를 보실 수 있습니다.
여러분은 “D:\TEMP\DMR_전략팀” 위치에 “DMR_ST” 라이브러리를 할당하신 겁니다.
그러면, 지난 시간에 불러오기를 했던 “WORK.DMR_CUSTOMER_BASE_KR” 파일을 “DMR_ST.DMR_CUSTOMER_BASE_KR”로 “DMR_ST” 라이브러리에 저장해 볼까요?
[그림 3-12]처럼 [데이터 가져오기] 작업 아이콘을 선택하신 후 우클릭을 하시고, “데이터 가져오기(~~~)수정”을 선택하시면 됩니다.
[그림 3-12]
[그림 3-13]
위 그림에서 [찾아보기] 버튼을 눌러서 라이브러리를 수정하려고 합니다.
[그림 3-14]
왼쪽 패널의 [서버]를 눌러서 우리가 생성한 “DMR_ST” 라이브러리를 선택합니다. 파일 이름은 수정하지 않으셔도 됩니다. [저장] 버튼을 클릭합니다.
[그림 3-15]
라이브러리 이름이 바뀐 것이 보이시지요? 바로 [마침] 버튼을 클릭하겠습니다.
그리고 초기화면 왼쪽 하단에 있는 서버리스트의 “DMR_ST” 라이브러리를 선택 후 [새로고침] 버튼을 클릭하면 아래와 같이 새로운 테이블이 들어와 있습니다. 이젠 EG세션을 닫으셔도 “D:\TEMP\DMR_전략팀” 디렉토리에 있는 sas data set은 지워지지 않습니다.
[그림 3-16]
라이브러리는 sas를 사용하기 전에 접해보기 힘든 개념이라 이렇게 직접 만들어보고, 혹은 “WORK” 라이브러리에 담았다가 지워져도 봐야 그 개념이 와닿습니다. 저도 수없이 테이블을 날려 버렸던 기억이…
오늘 퇴근 하기 전 저번 시간에 말씀 드린 대로, sas 명명 규칙에 대해 말씀 드리겠습니다.
라이브러리에 대한 명명 규칙은 위에서 언급했으니 넘어가도록 하겠습니다.
sas data set과 칼럼 이름에 대한 규칙은 아래와 같습니다.
① 길이는 32byte까지 가능
② 영문자와 밑줄로 시작
③ 이후 문자는 영문자, 숫자, 또는 밑줄
④ 빈 칸, 특수문자, 확장문자 허용 안됨
EG에서는 sas data set과 칼럼 이름에 대한 규칙을 지키지 않아도 처리가 가능하도록 옵션 설정이 되어 있지만, 길이는 32byte까지 임은 꼭 지키셔야 합니다.
이것으로 오늘의 업무를 마치고 가상의 DMR 신입사원인 우리는 퇴근하겠습니다.
꼭 [ctrl+s]를 누르셔서 DMR.egp를 저장하시고, 퇴근하세요.
참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.