이번 게시글은 SASHELP 라이브러리의 Cars 데이터 중 Make(제조사)가 Audi를 제외하고 Origin(제조국)이 Asia인 데이터만을 필터링한 데이터를 기반으로 새로운 칼럼을 생성하는 글 입니다.
기존에 작성했던 결과물 [Query_For_Cars_001] 데이터를 프로세스 플로우 창에서 오른쪽 클릭으로 [질의 빌더] 항목을 선택합니다.
[질의 빌더]은 자동으로 SQL을 생성하는 Enterprise Guide 기능입니다.
[질의 빌더] > [기존 칼럼 추가] 을 통해서 칼럼을 새로 추가할 수 있습니다.
[Query_For_Cars_001] 데이터 중 Weight와 Length 칼럼을 중복으로 생성했습니다. 칼럼 네이밍은 Unique 해야합니다.
[질의 빌더] > [새로운 계산 칼럼 추가] 를 통해서 새로운 값을 생성할 수 있습니다.
요약된 칼럼: 새로운 칼럼을 생성하거나 조건에 따라 교처할 수 있습니다. 생성된 칼럼의 출력을 정렬하거나 그룹화할 수 있습니다.
재코딩된 칼럼: 칼럼의 단일 값이나 값 범위를 지정한 값으로 바꾸는 것 입니다.
Ex) Gender 칼럼 이 Female / Male로 되어 있으면, F / M으로 바꿀 수 있습니다.
Ex) Age 칼럼을 10대 ~ 20대/ 30대 ~ 40대 / 40대 이상
고급 표현식: 고급 표현식 편집기를 사용해서 다른 칼럼이나 값으로부터 계산된 칼럼을 생성합니다.
이번 게시글은 Make(자동차 제조사)와 Model(모델명)의 평균 Length 칼럼을 생성하는 예제입니다.
새로운 칼럼을 생성하므로 [질의 빌더] > [새로운 계산된 칼럼] > [요약된 칼럼]을 선택합니다.
칼럼 이름을 avg_length로 설정하며, [요약] 의 드롭 다운 중 'AVG'를 선택합니다.
[질의 빌더]는 SQL 문의 형식을 지원하므로, SQL 함수를 차용해서 E.G의 GUI 화면에 구현하였습니다.
새로운 칼럼인 avg_length에 대한 값 설정을 한 후, [마침] 을 누르면 된다.
요약된 칼럼을 생성하게 되면, 새로운 칼럼을 기준으로 출력을 정렬하거나 그룹화 할 수 있습니다.
Make(제조사)와 Model(모델명)에 의한 평균 length가 궁금하므로, [그룹요약] 에 그룹화할 칼럼들을 선택합니다.
[실행] 버튼을 누르게 되면 아래와 같이 '출력 데이터'가 화면에 보여집니다.
[질의 빌더] > [작업 수정]을 통해서 다시 새로운 칼럼을 생성하거나 그룹화하여 다른 결과물을 출력할 수도 있습니다.
Available on demand!
Missed SAS Innovate Las Vegas? Watch all the action for free! View the keynotes, general sessions and 22 breakouts on demand.