데이터를 분석하고 리포팅을 출력해서 결과를 쉽고 빠르게 가시적으로 볼 수 있습니다.
기초 통계량 등 다양한 리포트 형태를 알아보려 합니다.
리포트를 생성하기 위해, SASHELP에 있는PRDSALE데이터를 사용합니다.
PRDSALE은 범주형인 국가(Country), 지역(Region), 부서(Division), 제품유형(Prodtype), 제품(Product)에 대한 빈도 데이터와 분기(Quarter), 년(Year), 실제값(Actual), 예측값(Predict) 수치 자료 데이터가 있습니다.
리포트를 통해서 전체 개수, 결측값의 수, 전체합, 최소/최대/평균 값, 중위수, 표준오차 등의 요약통계량을 확인할 수 있습니다.
● 데이터 특성화
[작업 및 유틸리티] - [데이터 특성화] - [실행]을 클릭한다.
데이터 특성화는 데이터의 요약 리포트, 그래프, 빈도, 일변량을 생성합니다.
[사용자 정의 특성화]에서 [범주변수]에 PRDSALE데이터에 범주형 변수인 Country, Region, Division, PrdType, Product를 넣습니다.
그 결과, 각 데이터에 대한 빈도분석을 시각적으로 확인할 수 있습니다.
여기서 범주형 데이터의 값은 최대 개수가 30개로 한정되어 있습니다.
● 데이터 리스트
데이터 리스트는 가장 기본적인 작업으로 특정 테이블의 행 내용을 그대로 출력합니다.
특정 테이블의 행을 그대로 리포팅 작업을 할 때 유용하게 사용됩니다. 예를 들면, 특정 변수를 기준으로 데이터를 그루핑, 중간 합 및 전체 합을 결과에 포함시킵니다.
데이터 리스트 알아보기 위해서 사용할 데이터는 SASHELP에 PRICEDATA를 활용합니다.
[데이터 리스트]를 더블클릭하여 리스트 리포트 창을 생성합니다.
실습에서 카테고리 아이디어에 따른 ProductName, Price를 출력하는 리포트를 만들어봅니다.
<변수 리스트>는 리포트에 출력할 변수를 선택합니다. 나열된 순서대로 변수를 출력합니다.
<그룹 분석 기준>은 그룹별로 분석할 변수를 선택합니다. 하나 이상의 변수를 선택하면 그 변수를 기준으로 테이블이 정렬되고, 변수의 각 개별 값, By 그룹에 대한 리스트가 생성됩니다.
<합 계산 변수>에는 카테고리별로 부분합을 구할 수 있습니다. 합을 산출할 칼럼만을 할당해야 하므로 숫자형의 변수만 선택해야 합니다.
<식별 레이블>은 그룹분석 변수를 그룹당 한번만 표기할 수 있습니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.