[SQL 3-2] Summarizing Data 1 (자료/데이터 요약하기)
안녕하세요^^
이번 시간에는 요약 코드(summary queris)를 생성하는 함수에 대해서 살펴보겠습니다.
▶ 첫 번째 Business Scenario는, 각 직원에 대해 일년의 총 기부액을 계산하는 것입니다.
▷ 행으로 합하기
사용할 자료는 다음과 같습니다.
자료는 5명의 직원에 대해 사번과 4개의 분기별 기부금액 변수를 포함하고 있습니다.
각 사원 별 총 기부금액을 계산하기 위해 sum함수를 사용해보겠습니다.
결과를 보시면 각 사원에 대해, 4개의 분기 기부금액이 더해진 것을 확인할 수 있습니다.
▶ 두 번째 Business Scenario는, 직원들의 1분기 총 기부금액을 구하는 것입니다.
▷ 열로 합하기
1분기의 총 기부금액을 구하기 위해서는 두 가지 방법이 있습니다.
(1) Proc sql에서 sum함수 사용하기
(2) Proc means 사용하기
두 방법 모두 같은 결과를 얻는 것을 확인할 수 있습니다.
★★★ Tip ★★★
PROC SQL에서 summary 함수는 함수 요소로 나열되는 변수 개수에 의존합니다.
예를 들어 2개 이상의 변수를 나열하면 행에 대해 요약한 값을 반출하고,
함수의 요소로 하나의 변수만을 기입한다면, 해당 변수(열)에 대해 요약한 값을 반출합니다.
▶ 세 번째 Business Scenario는, 직원들의 수를 구하는 것입니다..
▷ 행 수 세기
직원들의 수를 계산하기 위해 count함수를 사용해보겠습니다.
위 코드에서 count 함수의 구성요소로 *를 코딩하게 되면 dataset의 모든 행 수를 세어줍니다.
만일 하나의 변수명을 기입한다면, 해당 변수의 결측이 아닌 관측값에 해당하는 행의 수를 세어주게 되는데요.
이를 확인하기 위해 자료를 변형하여 실습해보도록 하겠습니다.
기존 데이터셋에서 세 번째 직원의 사번을 결측값으로 변경하였습니다.
Employee_donations_2 데이터셋의 사번 변수를 count 함수를 사용하여 직원 수를 계산해보겠습니다.
결과를 보면 결측값을 제외한 직원 수인 ‘4’를 반환한 것을 확인할 수 있습니다.
이상 요약값 생성하는 함수에 대해 살펴보았습니다.
감사합니다 ^^
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.