[BASE SAS기초] Validating and Cleaning Data(3)
안녕하세요^^
오늘은 Validating and Cleaning Data의 세 번째 시간으로,
Proc means와 proc univariate에 대해 알아보도록 하겠습니다.
PROC MEANS DATA=SAS-data-set ; |
PROC MEANS 프로시저는 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.
위의 결과처럼, PROC MEANS는 Default로 N, MEAN, STDDEV, MIN, MAX의 기술통계량을 보여줍니다.
- N: 결측이 아닌 값의 개수
- MEAN: 평균
- STDDEV: 표준편차
- MIN: 최소값
- MAX: 최대값
참고로, N, NMISS(결측값 개수), MIN, MAX는 Validating data를 판단하는 유용한 기술통계량입니다.
2. PROC UNIVARIATE
PROC UNIVARIATE DATA=SAS-data-set NEXTROBS=n; |
PROC UNIVARIATE 프로시저 또한
PROC MEANS 프로시저처럼 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.
위의 PROC MEANS 예제와 마찬가지로,
변수 값이 특정 범위 안에 존재해야 하는 경우, 실제 데이터 값이 범위 안에 존재하는지를 확인할 수 있습니다.
PROC UNIVARIATE는
적률, 기본통계측도, 위치모수 검정, 분위수, 극관측치, 결측값에 대한 결과값을 얻을 수 있는데,
이 중 Validating data에 유용한 결과는 극관측치와 결측값입니다.
이상 data validating을 확인하는 PROC MEANS와 PROC UNIVARIATE에 대해 알아보았습니다.
다음시간에는 Cleaning Invalid Data에 대해 알아보겠습니다.
읽어주셔서 감사합니다^^
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!