BookmarkSubscribeRSS Feed

[BASE SAS기초] Validating and Cleaning Data(3)

Started ‎06-15-2020 by
Modified ‎06-15-2020 by
Views 125

[BASE SAS기초] Validating and Cleaning Data(3)

 

안녕하세요^^

오늘은 Validating and Cleaning Data의 세 번째 시간으로,

Proc means와 proc univariate에 대해 알아보도록 하겠습니다.

 

  1.     PROC MEANS

PROC MEANS DATA=SAS-data-set ;
VAR variable(s);
RUN;

 

PROC MEANS 프로시저는 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.

1.PNG

 

 

위의 결과처럼, PROC MEANS는 Default로 N, MEAN, STDDEV, MIN, MAX의 기술통계량을 보여줍니다.

 

-       N: 결측이 아닌 값의 개수

 -       MEAN: 평균

 -       STDDEV: 표준편차

 -       MIN: 최소값

 -       MAX: 최대값

 

참고로, N, NMISS(결측값 개수), MIN, MAX는 Validating data를 판단하는 유용한 기술통계량입니다.

 

2.PNG

 


 

 

2.    PROC UNIVARIATE

 

PROC UNIVARIATE DATA=SAS-data-set NEXTROBS=n;
VAR variable(s);
RUN;

 

 

PROC UNIVARIATE 프로시저 또한

PROC MEANS 프로시저처럼 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.​

 

위의 PROC MEANS 예제와 마찬가지로,

​변수 값이 특정 범위 안에 존재해야 하는 경우, 실제 데이터 값이 범위 안에 존재하는지를 확인할 수 있습니다.

3.PNG

 

​PROC UNIVARIATE는

적률, 기본통계측도, 위치모수 검정, 분위수, 극관측치, 결측값에 대한 결과값을 얻을 수 있는데,

​이 중 Validating data에 유용한 결과는 극관측치와 결측값입니다.

 

이상 data validating을 확인하는 PROC MEANS와 PROC UNIVARIATE에 대해 알아보았습니다.

다음시간에는 Cleaning Invalid Data에 대해 알아보겠습니다.

읽어주셔서 감사합니다^^​

Version history
Last update:
‎06-15-2020 09:26 PM
Updated by:
Contributors

SAS Innovate 2025: Register Now

Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!

Article Labels
Article Tags