BookmarkSubscribeRSS Feed

[BASE SAS기초] Validating and Cleaning Data(3)

Started ‎06-15-2020 by
Modified ‎06-15-2020 by
Views 176

[BASE SAS기초] Validating and Cleaning Data(3)

 

안녕하세요^^

오늘은 Validating and Cleaning Data의 세 번째 시간으로,

Proc means와 proc univariate에 대해 알아보도록 하겠습니다.

 

  1.     PROC MEANS

PROC MEANS DATA=SAS-data-set ;
VAR variable(s);
RUN;

 

PROC MEANS 프로시저는 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.

1.PNG

 

 

위의 결과처럼, PROC MEANS는 Default로 N, MEAN, STDDEV, MIN, MAX의 기술통계량을 보여줍니다.

 

-       N: 결측이 아닌 값의 개수

 -       MEAN: 평균

 -       STDDEV: 표준편차

 -       MIN: 최소값

 -       MAX: 최대값

 

참고로, N, NMISS(결측값 개수), MIN, MAX는 Validating data를 판단하는 유용한 기술통계량입니다.

 

2.PNG

 


 

 

2.    PROC UNIVARIATE

 

PROC UNIVARIATE DATA=SAS-data-set NEXTROBS=n;
VAR variable(s);
RUN;

 

 

PROC UNIVARIATE 프로시저 또한

PROC MEANS 프로시저처럼 기술통계량을 보여주는 요약된 REPORT를 만드는 문장입니다.​

 

위의 PROC MEANS 예제와 마찬가지로,

​변수 값이 특정 범위 안에 존재해야 하는 경우, 실제 데이터 값이 범위 안에 존재하는지를 확인할 수 있습니다.

3.PNG

 

​PROC UNIVARIATE는

적률, 기본통계측도, 위치모수 검정, 분위수, 극관측치, 결측값에 대한 결과값을 얻을 수 있는데,

​이 중 Validating data에 유용한 결과는 극관측치와 결측값입니다.

 

이상 data validating을 확인하는 PROC MEANS와 PROC UNIVARIATE에 대해 알아보았습니다.

다음시간에는 Cleaning Invalid Data에 대해 알아보겠습니다.

읽어주셔서 감사합니다^^​

Version history
Last update:
‎06-15-2020 09:26 PM
Updated by:
Contributors

hackathon24-white-horiz.png

The 2025 SAS Hackathon Kicks Off on June 11!

Watch the live Hackathon Kickoff to get all the essential information about the SAS Hackathon—including how to join, how to participate, and expert tips for success.

YouTube LinkedIn

Article Labels
Article Tags