BookmarkSubscribeRSS Feed

[BASE SAS기초] Validating and Cleaning Data(2)

Started ‎06-15-2020 by
Modified ‎06-15-2020 by
Views 81

[BASE SAS기초] Validating and Cleaning Data(2)

안녕하세요^^

오늘은 Validating and Cleaning Data의 두 번째 시간으로,

​PROC PRINT와 PROC FREQ에 대해 알아보도록 하겠습니다

  1.     PROC PRINT

PROC PRINT 프로시저의 일반적인 포맷은 아래와 같습니다.

 PROC PRINT DATA=SAS-data-set;

VAR variable(s);
WHERE where-expression;
RUN;

 

PROC PRINT 프로시저에서 var 문장이나 where문장을 사용하면 invalid value인 관측값의 report를 작성할 수 있습니다.

​예를 들면, 특정한 변수가 결측값을 갖는다는 정보를 포함한 report를 작성할 수 있습니다.

 

1.PNG

 

 

  1.     PROC FREQ

PROC FREQ를 이용하여 변수의 빈도표(one-way부터 n-way까지 모두 가능)를 작성할 수 있습니다.

PROC FREQ의 일반적인 포맷은 아래와 같습니다.

 

 PROC FREQ DATA=SAS-data-set ;
TABLES variable(s) ;
RUN;

PROC FREQ의 TABLES문장은 만들 테이블의 빈도표의 변수를 지정해주는 것이며,

2.PNG

 

PROC FREQ프로시저를 통해서 변수 값으로 나올 수 없는 값이 있는지 확인할 수 있습니다.

​만약, 위의 예제처럼 SEX에 Female과 Male만 있으면 valid한 데이터지만, 그 외의 다른 변수값이 포함되어있다면 invalid한 데이터가 됩니다.

​이러한 경우 PROC FREQ프로시저를 통해 report를 작성해봄으로써 invalid data가 존재하는지 확인할 수 있습니다.

이상 data validating을 확인하는 PROC PRINT와 PROC FREQ에 대해 알아보았습니다.

다음시간에는 PROC MEANS와 PROC UNIVARIATE에 대해 알아보겠습니다~

감사합니다^^​​

​​

 

Version history
Last update:
‎06-15-2020 09:24 PM
Updated by:
Contributors

sas-innovate-wordmark-2025-midnight.png

Register Today!

Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.


Register now!

Article Labels
Article Tags