[BASE SAS기초] Validating and Cleaning Data(2)
안녕하세요^^
오늘은 Validating and Cleaning Data의 두 번째 시간으로,
PROC PRINT와 PROC FREQ에 대해 알아보도록 하겠습니다
PROC PRINT 프로시저의 일반적인 포맷은 아래와 같습니다.
PROC PRINT DATA=SAS-data-set; VAR variable(s); |
PROC PRINT 프로시저에서 var 문장이나 where문장을 사용하면 invalid value인 관측값의 report를 작성할 수 있습니다.
예를 들면, 특정한 변수가 결측값을 갖는다는 정보를 포함한 report를 작성할 수 있습니다.
PROC FREQ를 이용하여 변수의 빈도표(one-way부터 n-way까지 모두 가능)를 작성할 수 있습니다.
PROC FREQ의 일반적인 포맷은 아래와 같습니다.
PROC FREQ DATA=SAS-data-set ; |
PROC FREQ의 TABLES문장은 만들 테이블의 빈도표의 변수를 지정해주는 것이며,
PROC FREQ프로시저를 통해서 변수 값으로 나올 수 없는 값이 있는지 확인할 수 있습니다.
만약, 위의 예제처럼 SEX에 Female과 Male만 있으면 valid한 데이터지만, 그 외의 다른 변수값이 포함되어있다면 invalid한 데이터가 됩니다.
이러한 경우 PROC FREQ프로시저를 통해 report를 작성해봄으로써 invalid data가 존재하는지 확인할 수 있습니다.
이상 data validating을 확인하는 PROC PRINT와 PROC FREQ에 대해 알아보았습니다.
다음시간에는 PROC MEANS와 PROC UNIVARIATE에 대해 알아보겠습니다~
감사합니다^^
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.