[SAS 활용 노하우] 빈도표 - PROC FREQ
Article Options
- Article History
- RSS Feed
- Mark as New
- Mark as Read
- Bookmark
- Subscribe
- Printer Friendly Page
- Report Inappropriate Content
Views
4,979
빈도표란, Frequency Tables로 통계 및 데이터 분석에서 데이터 값의 발생 빈도를 요약하는 표이다.
데이터 집값의 각 값이 얼마나 자주 나타나는지를 보여줘 데이터의 분포와 특성을 파악할 수 있습니다.
어떤 변수가 가지는 분포 상의 특징이나 두 변수 간의 연관관계를 알 수 있고, 일차원 또는 다차원 빈도표와 변수들간의 상호연관성을 재는 측도들을 제공해서 각 변수값들의 분포와 연관성에 대한 정보를 요약해줍니다.
■ PROC FREQ syntax
PROC FREQ DATA = data-set OPTIONS;
BY variables;
EXACT statistics-keywords / OPTIONS;
OUTPUT statistics-keywords OUT=SAS-data set;
TABLES requests / options;
TEST statistics-keywords;
WEIGHT variable;
RUN;
간단한 예시로는 dmnn라이브러리에 있는 피자 데이터 중 brand라는 변수의 빈도표를 작성해보겠습니다.
Pizza 데이터는 a~j 까지 10개의 브랜드가 얼마나 분포되어 있는가 확인할 수 있습니다.
proc freq data = dmnn.pizza;
tables brand;
run;
TABLES statement 으로 여러 개의 빈도표 형식을 지정할 수 있습니다.
아래의 예시는 변수 TYPE과 ORIGIN의 각 수준에 대한 2차원 빈도표입니다.
PROC FREQ DATA = SASHELP.CARS;
TABLES TYPE*ORIGIN;
RUN;
PROC FREQ의 TABLES 명령문에는 NOCOL 또는 NOROW, NOPERCENT 옵션을 사용할 수 있다.
-
NOCOL: 열 퍼센트 출력 하지 않음
-
NOROW: 행퍼샌트 출력 하지 않음
-
NOPERCENT: 각 칸의 퍼센트를 출력하지 않음
PROC FREQ DATA = SASHELP.CARS;
TABLES TYPE*ORIGIN / NOCOL NOPERCENT;
RUN;
NOCOL 옵션과 NOPERCENT 옵션을 사용해서 열퍼센트를 출력하지 않고, 각 칸의 퍼센트를 출력하지 않았다.