BookmarkSubscribeRSS Feed

[SAS 활용 노하우] One-Way ANOVA 가설검정

Started ‎04-23-2023 by
Modified ‎04-23-2023 by
Views 554

 

 

ANOVA의 F 값은 총변동, 군간변동 (집단 간의 분산)과 군내변동(집단내의 분산)으로 구성되어 있습니다.

 

image (8).png

 

 

총변동이란, 편차제곱의 합으로 각 값과 총변균의 편차를 제곱해서 모두 더한 값입니다. (총변동은 검정에서 사용하지 않습니다.)

군간변동은 오차의 효과가 없으면 각 집단 내의 값은 같아집니다. 검정통계량 F 값은 분자가 됩니다.

처리의 차이로 분산을 자유도 (= 집단 수 - 1)로 나눈 불편분산이 검정통계량의 분자입니다.

군내변동은 처리의 차이 이외의 영향으로 오차의 효과에 의해 생기는 편차제곱합을 의미합니다.

이걸 자유도로 나눈 불편분산이 검정통계량의 분모가 됩니다.

■ ANOVA 가설검정

ANOVA의 가설검정은 아래와 같습니다.

귀무가설 H0 : 그룹 간의 모평균에는 차이가 없다.

대립가설 H1 : 그룹 간의 모평균에는 차이가 있다.

 

f-table (1).jpg

 https://www.statisticshowto.com/probability-and-statistics/f-statistic-value-test/#google_vignette 

 

 

검정통계량 > 한계값 (P값 < a )면 귀무가설을 기가하고 대립가설을 채택합니다.

SASHELP의 CARS 데이터를 활용해서 ANOVA 가설검정을 수행하는 계시를 보여드리려고 합니다.

 

image (9).png

 

 

PROC ANOVA DATA=SASHELP.CARS;
CLASS Type;
MODEL MSRP = Type;
MEANS Type / TUKEY;
RUN;

 

 

차량유형(Make) 에 따른 가격(MSRP)의 차이를 검정합니다.

CLASS 문을 사용해서 차량 유형(Type) 변수를 범주형 변수로 설정합니다.

MODEL MSRP = TYPE 으로 가격(MSRP)을 차량유형(TYPE) 변수로 모델링을 합니다.

MEANS TYPE / TUKEY 문을 사용해서 차량유형에 따른 평균과 TUKEY 다중비교를 수행합니다.

 

 

 

image (10).png

 

 

 

 

 

위 결과를 해석하자면,

MODEL은 TYPE(가격) 변수가 MSRP(차량 유형)변수를 예측하는데 얼마나 설명력을 가지는지를 나타납니다.

ERROR는 MODEL 에서 설명하지 못한 나머지 변동성입니다.

Pr > F는 F-Value 가 통계적으로 유의미한지를 검정하는 P-Value < 0.0001 는 Type(가격) 변수가 MSRP(차량 유형)변수의 변동성을 설명하는데 유의미한 변수를 나타낸다.

즉, 차량 유형에 따른 가격의 차이가 있다라고 설명할 수 있습니다.

 

Version history
Last update:
‎04-23-2023 10:53 AM
Updated by:
Contributors

SAS Innovate 2025: Call for Content

Are you ready for the spotlight? We're accepting content ideas for SAS Innovate 2025 to be held May 6-9 in Orlando, FL. The call is open until September 25. Read more here about why you should contribute and what is in it for you!

Submit your idea!

Article Tags