BookmarkSubscribeRSS Feed

[SAS 활용 노하우] One-Way ANOVA 가설검정

Started ‎04-23-2023 by
Modified ‎04-23-2023 by
Views 230

 

 

ANOVA의 F 값은 총변동, 군간변동 (집단 간의 분산)과 군내변동(집단내의 분산)으로 구성되어 있습니다.

 

image (8).png

 

 

총변동이란, 편차제곱의 합으로 각 값과 총변균의 편차를 제곱해서 모두 더한 값입니다. (총변동은 검정에서 사용하지 않습니다.)

군간변동은 오차의 효과가 없으면 각 집단 내의 값은 같아집니다. 검정통계량 F 값은 분자가 됩니다.

처리의 차이로 분산을 자유도 (= 집단 수 - 1)로 나눈 불편분산이 검정통계량의 분자입니다.

군내변동은 처리의 차이 이외의 영향으로 오차의 효과에 의해 생기는 편차제곱합을 의미합니다.

이걸 자유도로 나눈 불편분산이 검정통계량의 분모가 됩니다.

■ ANOVA 가설검정

ANOVA의 가설검정은 아래와 같습니다.

귀무가설 H0 : 그룹 간의 모평균에는 차이가 없다.

대립가설 H1 : 그룹 간의 모평균에는 차이가 있다.

 

f-table (1).jpg

 https://www.statisticshowto.com/probability-and-statistics/f-statistic-value-test/#google_vignette 

 

 

검정통계량 > 한계값 (P값 < a )면 귀무가설을 기가하고 대립가설을 채택합니다.

SASHELP의 CARS 데이터를 활용해서 ANOVA 가설검정을 수행하는 계시를 보여드리려고 합니다.

 

image (9).png

 

 

PROC ANOVA DATA=SASHELP.CARS;
CLASS Type;
MODEL MSRP = Type;
MEANS Type / TUKEY;
RUN;

 

 

차량유형(Make) 에 따른 가격(MSRP)의 차이를 검정합니다.

CLASS 문을 사용해서 차량 유형(Type) 변수를 범주형 변수로 설정합니다.

MODEL MSRP = TYPE 으로 가격(MSRP)을 차량유형(TYPE) 변수로 모델링을 합니다.

MEANS TYPE / TUKEY 문을 사용해서 차량유형에 따른 평균과 TUKEY 다중비교를 수행합니다.

 

 

 

image (10).png

 

 

 

 

 

위 결과를 해석하자면,

MODEL은 TYPE(가격) 변수가 MSRP(차량 유형)변수를 예측하는데 얼마나 설명력을 가지는지를 나타납니다.

ERROR는 MODEL 에서 설명하지 못한 나머지 변동성입니다.

Pr > F는 F-Value 가 통계적으로 유의미한지를 검정하는 P-Value < 0.0001 는 Type(가격) 변수가 MSRP(차량 유형)변수의 변동성을 설명하는데 유의미한 변수를 나타낸다.

즉, 차량 유형에 따른 가격의 차이가 있다라고 설명할 수 있습니다.

 

Version history
Last update:
‎04-23-2023 10:53 AM
Updated by:
Contributors

SAS INNOVATE 2024

Innovate_SAS_Blue.png

Registration is open! SAS is returning to Vegas for an AI and analytics experience like no other! Whether you're an executive, manager, end user or SAS partner, SAS Innovate is designed for everyone on your team. Register for just $495 by 12/31/2023.

If you are interested in speaking, there is still time to submit a session idea. More details are posted on the website. 

Register now!

Article Tags