안녕하세요. 이번 시간에는 일원분산분석(One-way ANOVA)에 대하여 알아보겠습니다.
이번 시간에 사용할 데이터는 teaching데이터셋으로, 교육방법에 따라 성적에 차이가 있는지 알아보기 위해 학생들을 랜덤하게 다섯 그룹으로 나누어 다른 교육방법으로 교육하고, 최종 성적을 수집하였습니다.
일원분산분석(one-way ANOVA)
위의 문제 같은 요인이 1개인 실험계획을 one-way design이라고 합니다. 이런 계획에서 주요 관심사는 하나의 요인변수(교육방법)이 반응변수(시험 성적)에 끼치는 효과입니다. 요인의 효과를 알아보기 위하여 요인수준에 따라 반응변수의 평균에 차이가 있을까? 즉, 아래와 같은 귀무가설에 대한 검정을 수행합니다.
평균을 동시에 비교하는 방법으로 가장 적절한 방법은 변동을 비교하는 분산분석입니다. 총 변동(SST)을 요인에 의한 변동(SSR)과 통제할 수 없는 요인들에 의해 생긴 변동(SSE)로 분해하여 변동들을 비교합니다. 귀무가설이 사실일 경우, 요인의 수준에 따른 변동이 적어 SSR값이 SSE값에 비해 작을 것입니다. 따라서 아래와 같은 검정통계량을 이용하여 F-test를 수행합니다.
아래 절차에 따라 SASstudio에서 일원분산분석을 수행해보겠습니다.
1. 작업 ▶ 통계량 ▶ 일원분산분석 클릭
2. 데이터 ▶ sasue.waves를 테이블 선택
3. 역할 ▶ result을 종속변수로 method를 범주변수로 지정
4. 실행 클릭
<그림 1>
<그림 2>
결과를 해석해보겠습니다. 유의확률은 <.0001로 매우 작은 값을 가집니다. 따라서 교육방법에 따른 시험성적의 차이가 유의하다고 결론지을 수 있습니다. 귀무가설이 기각되어 교육방법이 시험 성적에 강력한 영향을 준다고 결론이 서면, 정확하게 어떤 교육방법 종류 간의 차이 때문에 가설이 기각 되었는가 각 요인 수준별 평균값들 간의 차이에 대한 검정을 수행하게 됩니다. 이를 다중비교라고 하고 SASstudio에서는 기본 옵션으로 tukey 방법을 이용한 다중비교 결과가 출력됩니다. 그 결과 방법1은 방법3과 유의하게 차이를 보이고 방법2는 방법3, 방법4와 유의한 차이를 보입니다. 방법3은 방법5와, 방법 4는 방법5와 유의한 차이를 보입니다. 결론적으로 (방법3, 방법4) (방법1, 방법2, 방법5)의 두 군으로 분리할 수 있게 됩니다.
이번시간에는 요인이 1개일 때 요인 수준에 따른 반응변수의 평균간의 차이에 대하여 검정하는 방법인 일원분산분석에 대하여 알아보았습니다. 감사합니다.
Reference
도서 - Essential Statistics Using SAS University Edition / Der, Geoff, Everitt, Brian S. / SASInstitute
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.