이번 시간에 사용할 데이터는 baiting.sas7bdat 데이터로, 투신자살 소동을 구경 하러 몰린 군중들이 자살을 오히려 조롱하고 부추기는 현상(baiting)의 원인에 대해 연구하기 위해 수집된 데이터입니다. 데이터는 날씨 상태와 baiting 여부, 그리고 baiting현상이 일어난 횟수로 이루어져있습니다.
그림1 <데이터 셋>
Fisher의 정확 검정
우리는 날씨와 Baiting 현상 사이의 연관성을 알아보기위해 카이제곱검정을 시도해 볼 수 있습니다. 그러나 이전에 언급하지는 않았지만 표본의 개수가 적을 경우 카이제곱검정을 시도하는 것은 적절한 방법이 아닙니다. 일반적으로 모든 기대빈도가 5보다 클 경우 카이제곱검정을 사용하는 것이 적절하다고 알려져 있습니다. 이 경우 Fisher의 정확 검정을 사용합니다.
피셔의 정확 검정은 행(row)과 열(column)의 개수 같은 교차분석표에서 사용할 수 있습니다.
SAS Studio의 경우에 2x2 테이블의 경우 피셔의 정확 검정을 기본옵션으로 생성하고, 그보다 더 큰 테이블의 경우 옵션으로 제공하고있습니다.
그림2
그림3
이제곱 검정 결과를 보면 0.0436으로 날씨와 군중의 baiting 현상 사이의 연관성은 유의적이라고 결론 지은 것을 확인 할 수 있습니다. 표본의 수에 따라 두 검정에서 다른 결과를 얻을 수 있음을 확인하였습니다.
이번 시간에는 기대빈도가 적을 경우 범주형 자료 사이의 연관성을 검정하는 방법으로 Fisher의 정확 검정에 대하여 알아보았습니다. 감사합니다.
Reference
도서 - Essential Statistics Using SAS University Edition / Der, Geoff, Everitt, Brian S. / SASInstitute
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.