■ 분산분석
어떠한 속성이 서로 다른 조건을 가지고 있는 경우 표본 간의 어떤 차이가 있는지에 대해서 알아보기 위해서 통계량의 종류에 따라 다양한 검정을 실시할 수 있습니다.
그 중 서로 다른 그룹의 평균의 분산값을 비교하는데 사용되는 것이 분산분석입니다.
분산분석 중 t 검정에 대해서 알아보려 합니다.
■ t 검정
t 검정이란 모평균 또는 모비율을 검정하거나 두 모평군의 차이를 검정하고자 할 때 사용합니다.
모평균, 모비율을 검정하기 위해서는 t 검정뿐만 아니라 Z검정을 사용하기도 합니다 .
■ t 검정과 Z 검정의 차이
Z검정은 모집단의 분산(모분산)을 알고 있는 경우에 사용하고, t 검정은 모집단의 분산을 모르는 경우에 사용합니다.
대부분 모집단의 분산을 알 수 없는 경우가 많아서 t 검정을 사용합니다
■ t 검정의 종류
t 검정의 종류는 3 종류가 있습니다.
1) 일표본 검정 (=단일 표본; One Sample t-Test)
2) 이표본 검정 (= 독립표본 t 검정; Two Sample t-Test)
3) 쌍체 검정 (=Paired t-Test)
■ t 검정 - 일표본 검정
one sample test는 '관측된 한 개의 표본 통계량'을 이미 알고 있는 '특정 통계량(=평균이나 분산, 비율 등)과 비교한 다음 모집단에서도 다른지 어떤지 확률적으로 판정하는 방법입니다.
즉, 모집단의 평균이 임의의 설정된 값과 동일한지 비교하는 경우에는 단일 표본 t-검정 방법을 사용합니다.
■ t 검정 - 일표번 검정 예시
사용된 데이터는 SASHELP 의 PRDSALE 데이터로 국가별로 소파의 매년 분기별 판매액의 실제값(Actual)과 예측값(Predict)를 나타낸 데이터입니다.
t 검정에서 작업역할에서 [분석변수]는 Analysis Variables로 단일표본 t 검정을 통해 분석되는 변수입니다.
귀무가설의 검정값으로 500으로 설정하고, 신뢰수준은 95%를 디폴트로 설정됩니다.
결과는 다음과 같습니다.
위의 결과에서 확인할 수 있듯이 표본평균은 507.2, 분산은 287.0, 유의확률은 0.34로 유의수준 0.05 보다 크므로 귀무가설을 기각할 수 없습니다.
신뢰수준 95% 하에서 판매액의 실제값은 500($)이라고 할 수 있습니다.
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.