1-8. Statistics의 소개: 가설검정(2)
안녕하세요^^
이번 시간에는 지난 시간 가설검정에 대한 이론에 이어 SAS를 활용하여 가설검정을 하는 코딩에 대해 알아보도록 하겠습니다.
먼저, 귀무가설이 인 가설검정을 실시해봅시다.
SAS는 Student’s t 통계량 값인를 계산합니다.
이 때, 함께 제공하는 p-value를 통해 귀무가설을 기각할지를 결정하게 됩니다.
(단, sample means의 분포가 정규분포를 따를 때, 이 결과가 타당하다고 할 수 있습니다.)
이제, T-TEST를 하는 코딩에 대해 알아보도록 하겠습니다.
T-TEST는 PROC TTEST 프로시저를 사용합니다.
PROC TTEST DATA=SAS-data-set;
CLASS variable; PAIRED variables; VAR variables;
RUN; |
이 프로시저를 통해, 단일표본, 짝진 표본, 독립표본의 t-test와 신뢰구간을 계산할 수 있습니다.
또한, 히스토그림, Q-Q plot, box plot, confidence limit plots을 함께 제공합니다.
- CLASS 문장에는 분석에서 2개의 수준을 갖는 변수를 지정합니다. 만약 단일표본이라면, CLASS문장 없이 수행합니다.
- PAIRED 문장에는 짝진 표본일 때의 변수를 지정합니다. 변수는 하나 이상을 지정할 수 있습니다.
- VAR 문장에는 수치형 자료(numeric)를 지정합니다. VAR문장이 지정되지 않으면, PROC TTEST 프로시저는 모든 numeric 변수들(CLASS문장에 지정된 변수를 제외한)에 대해 t-test를 시행합니다.
예를들어, 단일표본에서 t-test를 시행하는 proc univariate 프로시저와 proc ttest 프로시저를 코딩을 통해 가설검정 해보도록 하겠습니다.
위와 같은 time에 대한 자료를 코딩합니다. 귀무가설을 time=80으로 설정합니다.
======================================================================
Proc univariate
Proc univariate에서는 mu0 옵션으로 귀무가설을 설정할 수 있습니다.
Output 값으로 위와 같은 결과를 얻게 되는데, 부호와 부호 순위 값은 비모수방법이므로 정규가정이 만족하지 않을 때 사용하는 방법입니다.
따라서, 정규 가정을 만족한다면 스튜던트의 t값을 확인하시면 됩니다.
위의 결과로는, t값이 2.301이고 p-값이 0.0329이므로 유의수준 5%에서 귀무가설을 기각합니다. 따라서 time=80이라고 할 수 없습니다.
======================================================================
Proc ttest
Proc ttest에서는 h0 옵션으로 귀무가설을 설정할 수 있습니다.
이 옵션의 default는 h0=0입니다.
또한, plots(shownull)=interval 옵션은 평균의 신뢰구간 그림을 나타나게 하는 옵션입니다.
PROC TTEST의 output은 위와 같습니다.
기술통계량 값을 먼저 제공하고, sample mean의 신뢰구간과 standard deviation을 함께 제공합니다.
다음으로 제공하는 값인 t 통계량 값은 2.3이며 p-값은 0.0329로 유의수준 5%하에서 귀무가설을 기각합니다.
이는 위에서 proc univariate를 통해 얻은 결과와 같은 결과임을 알 수 있습니다.
다음으로 얻게 되는 결과는 히스토그램입니다. Normal과 kernel density 곡선이 함께 나타나며, 95% 신뢰구간이 함께 나타난 box plot도 함께 제공합니다.
95%신뢰구간 그림도 함께 제공하며,
정규가정을 만족하는지 확인할 수 있는 q-q plot도 함께 제공합니다. 위의 경우, 관측치들이 45도 선을 따르는 것을 확인할 수 있으므로, 정규가정을 만족한다고 할 수 있습니다.
이상, one- sample t-test에 대해 알아보았습니다.
다음 시간에는, two- sample t-test와 paired t-test에 대해 순서대로 알아보도록 하겠습니다~
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.