BookmarkSubscribeRSS Feed

1-8. Statistics의 소개: 가설검정(2)

Started ‎06-15-2020 by
Modified ‎06-16-2020 by
Views 165

1-8. Statistics의 소개: 가설검정(2)

안녕하세요^^

이번 시간에는 지난 시간 가설검정에 대한 이론에 이어 SAS를 활용하여 가설검정을 하는 코딩에 대해 알아보도록 하겠습니다.

​먼저, 귀무가설이SE22016031700572470.jpg 인 가설검정을 실시해봅시다.

SAS는 Student’s t 통계량 값인SE22016031700575770.jpg를 계산합니다.

 

이 때, 함께 제공하는 p-value를 통해 귀무가설을 기각할지를 결정하게 됩니다.

(단, sample means의 분포가 정규분포를 따를 때, 이 결과가 타당하다고 할 수 있습니다.)

​​

이제, T-TEST를 하는 코딩에 대해 알아보도록 하겠습니다.

T-TEST는 PROC TTEST 프로시저를 사용합니다.

 

PROC TTEST DATA=SAS-data-set;

 

CLASS variable;

PAIRED variables;

VAR variables;

 

RUN;

 

이 프로시저를 통해, 단일표본, 짝진 표본, 독립표본의 t-test와 신뢰구간을 계산할 수 있습니다.

​또한, 히스토그림, Q-Q plot, box plot, confidence limit plots을 함께 제공합니다.

- CLASS 문장에는 분석에서 2개의 수준을 갖는 변수를 지정합니다. 만약 단일표본이라면, CLASS문장 없이 수행합니다.

- PAIRED 문장에는 짝진 표본일 때의 변수를 지정합니다. 변수는 하나 이상을 지정할 수 있습니다.

​​- VAR 문장에는 수치형 자료(numeric)를 지정합니다. VAR문장이 지정되지 않으면, PROC TTEST 프로시저는 모든 numeric 변수들(CLASS문장에 지정된 변수를 제외한)에 대해 t-test를 시행합니다.

​​

​예를들어, 단일표본에서 t-test를 시행하는 proc univariate 프로시저와 proc ttest 프로시저를 코딩을 통해 가설검정 해보도록 하겠습니다.

SE22016031701023170.jpg

 

​위와 같은 time에 대한 자료를 코딩합니다. 귀무가설을 time=80으로 설정합니다.

 

======================================================================

Proc univariate

SE22016031701033870.jpg

 

Proc univariate에서는 mu0 옵션으로 귀무가설을 설정할 수 있습니다.

 

SE22016031701040170.jpg

 

Output 값으로 위와 같은 결과를 얻게 되는데, 부호와 부호 순위 값은 비모수방법이므로 정규가정이 만족하지 않을 때 사용하는 방법입니다.

​따라서, 정규 가정을 만족한다면 스튜던트의 t값을 확인하시면 됩니다.

위의 결과로는, t값이 2.301이고 p-값이 0.0329이므로 유의수준 5%에서 귀무가설을 기각합니다. 따라서 time=80이라고 할 수 없습니다.​

 

======================================================================

 

Proc ttest

 

SE22016031701043770.jpg

 

Proc ttest에서는 h0 옵션으로 귀무가설을 설정할 수 있습니다.

​이 옵션의 default는 h0=0입니다.

​또한, plots(shownull)=interval 옵션은 평균의 신뢰구간 그림을 나타나게 하는 옵션입니다.

 

SE22016031701050170.jpg

PROC TTEST의 output은 위와 같습니다.

​기술통계량 값을 먼저 제공하고, sample mean의 신뢰구간과 standard deviation을 함께 제공합니다.

​다음으로 제공하는 값인 t 통계량 값은 2.3이며 p-값은 0.0329로 유의수준 5%하에서 귀무가설을 기각합니다.

이는 위에서 proc univariate를 통해 얻은 결과와 같은 결과임을 알 수 있습니다.

 

 

SE22016031701054070.jpg

다음으로 얻게 되는 결과는 히스토그램입니다. Normal kernel density 곡선이 함께 나타나며, 95% 신뢰구간이 함께 나타난 box plot도 함께 제공합니다.

 

 

SE22016031701061070.jpg

95%신뢰구간 그림도 함께 제공하며,

 

SE22016031701062070.jpg

 정규가정을 만족하는지 확인할 수 있는 q-q plot도 함께 제공합니다. 위의 경우, 관측치들이 45도 선을 따르는 것을 확인할 수 있으므로, 정규가정을 만족한다고 할 수 있습니다.

 

 

 

​이상, one- sample t-test에 대해 알아보았습니다.

다음 시간에는, two- sample t-test와 paired t-test에 대해 순서대로 알아보도록 하겠습니다~​

Version history
Last update:
‎06-16-2020 04:24 AM
Updated by:
Contributors

sas-innovate-white.png

Special offer for SAS Communities members

Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.

 

View the full agenda.

Register now!

Article Labels
Article Tags