1-10 Statistics의 소개: 가설검정(4)
안녕하세요~
이번 시간에는 가설검정 마지막인 Paired t-test(짝비교)를 해보겠습니다.
Paired t-test는 동일한 대상이 실험 전과 실험 후의 차이로 t검정을 함으로써 가해진 처리나 실험이 효과가 있는지를 판단할 때 사용합니다.
처리 전과 후의 차이를 D(difference)라고 합니다. 귀무가설은 '실험(처리)의 효과가 없다.'.
즉, H0: D=0 이 됩니다.
Paired t-test를 할 때 사용되는 t통계량은 다음과 같습니다.
간단한 자료로 Paired t-test를 해보겠습니다.
다음과 같이 자료를 입력합니다. (CONTROL은 처리 전, TREATMENT는 처리 후)
======================================================================
Proc ttest
Paired t-test를 할 때는 PAIRED 문장에 두 변수를 써줍니다. (PAIRED var1*var2)
입력 후 실행하면 아래와 같은 결과를 얻을 수 있습니다.
두 변수의 차가 Difference(D)이고 D의 수, 평균, 표준편차, 표준오차, 최댓값, 최소값 등 기술통계량이 제공됩니다.
그리고 D값으로 계산한 t통계량이 나옵니다.
위 자료의 t=-4.35, p-value = 0.0074로 유의수준 5%에서 귀무가설을 기각합니다. 따라서 실험(처리)의 효과가 없다는 귀무가설을 기각합니다.
검정을 통해 실험체에 가해진 실험 또는 처리의 효과가 유의하다는 것을 알 수 있습니다.
위 그림을 확인해보면 처리 전과 처리 후의 차이의 Normal과 Kernel 곡선과 함께 분포가 나와 있습니다. 95% 신뢰구간과 box plot 또한 확인할 수 있습니다.
위 그림은 각 관측치의 처리 전 값과 처리 후 값을 직선으로 이어놓은 그래프입니다. 평균적으로 얼마나 차이가 나는지 평균 직선도 확인할 수 있습니다.
마지막 그림은 큰 원은 각 변수의 평균을 나타내고 작은 원은 (처리 전, 처리 후)의 순서쌍을 표시해 놨습니다.
가운데에 있는 45도 대각선은 '처리 전 = 처리 후'를 나타내는 직선입니다.
찍힌 점들이 이 대각선 위에 분포하는 것으로 보아 실험(처리) 후 반응 값이 실험 전보다 증가한다는 것을 알 수 있습니다.
이로써 Paired t-test까지 가설검정을 해보았습니다.
다음 시간에는 분산분석에 대해 알아보겠습니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.