1-7. Statistics의 소개: 가설검정(1)
안녕하세요^^
이번 시간에는 가설검정에 대한 이론과 오류(제 1종오류, 제2종 오류), P-값 등 통계적인 이론에 대해 공부해보도록 하겠습니다.
1) 가설검정
우리가 표본자료를 모으는 이유 중 하나는 이 표본이 모집단에 대해 세운 특정 가설에 반하는 증거를 얼마나 제공하고 있는지 평가하기 위한 것입니다.
자료에 대한 기술통계량을 통해, 자료가 가설을 지지하는 경향이 있는지, 반박하는 경향이 있는지는 어느정도 파악이 가능하지만, 이러한 경향성이 우연한 결과인지 실제 자료의 변동에 기인한 것인지는 구별할 수 없습니다.
따라서, 가설검정을 실시하고, 특정 가설이 틀렸다고 볼 수 있는 수치적인 증거를 찾아냅니다.
[ 가설검정 절차 ] 1. 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)를 설정합니다. 2. 표본으로부터 귀무가설에 해당하는 검정통계량(test statistic)을 계산합니다. 3. 검정통계량 값을 이미 알려진 확률분포의 값과 비교합니다. 4. p-값을 해석하고 결론을 내립니다. |
- 귀무가설(Null hypothesis): 현재 사실이라고 믿어지는 가설
- 대립가설(Alternative hypothesis): 연구하고자 하는 이론과 직접적인 관련이 있는 가설
- 검정통계량(test statistic): 귀무가설이 맞지 않다는 증거를 자료가 얼마나 반영해주고 있는지 알려주는 척도
가설검정의 절차에 대해 간략하게 소개했습니다. 더 자세한 내용은 다음 시간의 강의에서 추가적으로 설명하겠습니다.
2) 오류 & 검정력 & P-값
Type1error(제 1종오류)는 귀무가설이 사실인데, 귀무가설을 기각하는 실수를 범하는 것으로, 실제로 효과가 없는데 효과가 있다고 결론을 내리게 되는 오류입니다.
이는 때때로 significance level(유의수준)이라고 부릅니다.
또한, type2error(제 2종오류)는 귀무가설이 거짓인데도 귀무가설을 채택하는 실수를 범하는 것으로, 실제로 효과가 존재하는데 효과가 없다고 결론을 내리는 오류입니다.
오류는 주의를 기울여야하는 사항이며, 가설검정에 있어서 중요한 개념인 검정력에 대해 알아보도록 하겠습니다.
가설검정에서는 검정력(power)이 매우 중요합니다. 이는 거짓인 귀무가설을 기각하게 되는 확률인데, 검정력의 크기가 실제 처리효과를 통계적으로 유의하다고 탐지해낼 수 있는 가능성입니다.
검정력이 100%라면 가설검정에서 실제 효과가 있는 처리가 유의하다고 오류없이 100% 정확하게 판단할 수 있습니다.
하지만, 검정력을 100%로 만드는 것은 어렵기 때문에, 오류를 범할 가능성을 최소한으로 하는 가설검정을 실시해야 합니다.
가설검정에서 검정력만큼 중요한 개념이 p-value입니다.
p-value는 귀무가설이 사실인 경우에 현재의 결과 혹은 더 극단적인 결과들이 얻어지게 되는 확률입니다.
이 값은 확률분포의 면적 중 표본으로부터 얻어진 검정통계량 값에 해당하는 양쪽 (단측검정의 경우는 한쪽) 면적을 말하며, SAS에서는 자동적으로 양쪽 꼬리면적의 P-값을 제공합니다.
읽어주셔서 감사합니다.
다음 시간에는 가설검정 절차에 따른 검정 과정과 PROC TTEST 프로시저를 사용하여 가설검정을 하는 방법에 대해 공부해보도록 하겠습니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.