안녕하세요. 오늘은 대응 이표본 t-검정에 대해서 알아보겠습니다. 이번 시간에 사용할 데이터셋은 waves데이터입니다. 해상에서 파력으로 전기를 생산하는 장치에 대한 설계 연구에서 계류 방법의 선택이 굽힘 응력에 어떻게 영향을 미치지는 지 확인하기 위한 실험에서 측정된 데이터입니다. Waves 데이터셋은 state, method1, method2, difference를 변수로 가집니다. state는 각 실험의 해상 상태를 의미하는 id변수, method1과 2는 각 계류 방법을 선택했을 때 관측된 굽힘 응력, 그리고 difference는 method1과 method2의 차이를 기록한 변수입니다.
상자 도표
우리는 각 계류 방법에 굽힙 응력이 다른지 알아보기 위하여 먼저 아래 절차에 따라 각 계류 방법에 대한 굽힘 응력의 상자도표를 작성합니다.
1. 네비게이션 영역의 작업 및 유틸리티 ▶ 작업 ▶ 그래프 ▶ 상자도표 클릭
2. 데이터 ▶ sasue.waves를 테이블 선택
3. 역할 ▶ method1을 분석변수로 지정
4. 실행 클릭
5. 같은 방법으로 method2와 difference를 분석변수로 지정하여 상자도표 두번 더 그리기
그림1
그림2 <상자도표 (왼쪽) method2 상자도표(오른쪽)>
그림3 <상자도표>
18개의 관측치 만으로 그린 상자 도표로 데이터의 분포 특성에 대한 결론을 내리기는 어렵지만 데이터에 이상치가 있을 수 있으며 약간의 왜도가 있음을 암시합니다.
대응 이표본 t-검정(paired t-test)
표면적으로, 이 데이터는 앞서 우리가 다룬 widths 데이터와 매우 유사한 형식으로 보이지만, 더 면밀히 살펴보면관측 값이 쌍을 이루는 근본적인 차이가 있음을 알 수 있습니다. 두 계류 방법은 각각에 대한 굽힘 응력은 각 경우에 동일한 해상 상태에서의 실험에서 측정된 관측치 입니다. 즉, 서로 독립적이지 않습니다. 이러한 표본을 대응 이표본이라 하고, 이러한 표본에는 기존의 t-검정과는 다르게 대응 이표본 t-검정을 이용하여 두 집단의 평균 차이를 검정합니다. 귀무가설은 쌍을 이루는 관찰의 차이에 대한 모집단 평균은 0라는 것입니다. 아래 절차에 따라 t-검정을 진행해보겠습니다.
그림4
그림5 <검정 결과>
그림6 <검정 결과>
p-값은 0.38로 유의수준 0.05에서 귀무가설을 기각하지 못합니다. 즉, 두 계류 방법에 대한 평균 굽힘 응력의 차이가 있다는 증거는 없다는 것을 알 수 있습니다. 또한, 그림6 그래프는 정규성 가정을 만족함을 나타냅니다.
대응 이표본 t-검점의 가정
대응 이표본 t-검정이 유효하기 위해서는 쌍을 이루는 관측 값 간의 차이가 정규분포를 가질 필요가 있습니다.하지만 18회의 관찰만으로는 정규성을 판단하는 것은 무리가 있습니다. 이 경우, 대안으로 비모수적인 방법을 이 용하는 Wilcoxon signed rank test가 있습니다. 아래 절차에 따라 t-검점의 옵션을 조정함으로써 구현해보겠습니다.
1. 옵션 ▶ 비모수 검정 ▶ Wilcoxon 부호 순위 검정 체크
2.실행 클릭
그림7
그림8
Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.