[Mixed Model 3.1.4] Additional Examples for Hypotheses Testing
안녕하세요^^
이번 시간에는 지난 시간에 이어서 가설 검정에 대한 또 다른 예제를 살펴보도록 하겠습니다.
▶ 목차
▷ Additional Examples for Hypotheses Testing
▶ Additional example for hypotheses testing
▷ 데이터 소개
예제에 사용될 데이터는 시험약을 사용하였을 때의 환자의 반응에 대한 연구입니다.
시험약(drug)은 세 종류이고, 각각 네 가지의 다른 용량(dosage)을 갖고 있습니다.
또한 10개의 클리닉(clinic)을 무작위로 선택하였으며, 종속변수로는 약물에 대한 반응(response)를 사용합니다.
다시 말해, 설계된 연구는 요인(factor)이 2개인 randomized complete block design 이고,
각 시험약의 종류와 용량에 따라서 12개의 조합이 가능한 것을 알 수 있습니다.
모든 가능한 조합은 각 블록(clinic)마다 한 번씩 발생합니다.
i = 1 to 3 , j = 1 to 4 , k = 1 to 10 , l = 1 to n_ij
각 clinic마다 12가지 치료법의 조합에 해당하는 12명의 환자 정보를 수집하였습니다. 12개의 모집단에 대한 평균(population means)은 아래의 표에서와 같이 지정됩니다.
▷ 가설 설정
앞서 언급했듯이 population parameters에 대해서만 가설 검정을 할 수 있습니다.
가설 검정 시, 주효과로 시험약 종류에 따른 효과의 유무, 시험약 용량에 따른 효과 유무와 두 주효과에 대한 상호작용(interaction)이 존재하는지 검정하고자 할 때, 이 3가지 가설은 아래와 같이 나타낼 수 있습니다.
주효과에 대해서 상호작용이 존재하지 않는다면 아래의 그래프와 같이 평행한 그래프를 나타냅니다.
만약, 상호작용이 존재한다면 그래프는 평행하지 않은 형태를 나타낼 것입니다.
▷ 인덱스 설정
실험 설계의 레이아웃을 확인하기 위해서 drug와 dosage의 순서쌍을 12개의 치료조합의 번호와 연관시키는 인덱스를 생성하면 편리합니다. 인덱스는 아래와 같이 지정할 수 있습니다.
실험 설계의 레이아웃은 아래와 같습니다. 10개의 각 clinic마다 12개의 치료법이 무작위로 여러 사람들에게 할당된 것을 나타냅니다.
▷ sample data
아래는 클리닉별로 각 모집단에서 채취한 샘플입니다.
예를 들어, clinic1 의 모집단 (1, 1) 에서 3명의 사람을 샘플링 하였고, clinic5의 모집단 (2, 3)에서 6명의 사람들을 샘플링 하였습니다.
각 모집단의 관측치 수가 서로 다르기 때문에 해당 연구의 설계를 unbalanced, 불균형이라고 할 수 있습니다. 하지만 샘플링이 되지 않은 개체군은 존재하지 않습니다. 모든 모집단에서 동일한 수의 샘플을 추출했다면 balanced design이라고 부릅니다.
따라서 두 요소가 고정되어 있으면서 무작위 요소가 clinic인 two-factor factorial in randomized complete block 분석을 실시하겠습니다.
▷ 분석결과 및 가설
분석 시 옵션 선택창에서 Kenward-Roger의 자유도 옵션을 사용하고, Type III estimable functions를 선택합니다.
결과는 아래와 같습니다.
분석에서 관심은 약물에 의한, 용량에 의한, 약물 종류와 용량에 대한 상호작용에 의한 차이가 있는지 검정하는 것입니다.
이 경우, 상호작용에 대한 검정 결과를 먼저 확인합니다.
Drug*dose 항의 검정 결과가 유의수준 5% 하에서 유의하기 때문에 약물 종류와 용량의 상호작용에 의한 response의 평균 차이가 유의한 것을 알 수 있습니다.
아래는 estimable functions 출력 결과입니다.
모델에서 교호작용 항을 사용하기 때문에 drug*dose 조합의 결과부분을 확인합니다.
Drug*dose 의 (1, 1)은 cell (1, 1)의 평균을 나타내는 것을 의미합니다.
따라서 주효과 drug의 estimable functions은 아래와 같음을 알 수 있습니다.
Estimable function 결과표에는 두 개의 열이 있으므로 해당 테스트에 대해 자유도가 2 임을 알 수 있습니다.
테스트되는 가설은 두 부분으로 구성된 단일 가설입니다.
귀무가설은 아래와 같이, 각각의 평균에 각 계수를 곱하고 이들을 모두 더하여 0과 동일하게 설정합니다.
두 번째에 나타낸 가설을 아래와 같이 다시 표현할 수 있습니다.
이 가설은 앞서 정의한 주효과 drug에 대한 테스트입니다.
나머지 두 가설 또한 위와 같은 방식으로 유도될 수 있습니다.
상호작용이 유의한지 테스트하기 위해 사용되는 estimable functions은 아래의 값을 사용합니다.
총 6개의 열을 갖고 있으므로 6개 부분으로 구성된 단일 가설을 가지며
귀무가설이 참이라면 그래프에서 모두 평행한 선을 나타낼 것입니다.
위에서 실시한 것과 동일하게, drug*dose의 각 cell 평균에 해당 계수를 곱하여 모든 열을 더한 후 0 과 같음을 설정합니다.
즉, 열 1은 다음과 같이 설정 할 수 있습니다.
따라서 전체 가설은 아래와 같이 설정 가능합니다.
[출처]
- ‘Applied Mixed Models for Processors Course Notes’
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.