일원배치법(one-way layout, one-way factorial design)은 특성치에 대하여 하나의 인자에 대한 영향을 조사할 때 사용되며 가장 단순한 실험계획법입니다.
즉, 특성치에 영향을 미치는 수 많은 요인 중에 주요 인자로 1개만이 선정되고 나머지 요인들은 오차항으로 처리되는 것입니다.
예제 1)
3가지 다이어트 약의 효능을 비교하고 합니다. 과체중 남성 15명을 랜덤하게 선택하고, 3집단에 5명씩 랜덤하게 배정하였습니다. 실험 전에 신체검사를 하여 집단별로 과체중의 평균을 비교한 결과 유의한 차이는 없었습니다. 일정 기간 약을 복용한 후 체중 감소량을 측정하여 다음의 데이터를 얻었습니다.
이것은 15명의 사람들을 3개의 수준에 랜덤하게 5명씩 할당하여 체중감소량을 관측한 실험입니다. 즉 3가지 다른 다이어트약에서 체중감소에 차이가 나는지의 실험에서 다이어트약이라는 한 인자가 있고, 이 인자에는 3가지 다른 수준이 있으며 각 수준마다 5개의 측정값이 있는 경우입니다.
질문) 다이어트 약 종류에 따라 체중감소량은 달라지는가?
여기서 알고자 하는 바는 다른 약종류에 따라 체중감소량이 달라지는가 하는 것입니다.
가설을 말로써 표현하면
H0 : 다이어트약에 따른 체중감소량에 차이가 없다.
H1 : 다이어트약에 따라 체중감소량에 차이가 나는 곳이 있습니다.
3 수준의 모평균을 μ1 , μ2, μ3 라 하면 가설은 다음과 같이 쓸 수 있습니다.
H0 : μ1 = μ2 = μ3
H1 : μi 가 다른 것이 있다.
다이어트약 문제를 유의수준 0.05에서 분산분석을 진행하면 다음과 같이 진행할 수 있습니다.
options nonumber nodate ls=76 ps=80;
data weight;
input treat $ y @@;
datalines;
1 4.6 1 5.8 1 5.6 1 4.9 1 6.6
2 4.3 2 5.8 2 5.1 2 5.5 2 4.5
3 6.4 3 6.6 3 5.9 3 6.0 3 6.1
;
run;
proc anova data = weight;
class treat;
model y = treat;
run;
가설 H0 : τ1 = τ2 = τ3 = 0 VS H1 : Not H0, 검정통계량은 F값은 4.60 이고 p - 값은 0.0329로 주어진 유의수준 0.05에서 유의합니다.
해석하자면, 처리에 따라 모평균이 다르다. 즉, 약 종류에 따라 체중감소량은 유의한 차이가 납니다.
proc anova data = weight;
class treat;
model y = treat;
means treat / lsd clm alpha=0.05;
run;
첫 번째 수준의 모평균의 점추정값과 95% 신뢰구간은 다음과 같이 구해집니다. 두 번째와 세 번째 수준의 경도 비슷한 방식으로 구해집니다.
귀무가설을 기각처리하였습니다. 귀무가설을 기각하면 단지 처리에 따라 반응데 차이가 난다는 것뿐이며 구체적으로 어떤 처리가 다른 반응을 주는지는 말해주지 않습니다. 이것은 다중 비교(Multiple comparison)을 통하여 알 수 있습니다. 다중 비교에는 여러 가지 방법이 있으며 대표적인 방법은 다음과 같습니다.
● Fisher의 LSD(Least Significant Difference, 최소유의차) 방법
● Tukey의 HSD(Honestly Significant Difference, 정직한 유의차) 방법
● Student-Newman Keuls 방법
● Duncan의 다중범위(Multiple Range)방법
다중 비교에서 가장 중요한 개념은 제 1종 오류 α가 어떻게 조절되는가 입니다.
이 오류의 조절방식에 따라 다음의 두 가지로 나눌 수 있습니다.
1. 비교별 오류율(comparisonwise error rate) 조절
2. 실험별 오류율(experiment error rate) 조절
비교별 오류율은 두 평균의 비교인 t-검정에서처럼 각 비교별로 유의수준 α로 정하는 방식이고,
실험별 오류율은 모든 쌍별비교의 동시검정에 대한 전체 유의수준을 α로 정하는 방식입니다.
비교별 오류율은 각 비교마다 잘못 기각될 확률을 각각 α로 고정시키는 방식으로 오류 조절을 하고, 실험별 오류율에서는 모든 비교에서 한 개나 그 이상의 쌍별 비교가 잘못 기각될 확률 α로 고정시키는 방식으로 오류 조절을 합니다.
다중비교는 ANOVA에서 처리간의 차이가 유의하지 않는 경우도 사용가능하나, 원칙적으로 처리간의 차이가 유의하다고 판정된 후에 사용합니다.
proc anova data = weight;
class treat;
model y = treat;
means treat / lsd tukey alpha=0.05;
run;
많은 경우 LSD 방법과 Tukey 방법은 다른 결과를 나타납니다.
이 문제에서는 Tukey 방법과 LSD 방법은 동일한 결과를 보여줍니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.