실험이란 실험대상에 처리(treatment)를 하여 나오는 반응값을 분석하여 새로운 결과를 얻는 과정입니다.
또는 공정이나 시스템의 입력변수(input variabels)를 의도적으로 변화시켜 출력변수(output variavble)가 어떻게 변하는지와 변하는 이유를 관측하는 과정입니다.
실험계획법은 통계적으로 잘 정립된 실험의 설계 및 분석 방법을 포괄적이라 정의내릴 수 있습니다.
실험을 계획할 때는 반드시 고려해야할 3가지 기본 원리가 있습니다.
1) 반복의 원리(priniciple of replicatio)
각 수준조합에서 실험을 여러 번 박복하여 실행해야 합니다.
예를 들어, a 제약회사에서 기존의 약을 개량하여 새로운 약을 개발하였습니다.
기존 약에 비해 새 약이 더 효과가 있는지 실험하고자 합니다. 두 사람을 뽑아 각 각 약을 복용하게 한 후 약효를 비교하였습니다. 이 실험에는 문제점이 있습니다.
각 처리에서 실험을 한 번만 하는 것이 아니라 여러 번 반복하야 합니다. 동일한 처리에서도 사람(실험 단위)마다 얻어지는 값은 달라집니다.(실험 오차가 발생합니다.) 여러 번 반복 실험함으로써 이 실험 오차의 추정값을 구할 수 있고 이것과 비교하여 처리평균 간의 차이가 유의한지를 검정할 수 있습니다. 또한 표본평균이 인자 효과의 추정값으로 사용될 때 반복 수를 늘림으로써 추정된 평균의 정도(precision)가 높아집니다.
그러나 반복을 너무 많이 하면 실험 횟수가 증가하고 비용이 많이 발생합니다. 따라서 적정한 횟수로 실험을 할 수 있도록 계획해야 할 것입니다.
2) 랜덤화의 원리(Principle of randomization)
실험의 순서를 랜덤하게 하거나 실험단위의 배정을 랜덤하게 하는 것입니다. 랜덤화를 고려하지 않은 다른 요인들이 실험 결과에 편향(편의)되게 영향을 주는 것을 막기 위함입니다.
예를 들어, 두 종류의 감자 종자 A와 B를 100개씩 준비하여 수확량을 비교하는 실험을 하고자 합니다.
준비된 밭을 반으로 나누어 앞의 밭에는 종자 A를 모두 심고 뒤의 밭에는 종자 B를 모두 심어 일정기간 후에 수확량을 비교합니다.
실험의 객관성을 보장하기 위해 실험단위의 배정이나 실험순서는 랜덤하게 실행해야 합니다. 랜덤하게 하지 않으면 우리가 인자수준의 효과를 알고 싶은데, 실험 순서에 따라 나타나는 효과를 조사하는 잘못을 번하게 될 수 있습니다. 실험에서는 언제나 통제되지 않은 다른 요인들이 존재합니다. 실험순서를 랜덤하게 함으로써 이러한 비통제된 요인들의 영향을 상쇄(평균화)시킬 수 있습니다.
3) 블록화의 원리(Principle of blocking)
실험을 할 때, 전체 실험을 모두 균등한 조건에서 랜덤하게 하기 어려운 경우가 종종 발생합니다. 이 때 실험은 부분적으로 랜덤화해야 합니다. 예를 들어, 총 30회의 실험을 하루 만에 다 하지 못하고, 월,화,수,목, 금요일에 각각 6회 씩 나누어 실험을 한다고 하면, 요일은 블록이 될 수 있으며 랜덤화는 각 블록 내에서 이루어집니다. 분석에서 이 블록의 효과를 분리시키으로써 관심 인자의 효과를 더 잘 검출할 수 있습니다.
● 교락의 원리(Principle of confounding)
검출할 필요가 없는 요인(2개 인자의 교호작용이나 고차의 교호작용 등)을 블록과 교락시키는 방법입니다.
교락(confounding)이란 두 요인의 효과가 섞여 있어 구분할 수가 없는 현상을 말합니다.
● 직교화의 원리(Principle of orthogonaliztation)
요인 간에 직교성(Orthogonality)을 갖도록 실험을 설계하는 방법으로서, 직교배열표(orthogonal array table)를 이용하면 편리합니다. 직교배열표는 교호작용 중에서 무시될 수 있는 것을 주효과와 교락시켜 실험의 크기를 줄일 수 있는 실험설계가 되도록 만든 표로서 요인 간에 직교성을 유지하게 만들어져 있습니다.
실험계획법에서 알아야 할 다른 중요한 개념으로써, 인자의 수준을 어떠한 방법으로 선택하는가에 따라 두 가지로 구분합니다.
하나는 실험자가 판단하여 적절한 처리수준을 정하는 것이고, 다른 하나는 많은 처리수준 중 랜덤으로 몇 개를 고르는 것입니다. 전자를 모수(고정, fixed), 후자를 변량(랜덤, random)이라 말합니다.
1) 모수인자
인자가 단지 제한된 수준수를 가지거나 실험자의 관심이 제한된 수의 수준에만 있고 실험자가 본인의 뜻에 수준을 정하였을 때 이 인자를 모수인자(고정인자, Fixed Factor)라고 합니다. 이 인자의 다른 수준에 기인한 효과를 모수 효과(고정효과, Fixed Effect)라 합니다.
2) 변량인자
인자의 수준수가 크거나 무한대이고 실험자의 관심도 이들 수준 전체이지만 이 중 일부의 수준만을 랜덤하게 뽑았을 때, 이 인자를 변량인자(랜덤인자, random effect)라 합니다. 이 인자의 다른 수준에 기인한 효과를 변량효과(랜덤효과, random effect)라 합니다.
모수인자의 경우는 선택된 수준은 기술적인 의미를 가지며 추론은 이들 인자들의 수준 간에 유의한 차이가 있는가 또는 최적의 수준은 어느 것인가에 초점을 맞춥니다. 모수인자의 다른 예로서 온도, 압력, 작업방법 등을 들 수 있습니다. 실제로 공업실험에서 사용되는 대부분의 인자들은 모수인자입니다.
변량인자의 경우에는 주 관심은 선택된 몇몇 특정 수준에 있지 않고 전체 수준에 걸처 산포의 크기가 어느정도인가에 있습니다. 산포의 추정을 통하여 표집에서 표본의 크기를 결정하는데 이용할 수 있습니다.
즉, 산포가 크면 표본의 크기를 크게하나 산포가 작으면 표본의 크기를 작게 해도 무방할 것입니다.
모수인자들로 구성된 실험모형을 모수모형(고정모형, fixed model)이라 하고, 변량인자들로 구성된 모형을 변량모형(랜덤모형, random model)이라 합니다. 이 두 종류가 혼합되어 있는 모형을 혼합모형(mixed model)이라 합니다.
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.