[Mixed Model 4.2.1] Random Coefficient Models
안녕하세요^^
이번시간에는 Random coefficient model에 대해 알아보도록 하겠습니다.
▶ 목차
▷ Random coefficient model 정의
▷ 예제 데이터
▶ Random coefficient model 정의
공분산분석(Analysis of covariance)에서, 공변량의 회귀계수는 fixed effect로 가정합니다.
즉, 데이터로부터 추정된 unknown fixed parameters로 가정합니다.
Random coefficient model은 하나 이상의 공변량에 대한 회귀계수를 가능한 계수에서의 random sample로 가정하므로 random coefficient라는 용어를 사용합니다.
Random coefficient model은 독립적인 subjects 또는 clusters에서 데이터가 생겨나면 민감하게 반응합니다.
따라서 Random deviation은 모집단 회귀모형에서 벗어난 subjects 또는 clusters에 대한 값으로 가정됩니다.
▷ 공분산분석(ANCOVA)
앞에서 설명했듯이 공분산분석에서 fixed effect는 분류변수(classification variable)가 모든 관심 수준을 나타내는 것으로 가정합니다.
분류변수의 각 수준에 대한 회귀계수는 데이터에서 추정된 unknown fixed parameters입니다.
▷ Random coefficient Model
이 그래프에서는 각 subject(대상자)에 대한 임의의 회귀직선은 전체 모집단에 대한 회귀직선()
과 차이가 있습니다.
Random coefficient model을 적합하는 목표는
(1) 절편과 기울기의 분산과 두 변수간의 공분산을 추정하는 것과
(2) 각각의 subject와 cluster에 대해 가장 잘 적합하는 best linear unbiased predictors (BLUP)를 얻는 것입니다.
더 많은 수준의 계층으로 확장시키거나 각 수준에서 두 개 이상의 random coefficient로 확장시킬 수 있지만, 여기서는 standard random intercept-slope model을 고려하겠습니다.
▶ 예제 데이터
10 품종(variety)의 밀을 무작위로 선별하였고, 각 품종은 6개의 위치에 무작위로 배정되었습니다.
최종 수확량(yield)은 식물의 수분함량(moist)에 의해 영향을 받을 수 있다고 생각되어, 수분함량과 수확량을 측정하였습니다.
변수 | 설명 |
id | 각 품종을 구별할 수 있는 번호 |
variety | 무작위로 선택된 밀의 품종 |
moist | 측정된 식물의 수분함량 |
yield | 최종 수확량 |
밀의 10개의 품종이 모집단에서 무작위로 선택되었기 때문에 random effect이며, 각각의 모형은 모집단 모형에서의 deviations로 표현될 수 있습니다.
▷ 수확량과 수분함량
수확량(yield)과 수분함량(moist)의 분포를 살펴보면, 모집단에서는 수분함량이 증가할수록 수확량이 증가하였습니다.
또한 이 자료를 이용해서 선형 회귀분석(linear regression) 모형을 사용하는 것을 적절한 것으로 판단하였습니다.
다음 시간에는 위에서 소개한 예제데이터를 사용하여 Random coefficient model에 적합해보도록 하겠습니다.
감사합니다.
[출처]
- ‘Applied Mixed Models for Processors Course Notes’
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.