[Mixed Model 4.2.4] Random Coefficient Models
안녕하세요^^
이번 시간에는 앞서 소개한 예제에서 공분산 행렬의 구조를 변경하여 random coefficient model을 적합하고 그 결과를 해석하겠습니다.
▶ 목차
▷ Random coefficient model 적합
▷ Random coefficient model 결과 해석
▶ Random coefficient model 적합
▷ 예제 데이터
앞서 소개한 예제 데이터인 ‘wheat’는 다음과 같은 구조와 변수로 이루어져 있습니다.
변수 | 설명 |
id | 각 품종을 구별할 수 있는 번호 |
variety | 무작위로 선택된 밀의 품종 |
moist | 측정된 식물의 수분함량 |
yield |
최종 수확량 |
▷ SAS 코드 ; 새로운 공분산 구조 FA0(q)
FA0(q)는 모델을 적합할 때 수렴과 안정성을 향상시킬 수 있습니다.
RANDOM 문장에 구조화되지 않은 G 행렬을 근사할 수 있으며, G 행렬의 추정값을 nonnegative definite으로 한정할 수 있습니다.
FA0(2)는 random coefficient regression 분석에서 유용한 공분산 구조는 두 가지 요소가 있는 대각선 계수 분석(no-diagonal factor analytic structure) 구조입니다.
▶ Random coefficient model 결과 해석
TYPE=FA0(2)의 분산-공분산 행렬을 사용하는 random coefficient model을 적합하는 SAS 코드는 위와 같습니다.
이 때 DDFM=KR(FIRSTORDER) 옵션을 사용하면, fixed effect와 random effect의 분산-공분산 행렬을 조정할 수 있습니다.
공분산 행렬의 이차 미분의 값이 0이 아닐 때, 공분산 행렬을 조정하는 것은 바람직하지 않은 결과를 낼 수 있습니다.
따라서 FIRSTORDER 옵션을 사용하여 공분산 행렬을 조정하는 계산에서의 이차 미분을 제거합니다.
▷ PROC MIXED 의 결과 (1)
‘Estimated G Matrix’ 결과는 이전 TYPE=UN을 이용한 결과와 동일합니다.
‘Covariance Parameter Estimates’ 결과는 ‘Estimated G Matrix’와 같은 결과를 보여줍니다.
TYPE=FA0(2)으로 설정하였기 때문에, ‘Cov Parm’은 FA이며 G행렬에서의 위치에 따라 추정된 값이 나타난 표입니다.
즉, 분산-공분산 행렬의 REML 추정치는 다음과 같습니다.
절편의 분산은 18.8947이고, 기울기의 분산은 0.2394이고, 절편과 기울기의 공분산은 -0.7272가 됩니다.
추정된 residual variance는 입니다.
이는 TYPE=UN의 결과와 동일합니다.
▷ PROC MIXED 의 결과 (2)
‘Null Model Likelihood Ratio Test’는 데이터의 공분산구조를 모델링해야 하는지 여부를 결정하는 우도비검정(LRT: likelihood ratio test)의 결과입니다.
결과값의 ‘Chi-Square’는 아래의 식과 같이 계산합니다.
2 x [ ln(likelihood for fitted model) – ln(likelihood for null model) ]
여기서 null model은 오직 MODEL 문장에 명시된 fixed effect만 고려한 모형이며, error의 공분산 행렬은 입니다.
결과값의 ‘DF’는 fitted model과 null model 사이의 공분산에서 추정해야 하는 모수의 개수의 차이입니다.
결과값의 ‘Pr > ChiSq’은 자유도가 3인 카이제곱 분포의 위쪽 꼬리의 영역입니다.
그 결과가 ‘<0.0001’인 것은 fitted model인 random coefficient model이 null model보다 우수함을 나타냅니다.
▷ PROC MIXED 의 결과 (3)
‘Solution for Fixed Effects’는 이고
인 추정치 값을 제공합니다.
따라서 모든 품종(variety)에 대해 예상되는 절편은 33.43이고 기울기는 6.6166입니다.
두 추정치 모두 p-value가 0.0001보다 작기 때문에, 0과 유의한 차이가 있음을 알 수 있습니다.
▷ PROC MIXED 의 결과 (4)
이 모든 결과는 TYPE=UN을 이용한 결과와 동일합니다.
‘Solution for Random Effects’는 모집단의 절편과의 deviation과 각 품종(variety)에서의 모집단의 기울기와의 deviation 값을 제공합니다.
예를 들어, 첫 번째 품종(variety=1)의 절편 추정치인 0.9578은 의 예측 값이며, 기울기 추정치인 -0.4921은
의 예측 값입니다.
절편과 기울기의 deviation을 이용하여 각 품종(variety)에 대한 절편과 기울기를 계산할 수 있습니다.
FIRSTORDER 옵션을 지정하지 않은 경우, fixed effect와 random effect는 약간 다른 값을 갖습니다.
이상 SAS의 PROC MIXED 프로시저를 사용하여 분석을 시행하고 결과를 해석하는 방법에 대해 알아보았습니다.
감사합니다.
[출처]
- ‘Applied Mixed Models for Processors Course Notes’
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.