[Mixed Model 5.2.1] Mixed Model Analyses of Repeated Measures Data

[Mixed Model 5.2.1] Mixed Model Analyses of Repeated Measures Data

안녕하세요^^

이번 시간에는 반복측정분석방법을 실시하기 위한 절차와 이와 관련된 이론에 대해 설명하도록 하겠습니다.

▶ 목차

▷ Four-Step procedure for mixed model analysis

▶ Four-Step Procedure for Mixed Model Analysis

다음은 Mixed model analysis를 실시하기 위한 4가지 절차입니다.

1. Mean structure 모델링하기

2. between-subject 와 within-subject effects에 대한 covariance structures 지정하기

3. GLS를 사용하여 covariance structure를 설명하는 mean model를 적합시키기

4. 3단계의 결과를 기반으로 통계추론하기

▷Step1: Model the Mean Structure

지난 시간에 소개한 Asthma 데이터를 이용하여 model에 적용하겠습니다.

다음과 같이 수식으로 정리할 수 있습니다.

▷Step2 -(1) Specify the Covariance Structure

반복측정데이터에서 within-subject에 대한 covariance는 복잡합니다.

일반적으로 동일한 subject내에서 반복 측정된 값은 상관관계가 있고 다른 subject에서 측정된 값은 독립적이라고 가정합니다.

따라서 fS9EGaLUz_fzmJiYEN2SRBn6OsAfMTkDurihTkcAAAAASUVORK5CYII_.png 에 대한 분산공분산행렬인 R은 블록대각행렬이고, subject마다 한 블록을 갖습니다.

MIXED프로시저의 REPEATED문에서 SUBJECT=옵션을 사용하여 블록을 식별할 수 있고 TYPE=옵션을 사용하여 각 블록의 공분산구조를 지정할 수 있습니다.

예를 들어, 3명의 subject에 대해 4번 반복측정 되었다면 총 12개의 관측치를 얻게 될 것이고

위와 같은 12x12 크기의 공분산행렬을 갖게 됩니다.

이 행렬에서, 각 블록(subject)의 관측치는 다양한 공분산구조를 가질 수 있는 반면에 블록 밖의 관측값들은 서로 독립임을 가정합니다.

▷ Covariance Matrix in Each Block

각 블록에서 가능한 공분산행렬의 종류는 다음과 같습니다.

1. Variance Component (VC) - Default

각 블록에서 가장 간단한 공분산구조는 기본설정인 Variance Component(VC)입니다.

Simple structure이라고도 합니다.

이것은 subject 내의 오차 상관계수가 0 인 독립적이고 동일한 분산구조입니다.

하지만 동일한 subject내에서 반복된 측정값은 보통 연관되어 있기 때문에

이 구조는 대체로 반복측정데이터에 대한 합리적인 구조가 아닙니다.

2. Unstructured Covariance

가장 복잡한 공분산구조는 구조화 되지 않은 것으로,

각 시간 쌍에서 관측된 관측치들은 고유한 상관관계를 가지고 있습니다.

3. Compound Symmetry (CS)

가장 단순한 상관모델은 교환가능한 상관구조라고도 하는 compound symmetry(CS)입니다.

상관관계는 측정시간 사이의 거리와 상관없이 일정하다고 가정합니다.

시간이 지남에 따라서 수집된 관측치에 대해서는 타당한 가정이 아닐 수도 있지만

시간이 지나도 반복적인 측정값이 관측 되지 않는 경우에는 합리적 일 수 있습니다.

4. First-Order Autoregressive AR(1)

gY91ogHFJaVS5BMPG0eCQEqlzOcf2u5Al79hEtssGEBzYoMcdt_yvFaM9RQXG2Esj6rGStFQFKXm0ClXRVFcoaKhKIorVDQURXGF.png

AR(1)모델은 관측 쌍이 첫 번째와 두 번째, 두 번째와 세 번째 인지 여부와 관계없이

인접 관측간의 상관관계가 라고 가정합니다.

또한 두 단위로 떨어져 있는 관찰 쌍(첫 번째와 세 번째, 두 번째와 네 번째 등)에 대한 상관관계는 라고 가정합니다.

즉, 일반적으로 d단위 떨어져 있는 관측치들은 의 상관계수를 갖습니다.

따라서 관측치 간의 상관관계는 시간의 거리에 따라서 달라집니다.

이것은 시간이 지남에 따라서 반복적으로 측정하는 상황에서 합리적인 가정으로 보입니다.

5. Toeplitz

Toeplitz 공분산구조는 AR(1)과 유사하지만 좀 더 일반적인 구조입니다.

공통거리(d)로 분리된 관측치가 동일한 상관관계를 갖더라도 상관관계는 더 이상 의 지수함수가 아닙니다.

대신 0과 1사이의 값이 될 수 있습니다.

하지만 Toeplitz가 불균등한 간격을 모델링하지는 않습니다.

▷ Selecting an appropriate covariance model

정확한 분석 결과를 도출하기 위해서는 여러 공분산구조들 중 적절한 공분산 모형을 선택해야 합니다.

1. 데이터 수집과정에서 얻은 정보나 혹은 이전에 시행된 관련 연구들에서 얻을 수 있는 정보, 지식들을 활용합니다.

2. Information criteria를 사용하여 다양한 공분산구조를 적합시킨 결과를 비교합니다.

- Akaike Information Criteria (AIC)

- Finite-sample corrected Akaike Information Criteria (AICC)

- Schwarz’s Bayesian Information Criteria (BIC)

3. Likelihood ratio test를 사용하여 nested variance structures를 비교합니다.

위와 같은 방법으로 복잡한 모델을 간단한 모델로 줄이는데도 사용할 수 있습니다.

다음 시간에는 반복측정 데이터에 대한 Mixed model analysis 과정 중 뒷부분을 알아보도록 하겠습니다.

감사합니다.

[출처]

- ‘Applied Mixed Models for Processors Course Notes’

[Mixed Model 5.2.1] Mixed Model Analyses of Repeated Measures Data

Catch up on SAS Innovate 2026

Resources