[Mixed Model 1.4.2] Using the MIXED Procedure
안녕하세요^^
지난 시간에 이어 이번 시간에는 MIXED 프로시저에 대해 알아보겠습니다.
▶ 목차
▷ 분석 전, 데이터 탐색 방법
▷ PROC MIXED를 사용한 randomized complete block design 분석
▷ PROC MIXED와 GLM procedure 비교
▶ Fitting a Mixed Model Using PROC MIXED
▷ TOY 예시
지난 시간에 예시로 사용하였던 Toy 데이터 셋을 사용하겠습니다.
세 가지 접착제를 사용하였을 때, 접착력을 떼는 평균 압력에 유의한 차이가 있는지를 확인한다고 가정합니다.
MIXED 프로시저를 사용하여 block effect인 toy를 block effect로 처리하여 toy 데이터를 분석할 수 있습니다.
▷ PROC MIXED를 사용한 randomized complete block design 분석 과정
1. SAS Enterprise Guide를 사용하여 toy 데이터를 활성화 시킵니다.
File – Open – Data – Toy
2. Tasks – ANOVA – Mixed Models를 선택합니다.
3. 아래와 같이 data tab에서 종속변수와 분류변수를 설정합니다.
4. Fixed effect model tab에서 아래와 같이 고정효과 변수를 adhesive로 설정합니다.
5. Fixed effects model options tab에서 아래와 같이 옵션을 지정합니다.
Estimation method : residual maximum likelihood
Degrees of freedom method : Default
Estimable functions : Type III
Estimable function III는 Type III L 행렬계수가 지정된 모든 효과에 대해 표시되도록 요청합니다. 이 옵션을 선택하면 고정 효과에 대한 type 3 test를 해석하는데 도움이 됩니다.
6. Random effects를 지정하기 위해서 Random effects tab에서 Add를 클릭합니다.
7. Random effects에서 …탭으로 들어가 변수 Toy를 random effects로 설정합니다.
8. Least Squares Post Hoc Tests tab에서 add tab을 선택하여 고정효과에 대한 Least squares mean test option을 아래와 같이 설정합니다.
9. 창 왼쪽 하단의 Preview code를 클릭하여 해당 코드를 확인하면 지금까지 설정된 내용들에 대해 SAS code를 확인 할 수 있습니다. 만약에 사용자가 지정하고 싶은 code가 있다면 insert code…를 선택하여 옵션을 추가할 수 있습니다.
Insert code…를 클릭하게 되면 다음과 같이 사용자가 원하는 코드를 입력할 수 있는 부분들을 확인할 수 있습니다.
코드의 내용 중, PLOTS(ONLY)=ALL 이라는 코드를 찾아, 아래와 같은 사용자 지정 코드를 입력하는 부분에 COVTEST를 추가해 줍니다.
⇒ 위의 모든 옵션을 지정한 후, Run(실행)을 클릭하면 MIXED MODEL에 대한 분석 결과를 확인 할 수 있습니다.
▷ PROC MIXED를 사용한 randomized complete block design 분석 결과
▪ 모델에 포함된 변수 및 모델에 적합한 방법을 나타냅니다.
▪ PROC MIXED가 적용되는 기본 공분산 구조는 Variance Components(VC) (상수 분산 및 제로 공분산)입니다. Restricted/residual maximum-likelihood(REML)은 PROC MIXED에서 default로 사용되는 variance component 추정방법 입니다.
============================================================
▪ CLASS문에 지정된 모든 변수의 레벨을 나열하여 보여줍니다. 이 정보를 확인하여 데이터가 올바르게 적합 되었는지 확인할 수 있습니다.
▪ PROC MIXED문에서 ORDER= 옵션을 사용하여 CLASS 변수 레벨의 순서를 조정할 수 있습니다.
============================================================
▪ 관련 매트릭스의 크기를 나열합니다.
============================================================
▪ 데이터 세트의 총 관측 수 및 모델 피팅에 사용된 관측 수를 표시합니다.
============================================================
▪ Residual log likelihood function의 최적화에 대해 나타냅니다. 이는 Newton-Raphson 알고리즘을 사용하여 수행되며 목적 함수를 최소화하기 위해 이 알고리즘이 수행하는 반복을 설명합니다.
============================================================
▪ 다음의 결과를 통해 분산을 추정할 수 있다.
============================================================
▪ 모델 적합성에 대한 정보를 확인 할 수 있습니다.
============================================================
▪ 접착제 효과의 테스트에 사용되는 type 3 L matrix 계수를 나타냅니다.
▪ 예를 들어, 해당 예시에서는 아래와 같은 매트릭스를 나타냅니다.
============================================================
▪ 접착제에 대한 F 검정 결과를 나타냅니다.
▪ toy 예시에서는 유의확률이 0.0131으로 5% 유의수준 하에서 모든 장난감에 대한 접착제 평균 절단 압력이 차이가 있다고 볼 수 있습니다.
▷ PROC MIXED 와 PROC GLM 비교
PROC MIXED |
PROC GLM |
syntax는 매우 비슷
|
|
Generalized least squares(GLS) 방법을 사용하여 고정 효과에 대해 추론 따라서 사용자가 지정한 분산-공분산 구조를 통합하여 추론
|
Ordinary least squares(OLS) 방법을 사용하여 고정효과를 추론 따라서 Random문을 지정하는 경우에도 고정효과만 있는 모델을 기반으로 추론 |
최대우도(maximum likelihood) 방법을 사용하여 분산의 구성요소들을 추론 Default : REML
|
변동성(variations)을 평가하기 위해 분산분석(analysis of variance)을 사용 |
이론적으로 GLS 방법이 고정효과 추론을 위한 OLS 방법보다 우수합니다.
GLM procedure는 고정효과를 위한 procedure이므로 mixed model을 분석하기 위해서는 MIXED procedure를 사용해야 합니다.
[출처]
- ‘Applied Mixed Models for Processors Course Notes’
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.