[Mixed Model 2.2] Nested Mixed Models
안녕하세요^^
이번시간에는 Nested mixed models을 살펴보도록 하겠습니다.
Nested mixed model을 정의하고, MIXED 프로시저를 사용하여 nested mixed model을 분석하는 예제에 대해 알아보도록 하겠습니다.
▶ 목차
▷ Nested Mixed model 예제 데이터
▷ Nested Mixed model 정의
▷ MIXED procedure를 사용하는 Nested Mixed model 분석
▶ Nested Mixed model 예제 데이터
반도체 산업에서 실리콘 웨이퍼(wafers) 중 무작위하게 선택된 세 위치의 산화물층의 두께를 측정한 데이터입니다.
2개의 소스(source)가 있으며 각각의 소스에는 4개의 로트(lots)있고, 각각의 로트에 3개의 웨이퍼가 무작위하게 선택되었습니다.
각 웨이퍼의 임의로 선택된 3개의 위치에서 산화물층의 두께가 측정되었습니다.
▷ 데이터 소개
앞서 설명한 데이터는 위와 같은 모양을 띄고 있습니다.
변수 | 설명 |
Source | 로트가 선택된 소스(source) |
Lot | 소스에서 선택된 웨이퍼의 로트 |
Wafer | 각각의 로트가 선택된 웨이퍼 |
position | 두께가 측정된 웨이퍼의 위치 |
Thickness | 실리콘 웨이퍼의 산화물층의 두께 |
소스(source)를 fixed effect로 간주할 수 있으며,
로트(lots), 웨이퍼(wafer), 위치(position)는 random effect로 간주할 수 있으며,
이는 nested되어있고 계층적인 데이터 구조라고 할 수 있습니다
▶ Nested Mixed model 정의
앞서 소개한 데이터를 이용하여 nested mixed model에 적용하겠습니다.
Nested Mixed model은 다음과 같이 수식으로 정리할 수 있습니다.
항 | 설명 |
i번째 소스의 j번째 로트에 있는 k번째 웨이퍼(wafer)의 m번째 위치(position)의 측정된 두께 (i=1,2) (j=1,2,3,4) (k=1,2,3), (m=1,2,3) |
|
전체 평균을 의미합니다. | |
i번째 소스(source)의 fixed effect | |
무작위하게 선택된 i번째 소스의 j번째 로트(lots)의 effect, | |
무작위하게 선택된 i번째 소스의 j번째 로트의 k번째 웨이퍼(wafer)의 effect, | |
Random error이며, 무작위하게 선택된 i번째 소스의 j번째 로트의 k번째 웨이퍼(wafer)의 m번째 위치 effect, |
▶ MIXED procedure를 사용하는 Nested Mixed model 분석
앞서 소개한 ‘thickness’ 데이터를 사용합니다.
Fixed effect source와 각각의 random effect와 연관된 분산 구성요소를 추정하기 위해, MIXED procedure를 사용하여 분석을 수행합니다.
데이터가 계층적인 구조를 보이기 때문에,
lot(source) 또는 lot*source, wafer(lot(source) 또는 wafer(lot source) 또는 wafer*lot*source와 관련된 항을 정의해야 합니다.
변수 source만을 fixed effect로 입력합니다.
Random effects는 아래에 보이는 것처럼 지정합니다.
추정할 random effects로 source*lot, source*lot*wafer를 입력합니다.
PROC MIXED의 결과입니다.
Class level information은 모형의 nesting 구조를 확인할 수 있습니다.
로트 간의 분산은 119.89은 웨이퍼 간의 분산인 35.87의 3배 이상입니다.
웨이퍼 간의 분산은 위치 간의 분산인 12.57의 약 3배입니다.
사실, 로트 간 분산은 전체 분산의 70% 이상을 차지합니다.
95% 신뢰구간의 분산 구성요소는 카이제곱 분포를 기반으로 계산되었습니다.
Fixed effect source의 test는 p-value가 0.2629로 유의한 차이가 있다고 볼 수 없습니다.
앞의 결과와는 다르게, Group Identifier에 source를 입력한 결과입니다.
Source 2가 분산에 큰 부분을 차지하고 있음을 알 수 있습니다.
[출처]
- ‘Applied Mixed Models for Processors Course Notes’
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!