BookmarkSubscribeRSS Feed

[Mixed Model 1.2] Mixed Models 정의

Started ‎06-18-2020 by
Modified ‎06-18-2020 by
Views 155

[Mixed Model 1.2] Mixed Models 정의

 

 

 안녕하세요^^

 

이번시간에는 Mixed Model에 대해서 알아보도록 하겠습니다.

 

 

▶ 목차

▷ 데이터 소스

▷ Fixed effect 정의

▷ Random effect 정의

▷ Mixed model 정의 및 설명

 

*****************************************************************************************************************

 

▶ 데이터 소스

대부분의 데이터세트는 다음의 세 가지 소스 중 하나에 의해서 생성됩니다.

 

 sources

 설명

 Designed experiments

 Designed experiments에서 어떤 형태의 treatment가 실험단위(experimental units)에 적용되고 반응(response)은 관측됩니다.

 Sample surveys

 Sample surveys에서 데이터는 survey design이라고 하는 계획(plan)에 따라 수집되지만, treatment는 units에 적용되지 않습니다.

일반적인 사람인 units에는 이미 성별과 연령과 같은 특정 특성이 포함되어 있습니다.

 Observational studies

 Observational studies에서 데이터는 계획(plan)에 따라 선택된 단위가아닌 이용가능한 units으로 수집됩니다.

 

 

 

▷ 예시

예를 들어, 1학년의 읽기 능력을 평가하는 연구에서는

학생의 연령, 성별, 학교 입학, 교사, 읽기 시험의 점수를 포함하는 학교를 구분할  수 있는 학교의 데이터를 수집합니다.

이 과정은 주로 sample surveys와 observational studies로 확장될 수 있지만, designed experiments에서 주로 관련이 있습니다.

 

 

 

 

▶ Fixed effect 정의

Fixed effect는 level이 무작위가 아닌 절차에 의해 선택되거나, 전체 모집단에서 가능한 수준(levels)으로 구성되는 factor입니다.

모든 관심 수준(levels)은 데이터셋에 있습니다.

연구자는 연구에 포함된 수준(levels)의 응답변수에 대해서만 factor의 효과(effects of factors)를 비교하는데에 관심이 있습니다.

 

Fixed effect만을 포함하는 모형을 fixed effects model이라고 합니다.

 

 

 

 

 

▷ 예시

 

예를 들어, 약물연구에서 연구자는 A, B, C 세 개의 약물의 효과를 비교하려고 합니다​.

 

1y51owFDwoKUvVkRpEx3ptWmg1kfL9z585qEA8jyPRGMR2dEoYmJb5ywAZdcA7YiIyMVC3fFDWFy1FYHBvNgR1aOLAuaB2dEkxBZ.png

 

​연구자는 이 세 개의 약물의 비교에만 관심이 있으며, 실험을 수행하기 전 각각의 약물이 어떤 것인지 알고 있습니다.

 

 이 때 변수 drug(약물)은 fixed effect입니다.

 

 

 

​ 

▶ Random effect 정의

때떄로 factor의 수준(levels)이 많고 연구자 또는 데이터 분석가가 연구에 포함되는 수준을 선택하여 subset으로 구성하는 경우가 있습니다.

그러나 이러한 데이터에서도 분석은 연구에 포함된 subset의 수준에 대한 추론뿐만 아니라, 모집단 수준에 대한 분석도 수행해야 합니다.

 

이러한 효과를 random effects라고 합니다.

Random effect가 포함된 모형을 random effect models라고 합니다.

이 때 rancom effects와 연관된 분산(variance)는 variance components라고 알려져 있습니다.

 

 

 

 

▷ 예시

예를 들어, 같은 약물연구에서 한 지역에 있는 모든 병원들 중에서 네 개의 병원(clinics)이 무작위하게 선택되었습니다.

 

D3UCUYl4CS8HAAAAAElFTkSuQmCC.png

 

이 때 연구자들은 연구에 포함된 지역의 병원 뿐만 아니라 모든 지역의 병원에서의 약물의 효과를 비교하려고 하였습니다.

 

 이 때 변수 clinics(병원)는 random effect입니다.

 

 

 

 

▶ Mixed model 정의 및 설명

 

wMfHqfw5D8m8gAAAABJRU5ErkJggg__.png

앞서 설명한 fixed effects와 random effects가 모두 포함된 모형을 mixed models라고 합니다.

 

 

 

▷ 예시

이 연구의 데이터셋은 observational study로부터 수집되었습니다.

 

 

w9rN7n48SjkzQAAAABJRU5ErkJggg__.png

 

한 학군의 모든 학교에서 1.515명의 4학년 학생들을 대상으로 표준화된 시험의 점수의 Gains을 기록했습니다.

 

Gains = 연말의 점수 – 연초의 점수

 

학생의 성별(gender)과 민족성(ethnicities), 교사의 신분번호(teacher)도 기록되었습니다.

이 데이터셋의 주요 목적은 시험 점수의 Gains로 학교를 평가하고 비교하는 것이었습니다.

2차 목적은 성별과 민족성을 평가하는 것이었습니다.

 

 

 변수

Fixed effect / random effect 

 school(학교)

 연구에 포함된 학교만이 관심 대상이었기 때문에 fixed effect입니다.

 ethnicity(민족성)

 fixed effect입니다.

 gender(성별)

 fixed effect입니다.

 teacher(교사)

 가르칠 수 있는 모든 교사 모집단을 대표하는 샘플이기 때문에 random effect입니다.

 

 

 

 

[Reference]

* Applied Mixed Models for Processors Course Notes’

 

 

 

 

 

 

 

 

 

 

Version history
Last update:
‎06-18-2020 12:35 AM
Updated by:
Contributors

SAS Innovate 2025: Save the Date

 SAS Innovate 2025 is scheduled for May 6-9 in Orlando, FL. Sign up to be first to learn about the agenda and registration!

Save the date!

Article Labels
Article Tags