6-2. Categorical Data Analysis: 로지스틱 회귀모형(2)
안녕하세요^^
이번 시간에는 “로지스틱 회귀분석 개념 이해하기” 첫 번째 시간에 이어서,
로지스틱 모형의 형태와 가정을 살펴보도록 하겠습니다.
Logit(로짓) 변환이란?
로지스틱 회귀모형은 확률(p)에 로짓변환을 적용합니다.
로짓변환을 하는 이유는 다음과 같습니다.
우리는 확률(p)을 모델링하는 데에 두 가지 문제점에 직면합니다.
첫 번째는 확률 값이 0과 1사이 값을 갖는다는 것이고,
두 번째는 설명변수와 확률 간의 관계가 linear가 아니라는 점입니다.
위 두 제한점을 해결하기 위해서 로짓변환을 하게 되는 것이지요.
로짓변환을 하게 되면 범위의 제한이 사라집니다.
P는 최대값인 1일 때에는 ln(p/(1-p)) 값은 양의 무한대가 되고
P의 최소값인 0일 때에는 ln(p/(1-p)) 값은 음의 무한대가 됩니다.
따라서 로짓은 상한 및 하한 경계가 없어지게 됩니다.
이것이 이항 반응변수에 대해 로짓변환을 하는 이유입니다.
그렇다면 우리가 로짓변환된 값을 모델링했을 때 얻을 수 있는 정보는 무엇일까요?
우리는 오즈비 또는 확률을 모델링할 수 있습니다.
로짓 변환은 모델이 0과 1사이의 추정확률을 생성하기 때문입니다.
(로짓은 오즈에 자연로그를 취한 형태이며, 오즈와 오즈비는 이전 강의에서 다루었습니다.)
로지스틱 회귀 분석의 가정
선형 회귀 분석과 마찬가지로 로지스틱 회귀 분석에도 가정이 있습니다.
로지스틱 회귀 분석의 가정은, 로짓이 설명변수와 선형 관계를 갖는다는 것입니다.
로지스틱 회귀 모형은 다음과 같은 형태를 갖습니다.
P는 사건이 일어날 확률을 의미하고
Beta(0)는 회귀 방적식의 절편을 beta(k)은 k번째 설명변수의 모수를 의미합니다.
SAS에서 로지스틱 회귀모형을 적합하기 위한 PROCEDURE는, PROC LOGISTIC입니다.
이상 로지스틱 회귀 모형을 이해하는 데에 도움이 되셨나요?
(실습: 로지스틱 결과에 대한 적용 및 해석은 다음 시간부터 세 번에 걸쳐 진행됩니다~^^)
그럼 다음시간에는
연속형 설명변수를 가지고 로지스틱 회귀모형 적합결과 묘사하는 것에 대해 알아보도록 하겠습니다.
감사합니다.
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!