생존곡선은 사건 발생까지의 시간을 분석하여, 사건이 발생하기까지의 시간과 생존확률의 관계를 나타냅니다.
즉, 사건이 발생하기까지의 시간이란 사망까지의 기간이나 질병 발생 시점부터 재발하기까지의 기간, 기계가 오작동 하기까지의 기간 등을 의미합니다.
생존곡선은, 시점 (t) 와 생존확률 (S(t) = P (T ≥ t) )의 관계를 그래프로 나타낸 것 이다.
T와 t의 시점을 나타낸다.
생존곡선을 추정하는 방법 중 카플란-마이어 생존분석법(Kaplan-Meier Method)이 가장 유명하다.
생존함수란, 어떤 시간을 지나 생존 또는 기능을 하는 확률과 시간의 관계를 함수로 나타낸 것 입니다.
생존곡선에서 중도절단 데이터가 있을 수 있다.
중도절단 데이터란 해석 시점까지 사건이 발생하지 않은 데이터로 사망 / 고장 등이 발생하지 않은 데이터이다.
위의 예시에서 보면, C반도체와 E반도체에는 추적 불능이라 유효한 데이터를 얻을 수 없어 중도 절단 데이터로 취급을 하고, 7개월 동안 고장 나지 않은 D 반도체의 경우 역시 중도절단 데이터라고 할 수 있다.
생존곡선은 생존 _ 사망까지의 기간 / 질병이 재발하기까지의 기간 등의 데이터에 잘 사용하는데, 생존과 관련된 데이터에서 중도 절단 데이터가 발생한 이유는 좋은 치료를 위해 병원을 옮기는 등의 이유로 생길 수 있다.
이러한 중도절단 데이터는 분석에서 제외 시킨다.
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.