BookmarkSubscribeRSS Feed

[SAS 활용 노하우] Survival Curve - Cox's Proportional Hazard Model

Started ‎08-28-2023 by
Modified ‎08-28-2023 by
Views 1,906

 

 

Survival Curves(생존 곡선)를 분석하기 위해 Cox 비례 해저드 회귀를 사용합니다.

Cox 비례 해저드 회귀 모형(Cox's Proportional Hazard Model)

Cox 비례 해저드 모형(Cox's Proportional Hazard Mode)은 시간과 사건 사이의 예측 회귀 모형을 만드는 통계기법입니다.

또한, 생존시간에 영향을 미치는 요인을 분석합니다.

생존시간 데이터를 위한 중회귀적분석으로 해저드비에 영향을 줄 것 같은 설명변수를 찾아 영향의 크기를 측정하기 위해 이용합니다.

 

 

image.png

 

 

 

 

위의 식은 해저드 함수로 변수 x1 ,. . ., xn 가 해저드 함수에 주는 영향을 분석하는 방법입니다.

h0 는 기준 해저드를 의미한다.

'해저드'란 시점 t까지 생존해 있기는 하지만 그 직후(다음순간)에 죽을 확률(순간사망률)을 의미합니다.

다양한 관측치를 동시에 통제하고 사건 발생에 미치는 영향을 분석하는 다변량 분석법으로,

관측치는 서로 독립적이며, 해저드비(Hazrd Ratio)는 시간에 관계없이 일정하다는 비례 위험 가정이 필요합니다.

해저드비(Hazard Ratio)란, 어느 xi 가 1이고 기타는 0을 의미할 때, 해저드와 기준 해저드 h0(t) 를 의미합니다.

 

 

 

 

image.png

 

 

 

 

이 해저드비가 1보다 클 경우에는 Xi 의 상승이 사건 발생 확률을 상승시킵니다.

 

 

 

■ SAS 예제 및 코드

 

사용된 데이터는 2008년 Hosmer & Lemer 가 연구한 심장마비에 관한 데이터 입니다.

 

 image.png

 

 

 

whas500 데이터는 500명의 심장마비에 관한 데이터로 19개의 변수가 있습니다.

19개의 변수 중, 6개의 변수만 콕스 비례 해저드 회귀에 사용됩니다.

성별의 차이에 나타 심장마비가 있은 후에 생존여부에 차이가 있다라고 판단되어 두 집간간의 생존 곡선을 비교하려고 합니다.

  1. lenfol: Length of Follow up으로 연구에서 관찰된 환자의 추적기간을 의미합니다.이 데이터는 사망 또는 Censoring 데이터로 나타납니다.

  2. fstat (=Censoring Variable): 관찰 중단된 이유로 0은 추정중단 (=이탈)을 의미하고 1은 사망을 의미합니다.

  3. age: 환자가 병원에 입원할 때의 나이를 의미합니다.

  4. BMI: 체질량 지수를 의미하며 환자의 체지방 비율을 평가하는데 사용됩니다.

  5. hr(Initial Heart Rate): 환자의 초기 심박수를 나타냅니다.

  6. Gender: 성별 (0: 남자 / 1: 여성)

 

libname learn '/home/u45061472/';

data test;
set learn.whas500;
run;

proc phreg data = learn.whas500;
class gender;
model lenfol*fstat(0) = gender age;
run;

 

 

 

  • PROC PHREG: 콕스 비례 해저드 회귀 모델을 실행합니다.

  • CLASS gender: gender 변수를 범주형 변수로 설정

  • MODEL lenfol*fstat(0) : lenforl 종속변수로 생존 시간을 의미합니다.

  • fstat(0)은 사건 발생 여부 또는 이탈 여부를 나타내는 변수로 (0)은 0 변수를 이탈 변수로 설정한 것 입니다. _ 중도 절단 데이터는 0 / 생존은 1

  • gender 와 age는 독립 변수로 성별과 나이가 생존 시간에 미치는 영향을 분석합니다.

 

SE-14f6a095-cf81-4586-8646-264ab6b1be33.png

 

 

#1

  1. Dependent Variable: 독립변수는 Lenfol 변수 (=환자의 추적기간)

  2. Censoring Variable: 절단변수는 FSTAT

  3. Censing values: 절단값은 0

#2

500명의 데이터를 사용했다.

#3

500명 중 215명이 생존했으며, 285명이 Censoring 데이터이다.

 

 

Version history
Last update:
‎08-28-2023 05:05 AM
Updated by:
Contributors

SAS Innovate 2025: Call for Content

Are you ready for the spotlight? We're accepting content ideas for SAS Innovate 2025 to be held May 6-9 in Orlando, FL. The call is open until September 25. Read more here about why you should contribute and what is in it for you!

Submit your idea!

Article Labels
Article Tags