BookmarkSubscribeRSS Feed

[SAS University Edition] 코크란-멘텔-헨첼 검정(Chocran-Mentel-Heanszel 검정)

Started ‎06-08-2020 by
Modified ‎06-08-2020 by
Views 3,137

데이터

 사용할 데이터는 ca_lung 데이터로 세가지 변수(도시흡연 여부폐암 발병 여부)로 이루어져있습니다. 

 

SE22018112021334370.png

그림 1

 

 분석의 주요 목표는 흡연과 폐암의 관계를 조사하는 것이라고 가정하고이전 시간에 배운 것처럼 smoker 변수와 cancer 변수를 교차분류하여 2x2 테이블을 만들어 두 변수 사이의 연관성을 알아 봅니다.

 

1. 작업 및 유틸리티 ▶ 통계량 ▶ 테이블분석 클릭

2. 데이터 ▶ sasue.ca_lung를 테이블 선택

3. 역할 ▶ smoker을 행 변수로 지정cancer를 칼럼 변수로 지정추가 역할 ▶ count을 할당

4. 옵션 ▶ 통계량 ▶ 카이제곱 적합도 체크 ▶ 점근 검정 체크

5. 옵션 ▶ 통계량 ▶ 도표 ▶ 도표 숨김 체크

6. 옵션 ▶ 통계량 ▶ 오즈비 및 상대 리스크(2x2 테이블 해당) 체크

7. 실행 클릭

 

SE22018112021345570.png

그림 2

 

SE22018112021351670.png

그림 3

 

SE22018112021352970.png

그림 4

 

 카이제곱 검정 결과 유의확률 <.0001로 흡연 여부와 폐암 발병 여부는 관련이 있다고 결론 지을 수 있습니다. 오즈비는 2.1349이고 오즈비의 95%신뢰 한계는 [1.8855, 2.4172]로 흡연자에게서 폐암이 발생할 사건에 대한 오즈가 비흡연자의 경우의 오즈의 1.88~2.41배라고 결론 지을 수 있습니다.

 

교란변수(Confounding Variable)

 

 한 설명변수와 반응변수 사이의 연관성을 알아보고자 할 때 이들의 관계에 영향을 줄 수있는 다른 변수들을 제어 하는 것은 중요합니다.. 설명변수와 반응변수에 모두 영향을 주면서 설명변수와 반응변수 사이의 연관성 판단에 영향을 주는 변수를 교란변수 (confounding variable)이라고 합니다. 데이터에서 한 설명변수와 반응변수 사이의 연관성을 알아 볼 때, 교란변수를 고려하여 결론을 내려야합니다.

 

 데이터로 돌아와서 앞서 분석과정에서 흡연 여부와 폐암 발병 여부 사이의 연관성을 알아보

기 위하여 도시에 대한 변수 city를 임의로 분석에서 제외 하였습니다. 이러한 절차의 위험을 잘 알려져 있고 경우에 따라서는 변수 사이의 진짜 연관성을 가릴 수 없게 될 수 있습니다.

 

코크란-멘텔-헨첼 검정(Cochran-Mantel-Haenszel Test)

 

 앞서 진행한 과정에서 아래의 절차를 추가 하여 city 변수를 분석에서 제외하지않고, 도시 별로 오즈비를 다시 계산해보겠습니다.

 

역할  smoker 행 변수로 지정, cancer 칼럼 변수로 지정, city 층화 변수로 지정 추가 역할  count을 할당 

 

 

SE22018112021454170.png

그림 5

 

SE22018112021463970.png

그림 6

 

 그림6의 결과를 보면 도시 별로 나누었을 때의 오즈비가 그 전의 결과와 달라진 것을 확인할 수 있습니다특히 city = Zhengzho 일 때 의 오즈비가 1.5880으로 그 값이 확연히 낮아졌음을 확인할 수 있습니다.
 
​ 교란변수를 보정하는 방법의 하나로 코크란-멘텔-헨첼 검정 방법이 있습니다. 2x2 테이블에서 오즈비를 구할 때 교란변수를 보정하여 공통 오즈비를 구하는 방법입니다. (더 자세한 설명은 범위를 벗어나므로 생략하겠습니다.) SASstuidio에서 코크란-멘텔-헨첼 검정을 직접 구현해보겠습니다.
 

1. 작업 및 유틸리티 ▶ 통계량 ▶ 테이블분석 클릭

2.데이터 ▶ sasue.ca_lung를 테이블 선택

3. 역할 ▶ smoker을 행 변수로 지정cancer를 칼럼 변수로 지정city 층화 변수 지정 추가 역할 ▶ count을 할당

4. 옵션 ▶ 통계량 ▶ Cochran-Mentel-Haenszel 통계량 체크

5. 옵션 ▶ 통계량 ▶ 도표 ▶ 도표 숨김 체크

6. 옵션 ▶ 통계량 ▶ 오즈비 및 상대 리스크(2x2 테이블 해당) 체크

7. 실행 클릭
 

SE22018112021475070.png

그림7

 

SE22018112021492870.png

그림 8

 

 
 검정 결과를 해석해보겠습니다. 3번째 표를 보면 유의확률은 0.1866으로, 고려된 4개 도시
에서 흡연 여부와 폐암 발병 여부와 관계에 대한 확률 비율이 서로 다르다는 증거는 없다고 
결론 지을 수 있습니다. 두번째 표의 공통 오즈비를 보면 2.1450로 흡연자에게서 폐암이 발생
할 사건에 대한 오즈가 비흡연자의 경우의 오즈의 약 2.15배라고 결론 지을 수 있습니다.
 
Reference
도서-Essential Statistics Using SAS University Edition/ Der. Geoff, Everitt, Brian S. / SASInstitute 
도서-범주형 자료분석 개론 제2/ Alan Agresti 저 정광모최용석 편저자유아카데미
 
Version history
Last update:
‎06-08-2020 10:34 PM
Updated by:
Contributors

sas-innovate-white.png

Special offer for SAS Communities members

Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.

 

View the full agenda.

Register now!

Article Tags