데이터
사용할 데이터는 ca_lung 데이터로 세가지 변수(도시, 흡연 여부, 폐암 발병 여부)로 이루어져있습니다.
그림 1
분석의 주요 목표는 흡연과 폐암의 관계를 조사하는 것이라고 가정하고, 이전 시간에 배운 것처럼 smoker 변수와 cancer 변수를 교차분류하여 2x2 테이블을 만들어 두 변수 사이의 연관성을 알아 봅니다.
1. 작업 및 유틸리티 ▶ 통계량 ▶ 테이블분석 클릭
2. 데이터 ▶ sasue.ca_lung를 테이블 선택
3. 역할 ▶ smoker을 행 변수로 지정, cancer를 칼럼 변수로 지정, 추가 역할 ▶ count을 할당
4. 옵션 ▶ 통계량 ▶ 카이제곱 적합도 체크 ▶ 점근 검정 체크
5. 옵션 ▶ 통계량 ▶ 도표 ▶ 도표 숨김 체크
6. 옵션 ▶ 통계량 ▶ 오즈비 및 상대 리스크(2x2 테이블 해당) 체크
7. 실행 클릭
그림 2
그림 3
그림 4
카이제곱 검정 결과 유의확률 <.0001로 흡연 여부와 폐암 발병 여부는 관련이 있다고 결론 지을 수 있습니다. 오즈비는 2.1349이고 오즈비의 95%신뢰 한계는 [1.8855, 2.4172]로 흡연자에게서 폐암이 발생할 사건에 대한 오즈가 비흡연자의 경우의 오즈의 1.88~2.41배라고 결론 지을 수 있습니다.
교란변수(Confounding Variable)
한 설명변수와 반응변수 사이의 연관성을 알아보고자 할 때 이들의 관계에 영향을 줄 수있는 다른 변수들을 제어 하는 것은 중요합니다.. 설명변수와 반응변수에 모두 영향을 주면서 설명변수와 반응변수 사이의 연관성 판단에 영향을 주는 변수를 교란변수 (confounding variable)이라고 합니다. 데이터에서 한 설명변수와 반응변수 사이의 연관성을 알아 볼 때, 교란변수를 고려하여 결론을 내려야합니다.
데이터로 돌아와서 앞서 분석과정에서 흡연 여부와 폐암 발병 여부 사이의 연관성을 알아보
기 위하여 도시에 대한 변수 city를 임의로 분석에서 제외 하였습니다. 이러한 절차의 위험을 잘 알려져 있고 경우에 따라서는 변수 사이의 진짜 연관성을 가릴 수 없게 될 수 있습니다.
코크란-멘텔-헨첼 검정(Cochran-Mantel-Haenszel Test)
앞서 진행한 과정에서 아래의 절차를 추가 하여 city 변수를 분석에서 제외하지않고, 도시 별로 오즈비를 다시 계산해보겠습니다.
역할 ▶ smoker을 행 변수로 지정, cancer를 칼럼 변수로 지정, city를 층화 변수로 지정 추가 역할 ▶ count을 할당
그림 5
그림 6
1. 작업 및 유틸리티 ▶ 통계량 ▶ 테이블분석 클릭
2.데이터 ▶ sasue.ca_lung를 테이블 선택
3. 역할 ▶ smoker을 행 변수로 지정, cancer를 칼럼 변수로 지정, city를 층화 변수로 지정 추가 역할 ▶ count을 할당
4. 옵션 ▶ 통계량 ▶ Cochran-Mentel-Haenszel 통계량 체크
5. 옵션 ▶ 통계량 ▶ 도표 ▶ 도표 숨김 체크
6. 옵션 ▶ 통계량 ▶ 오즈비 및 상대 리스크(2x2 테이블 해당) 체크
그림7
그림 8
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.