안녕하세요 MYSAS 홍보대사 최준입니다.
저번 시간에 이어서 이번에는
로지스틱 회귀분석을 통해 최종 대출의 상환 여부를 구분해보겠습니다.
[모델]탭의 [회귀분석] 노드를 [결측값 처리] 노드 뒤에 끌어다놓고 연결합니다.
[회귀분석] - [모델 선택] 설정을 통해서 '단계별 선택'으로 설정하고 진행해보겠습니다.
오즈비(Odds Ratio)는 모델 해석에 유용하게 스입니다. 오즈비는 입력변수의 종속변수에 대한 인과관게를 설명해 주는 것으로
채택된 변수의 오즈비가 1을 넘으면 인과관게가 높은 것으로 파악하시면 됩니다.
[결과]창을 보신다면, Estimate가 양의 값인 변수는 값이 증가할수록 위험도 같이 증가함을 의미합니다.
반면에 Estimate가 음의 값인 변수는 값이 감소할수록 위험이 증가함을 의미합니다.
평균 이익을 확인하기 위해서는 회귀분석 [결과]창에서
[보기] [모델] [반복도표]를 선택하고, 나타내어지는 기준값으로 평균 이익을 선택하면
모델 선택 단계에 따른 평균 이익을 볼 수 있습니다.
평균이익 = 1 + KS 통계량 이기 때문에 KS통계량은 0.43임을 알 수 있습니다.
앞서 생성한 단계별 선택 회귀 모델의 성능을 확인하기 위해서 신경망 모델을 이용해 보겠습니다.
[모델]탭의 [신경망]노드를 다이어그램으로 끌고와 [회귀분석]노드 뒤에 연결하면
신경망 모델의 기본 입력변수의 설정은 자동으로 단계별 선택 회귀 모델에서 선정된 변수가 적용됩니다.
[신경망]노드 결과를 보시면 단계별 선택 회귀 모델 보다 신경망 모델의 평균 이익이 조금 더 높은 것을 확인할 수 있습니다.
따라서 회귀 모델의 입력 변수에 적절한 변환을 취한다면, 회귀 모델의 에측력을 높일 수 있음을 유추할 수 있습니다.
앞에서 [통계량탐색] 노드 결과 왜도가 높았었음을 확인할 수 있었습니다.
이를 해결하기 위해 [변수변환]노드 속성 패널의 [기본 방법]설정에서 [interval 입력] 부분을
'Maximum Normal(정규성의 극대화)'로 설정한 후에 [회귀분석] 노드를 연결하여 모델 성능이 향상되었는지 확인해보겠습니다.
표를 보면 모델이 복잡해질수록 평균 이익이 증가하는 형태임을 볼 수 있습니다.
하지만 모델의 성능은 변수를 변환하지 않은 단계별 선택법을 이용한 회귀 모델과 큰 차이가 없음을 발견할 수 있습니다.
앞서 선행한 두 실습에서의 한계를 극복하기 위해
이번에는 '변수 구간화를 통한 회귀분석(Discretized stepwise Regression)'을 실시해 보겠습니다.
이번에는 연속형 입력변수에 대해 Bucket, Quantile, OptimalBinning 3가지 구간화 방법을 이용할 것입니다.
Bucket 방법은 구간의 너비(width)가 동일하도록 분할합니다.
Quantile 방법은 각 구간에 들어있는 자료의 수가 동일하도록 분위수를 이용하여 분할합니다.
Optimal Binning 방법은 각 입력변수마다 의사결정트리를 이용해 최적 구간을 찾아 분할합니다.
[변수변환]노드 속성 패널의 [기본 방법]설정에서 [Interval 입력] 부분을
'Bucket/Quantile/OptimalBinning'으로 설정한뒤 실행하면 됩니다.
이제 마지막으로 [평가]탭의 [모델비교] 노드를 다이어그램으로 끌고 와 앞의 실습에서 실행하였던
회귀 모델들과 다음과 같이 연결합니다.
[출력]창을 보면 다음과 같이 각 모델의 적합통계량이 나타납니다.
평균 이익을 기준으로 하였을 때 가장 뛰어난 모델은 변수 변환을 하지 않은 단계별 선택 회귀 모델입니다.(Reg -> 1.428)
신경망 모델은 KS통계량이 제일 높음을 확인할 수 있습니다.(Neural -> 0.45)
ROC 지수가 가장 큰 모델은 Maximum Normal방법을 농해 비대칭 입력 변수를 변환하여 사용한 단계별 선택 회귀 모델입니다.
만약 신용 위험 평가 모델 개발이 목적이라면, 의사결정 통계량인 ROC 지수가 가장 높은 모델,
즉, 평균 이익을 Maximum Normal 방법으로 입력변수를 변환한 단계별 선택 회귀 모델을 선택하면 됩니다.
지금까지 연관성분석 노드에 대해서 살펴보았습니다.
기타 궁금하신 점이 있으시다면
언제든지 저에게 쪽지 or 댓글로 문의해주시면 친절하게 답변해드리겠습니다.
감사합니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.