<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic 고객 유지 전략을 최적화하기 위해 은행 이탈률 분석 in SAS News and Q&amp;A</title>
    <link>https://communities.sas.com/t5/SAS-News-and-Q-A/%EA%B3%A0%EA%B0%9D-%EC%9C%A0%EC%A7%80-%EC%A0%84%EB%9E%B5%EC%9D%84-%EC%B5%9C%EC%A0%81%ED%99%94%ED%95%98%EA%B8%B0-%EC%9C%84%ED%95%B4-%EC%9D%80%ED%96%89-%EC%9D%B4%ED%83%88%EB%A5%A0-%EB%B6%84%EC%84%9D/m-p/964912#M170</link>
    <description>&lt;P&gt;&lt;FONT color="#000000"&gt;&lt;A href="https://communities.sas.com/t5/SAS-Communities-Library/Analyzing-Banking-Churn-Rates-to-Optimize-Customer-Retention/ta-p/955652" target="_self"&gt;미국 Communites Site&lt;/A&gt;에 게시된&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;글을 번역하여 공유드립니다.&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;가볍게 읽어보시고, 진행 중인 댓글 이벤트에도 많은 참여 부탁드립니다!&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;원제:&amp;nbsp;Analyzing Banking Churn Rates to Optimize Customer Retention Strategies&lt;/LI&gt;
&lt;LI&gt;저자:&amp;nbsp;DeeMckoy&amp;nbsp;&lt;/LI&gt;
&lt;LI&gt;포스팅 날짜: ‎01-09-2025&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;FONT color="#000000"&gt;-----------------------------------------------------------------&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT size="5" color="#3366FF"&gt;&lt;STRONG&gt;고객 유지 전략을 최적화하기 위해 은행 이탈률 분석&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;오늘날의 사회에서 고객 이탈률을 이해하는 것은 고객을 유지하고 회사의 전반적인 성과를 개선하는 데 필수적입니다&lt;SPAN&gt;. &lt;/SPAN&gt;비즈니스 산업에서 이탈 분석을 통해 프로모션 요청&lt;SPAN&gt;, &lt;/SPAN&gt;고객 만족과 관련된 특정 문제 해결&lt;SPAN&gt;, &lt;/SPAN&gt;현재 고객 또는 신규 고객에게 할인 광고와 같은 회사의 방향성을 결정할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이번 포스트에서는&lt;SPAN&gt;&amp;nbsp;&lt;A href="https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction" target="_blank" rel="noopener"&gt;Kaggle&lt;/A&gt;&lt;/SPAN&gt;을 통해 제공하는 가상의 은행에 대한 고객 이탈률을 살펴보도록 하겠습니다&lt;SPAN&gt;. &lt;/SPAN&gt;우리는 고객이 은행에서 이탈하는 이유에 대한 몇 가지 주요 요인을 더 잘 이해하고자 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;데이터 세트는&lt;SPAN&gt; 10,001&lt;/SPAN&gt;개의 관측값이 있는&lt;SPAN&gt; 14&lt;/SPAN&gt;개의 열로 구성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 데이터 세트의 일부 변수는 다음과 같이 구성됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;SPAN&gt;Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;CreditScore(&lt;/SPAN&gt;신용점수&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;CustomerID(&lt;/SPAN&gt;고객&lt;SPAN&gt;ID)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;EstimatedSalary(&lt;/SPAN&gt;예상급여&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Gender(&lt;/SPAN&gt;성별&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;국가&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;HasCrCard(&lt;/SPAN&gt;신용카드보유여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Surname(&lt;/SPAN&gt;성씨&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Tenure(&lt;/SPAN&gt;재직기간&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_11-1745374977322.png" style="width: 784px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106444iA4A485AD1E06F3D0/image-dimensions/784x642?v=v2" width="784" height="642" role="button" title="jennyryu_11-1745374977322.png" alt="jennyryu_11-1745374977322.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;먼저&lt;SPAN&gt; SAS Viya &lt;/SPAN&gt;소프트웨어를 사용하여 모델링을 위하여 &lt;SPAN&gt;“&lt;/SPAN&gt;데이터 분할&lt;SPAN&gt;”&lt;/SPAN&gt;을 설정합니다&lt;SPAN&gt;.&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;이때&lt;SPAN&gt;, &lt;/SPAN&gt;학습과 검증의 비율은 보통&lt;SPAN&gt; 6:4, 7:3&lt;/SPAN&gt;으로 설정을 하며&lt;SPAN&gt;, &lt;/SPAN&gt;테스트는 홀드아웃 테스트를 일반적으로 진행하기 때문에&lt;SPAN&gt; 0&lt;/SPAN&gt;으로 지정합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;그런 다음 모델링의 주목적인 타겟 변수를 식별하는 것으로 시작합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 분석의 타겟 변수는 범주형 이진 변수인&lt;SPAN&gt; "Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;)"&lt;/SPAN&gt;가 될 것입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_12-1745374977323.png" style="width: 356px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106445i172D75DAB0A39017/image-dimensions/356x554?v=v2" width="356" height="554" role="button" title="jennyryu_12-1745374977323.png" alt="jennyryu_12-1745374977323.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;파이프라인의 타겟 변수를 설정한 후 다음으로&lt;SPAN&gt; "&lt;/SPAN&gt;데이터 탐색&lt;SPAN&gt;"&lt;/SPAN&gt;을 사용하여 데이터를 확인하려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 노드는 어떤 변수가 중요한지 더 자세히 알려주고 데이터 내의 변수에 대한 더 나은 통찰력을 제공합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_13-1745374977324.png" style="width: 369px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106443i6FED27F3F0C53259/image-dimensions/369x341?v=v2" width="369" height="341" role="button" title="jennyryu_13-1745374977324.png" alt="jennyryu_13-1745374977324.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;파이프라인 실행이 완료되면&lt;SPAN&gt; "&lt;/SPAN&gt;데이터 탐색&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 마우스 오른쪽 버튼으로 클릭하고 &lt;SPAN&gt;“&lt;/SPAN&gt;결과&lt;SPAN&gt;”&lt;/SPAN&gt;를 확인합니다&lt;SPAN&gt;. &lt;/SPAN&gt;결과는 &lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;), Tenure(&lt;/SPAN&gt;재직기간&lt;SPAN&gt;), Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;와 같은 변수에 대한 시각화로 구성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;이렇게 하면 파이프라인을 빌드하는 방법을 더 잘 이해하는 데 도움이 됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;상대적 중요도&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_14-1745374977330.png" style="width: 745px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106446i42B988AA38C11ABA/image-dimensions/745x314?v=v2" width="745" height="314" role="button" title="jennyryu_14-1745374977330.png" alt="jennyryu_14-1745374977330.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 상대적으로 중요도가 높은 변수에 대한 통찰력을 얻을 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;는 상대적 중요도가&lt;SPAN&gt; 1.0&lt;/SPAN&gt;이고 &lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;)&lt;/SPAN&gt;는 상대적 중요도가&lt;SPAN&gt; 0.987%&lt;/SPAN&gt;입니다&lt;SPAN&gt;. &lt;/SPAN&gt;우리는 또한&lt;SPAN&gt; "IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)", Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;), Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;국가&lt;SPAN&gt;) &lt;/SPAN&gt;및 &lt;SPAN&gt;CreditScore(&lt;/SPAN&gt;신용점수&lt;SPAN&gt;)&lt;/SPAN&gt;와 같이 중요하지만&lt;SPAN&gt; 50 % &lt;/SPAN&gt;미만인 것을 볼 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_15-1745374977335.png" style="width: 753px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106448i54617006D1B2244E/image-dimensions/753x362?v=v2" width="753" height="362" role="button" title="jennyryu_15-1745374977335.png" alt="jennyryu_15-1745374977335.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 발생 수준을 이해하기 위해 &lt;SPAN&gt;“&lt;/SPAN&gt;범주형 변수&lt;SPAN&gt;”&lt;/SPAN&gt;의 카디널리티를 살펴봅니다&lt;SPAN&gt;. &lt;/SPAN&gt;카디널리티는 데이터 속성이 데이터 세트에서 사용할 수 있는 고유 값의 수입니다&lt;SPAN&gt;. Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;나라&lt;SPAN&gt;)&lt;/SPAN&gt;에 대한 카디널리티가 높다는 것을 알 수 있습니다&lt;SPAN&gt;. "HasCrCard(&lt;/SPAN&gt;신용카드 보유여부&lt;SPAN&gt;)" &lt;/SPAN&gt;및 &lt;SPAN&gt;“IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)”&lt;/SPAN&gt;에 대한 중간 카디널리티는 레벨 수가 &lt;SPAN&gt;3&lt;/SPAN&gt;입니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, “&lt;/SPAN&gt;연속형 변수&lt;SPAN&gt;”&lt;/SPAN&gt;에 대한 기초 통계량은 확인할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_16-1745374977341.png" style="width: 863px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106447i0F4ACBFB7109AF9C/image-dimensions/863x184?v=v2" width="863" height="184" role="button" title="jennyryu_16-1745374977341.png" alt="jennyryu_16-1745374977341.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위 그림에서 연령은&lt;SPAN&gt; 18&lt;/SPAN&gt;세에서&lt;SPAN&gt; 92&lt;/SPAN&gt;세의 분포를 보이며&lt;SPAN&gt;, &lt;/SPAN&gt;평균 연령은&lt;SPAN&gt; 38.9&lt;/SPAN&gt;세 입니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, &lt;/SPAN&gt;재직기간은&lt;SPAN&gt; 0 ~ 10&lt;/SPAN&gt;년의 분포를 보이며 평균 재직기간은&lt;SPAN&gt; 5&lt;/SPAN&gt;년임을 알 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;다음으로&lt;SPAN&gt;, &lt;/SPAN&gt;은행 회사를 떠나는 고객의&lt;SPAN&gt; "&lt;/SPAN&gt; &lt;SPAN&gt;Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;) " &lt;/SPAN&gt;빈도 백분율을 살펴봅니다&lt;/P&gt;
&lt;P&gt;우리의 주된 관심사항인 회사에서 얼마나 많은 고객이 이탈했는지&lt;SPAN&gt;(1 = &lt;/SPAN&gt;예&lt;SPAN&gt;, 0 = &lt;/SPAN&gt;아니오&lt;SPAN&gt;)&lt;/SPAN&gt;를 살펴보기로 하겠습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_17-1745374977345.png" style="width: 784px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106451iAAF69D976892C946/image-dimensions/784x388?v=v2" width="784" height="388" role="button" title="jennyryu_17-1745374977345.png" alt="jennyryu_17-1745374977345.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위그림에서는 은행이 고객의&lt;SPAN&gt; 80%&lt;/SPAN&gt;를 유지할 수 있었고 회사에서 이탈한 사람은&lt;SPAN&gt; 20%&lt;/SPAN&gt;인 것을 알 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;고객이 이탈했을 수 있는 이유를 이해하고 고객의 유지 수준을 평가하여&lt;SPAN&gt; 80% &lt;/SPAN&gt;이상으로 유지하는 방법을 찾으려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이제 섹션의&lt;SPAN&gt; "&lt;/SPAN&gt;대체&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 사용하여 이상값을 대체해야 합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_18-1745374977346.png" style="width: 419px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106450i6409E3A0423455F3/image-dimensions/419x394?v=v2" width="419" height="394" role="button" title="jennyryu_18-1745374977346.png" alt="jennyryu_18-1745374977346.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;"&lt;/SPAN&gt;대체&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 사용하면 지정된 값으로 모든 이상치와 알 수 없는 클래스 수준을 대체하고 제거할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이렇게 하면 데이터 세트 내에 있을 수 있는 가능한 오류를 조정하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_19-1745374977347.png" style="width: 374px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106449i31DB501E48E3292F/image-dimensions/374x627?v=v2" width="374" height="627" role="button" title="jennyryu_19-1745374977347.png" alt="jennyryu_19-1745374977347.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위 그림과 같이 범주형 또는 연속형 변수에 대하여 다양한 방법으로 대체를 수행할 수 있습니다&lt;SPAN&gt;.&amp;nbsp; &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이 후&lt;SPAN&gt;, &lt;/SPAN&gt;우리는 데이터 세트에서 변환 노드를 수행하며&lt;SPAN&gt;, &lt;/SPAN&gt;이 노드는 입력 변수에 숫자 또는 구간화&lt;SPAN&gt;(Binning)&lt;/SPAN&gt;를 적용합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_20-1745374977348.png" style="width: 349px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106452iE3E8A64219E56469/image-dimensions/349x544?v=v2" width="349" height="544" role="button" title="jennyryu_20-1745374977348.png" alt="jennyryu_20-1745374977348.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;각 변환에 대해 결측처리와 같이 새로운 변수가 생성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;변환을 사용하면 접두사가 사용된 변환에 따라 달라집니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, &lt;/SPAN&gt;로그 변환된 변수는&lt;SPAN&gt; LOG_&lt;/SPAN&gt;로 시작합니다&lt;SPAN&gt;. &lt;/SPAN&gt;연속형 변수의 변환방법은 디폴트로 &lt;SPAN&gt;“(&lt;/SPAN&gt;없음&lt;SPAN&gt;)”&lt;/SPAN&gt;로 설정되며 원래 변수는 데이터 세트에서 삭제되지 않지만 기본적으로&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;STRONG&gt;거부됨&lt;/STRONG&gt;으로 설정되므로 모델에서 사용되지 않습니다&lt;SPAN&gt;. &lt;/SPAN&gt;나머지 입력은 기본 설정으로 유지되며&lt;SPAN&gt; WOE(&lt;/SPAN&gt;희귀 차단 및 증거 가중치&lt;SPAN&gt;) &lt;/SPAN&gt;조정 값은&lt;SPAN&gt; 0.5&lt;/SPAN&gt;로 유지됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_21-1745374977350.png" style="width: 300px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106453iE6C0D8D61F48BF65/image-dimensions/300x875?v=v2" width="300" height="875" role="button" title="jennyryu_21-1745374977350.png" alt="jennyryu_21-1745374977350.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;변환&lt;SPAN&gt;” &lt;/SPAN&gt;노드에 대한 매개 변수를 설정한 후 연속형 변수&lt;SPAN&gt; "&lt;/SPAN&gt;변환방법&lt;SPAN&gt;"&lt;/SPAN&gt;을 &lt;SPAN&gt;“&lt;/SPAN&gt;로그&lt;SPAN&gt;”&lt;/SPAN&gt;로 변경하려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;그 이유는 왜도를 줄이고 데이터 분포를 돕는 데 도움이 되는 것입니다&lt;SPAN&gt;. &lt;/SPAN&gt;변환 노드가 성공적으로 실행된 후 입력 변수 통계&lt;SPAN&gt;, &lt;/SPAN&gt;변환된 변수 요약을 볼 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_22-1745374977353.png" style="width: 958px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106454i1120AC6988BD95F4/image-dimensions/958x231?v=v2" width="958" height="231" role="button" title="jennyryu_22-1745374977353.png" alt="jennyryu_22-1745374977353.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 &lt;SPAN&gt;“&lt;/SPAN&gt;대체&lt;SPAN&gt;” &lt;/SPAN&gt;노드의 왜도를 확인하기 위해 연속형 변수를 살펴봅니다&lt;SPAN&gt;. &lt;/SPAN&gt;왜도&lt;SPAN&gt;(Skewness)&lt;/SPAN&gt;는 변수 분포의 대칭성을 측정하며&lt;SPAN&gt;, &lt;/SPAN&gt;이로 인해 분포가 오른쪽 또는 왼쪽 꼬리 쪽으로 늘어납니다&lt;SPAN&gt;. &lt;/SPAN&gt;대체된 &lt;SPAN&gt;Estimated Salary(&lt;/SPAN&gt;예상 급여&lt;SPAN&gt;)&lt;/SPAN&gt;의 경우 왜도는&lt;SPAN&gt; 0.0133&lt;/SPAN&gt;으로 정규분포의 이상적인 왜도값인 &lt;SPAN&gt;0&lt;/SPAN&gt;에 가깝습니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한 대체된 &lt;SPAN&gt;Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;) &lt;/SPAN&gt;변수의 경우 왜도값은 &lt;SPAN&gt;0.9672&lt;/SPAN&gt;이며&lt;SPAN&gt;, &lt;/SPAN&gt;대체된 &lt;SPAN&gt;Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;), Credit Score(&lt;/SPAN&gt;신용 점수&lt;SPAN&gt;) &lt;/SPAN&gt;변수는 음의 왜도값을 확인할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_23-1745374977357.png" style="width: 1061px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106457iE30E230D4351C567/image-dimensions/1061x175?v=v2" width="1061" height="175" role="button" title="jennyryu_23-1745374977357.png" alt="jennyryu_23-1745374977357.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 변환 요약에는 대체된 입력 변수와 각 변수에 사용된 변환 공식이 표시됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;공식&lt;SPAN&gt;, “n +1”&lt;/SPAN&gt;을 수행하는 이유는 연속형 변수에 대한 음수 값을 제거하기 위해 설정된 메타데이터 제한으로 인해 변수 입력이&lt;SPAN&gt; 0&lt;/SPAN&gt;인 경우 오류를 피하기 위한 것입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이제 데이터 변환을 처리했으므로 &lt;SPAN&gt;“&lt;/SPAN&gt;결측값 처리&lt;SPAN&gt;” &lt;/SPAN&gt;노드를 사용하여 범주형 및 연속형 입력변수에 대한 결측값을 확인하려고 합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;결측값 처리&lt;SPAN&gt;” &lt;/SPAN&gt;노드의 경우 기본 매개 변수로 입력 설정을 유지합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_24-1745374977359.png" style="width: 225px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106455iAA6B0A5AA55B5BB9/image-dimensions/225x906?v=v2" width="225" height="906" role="button" title="jennyryu_24-1745374977359.png" alt="jennyryu_24-1745374977359.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;결측값 처리의 경우 범주형 변수의 기본 방법은 &lt;SPAN&gt;“&lt;/SPAN&gt;개수&lt;SPAN&gt;”&lt;/SPAN&gt;가 되고 연속형 변수의 경우 설정된 &lt;SPAN&gt;“&lt;/SPAN&gt;데이터 제한 백분율&lt;SPAN&gt;”(&lt;/SPAN&gt;디폴트&lt;SPAN&gt; 5%)&lt;/SPAN&gt;이 절삭 또는 윈저화된 데이터를 사용하여 설정된 기본방법&lt;SPAN&gt;(&lt;/SPAN&gt;디폴트 &lt;SPAN&gt;“&lt;/SPAN&gt;평균&lt;SPAN&gt;”)&lt;/SPAN&gt;으로 결측값을 처리합니다&lt;SPAN&gt;. &lt;/SPAN&gt;지도 학습 노드 섹션과 선택된 노드를 살펴보기 전에 변수 선택 노드를 살펴보겠습니다&lt;SPAN&gt;. &lt;/SPAN&gt;변수 선택 노드는 변수 선택의 비지도 및 여러 지도 방법을 수행하여 입력 수를 줄입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_25-1745374977361.png" style="width: 232px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106456i0D9D8214723989EC/image-dimensions/232x630?v=v2" width="232" height="630" role="button" title="jennyryu_25-1745374977361.png" alt="jennyryu_25-1745374977361.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;변수 선택&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 입력 변수를 식별하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;타겟 변수에 대한 유용한 예측을 수행하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;그런 다음 입력 변수에서 수집된 정보를 지도 학습 노드에서 더 자세히 평가할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_26-1745374977366.png" style="width: 663px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106459i156CF6CDAC7E74E1/image-dimensions/663x604?v=v2" width="663" height="604" role="button" title="jennyryu_26-1745374977366.png" alt="jennyryu_26-1745374977366.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;파이프라인이 성공적으로 실행되면 &lt;SPAN&gt;“&lt;/SPAN&gt;모델 비교&lt;SPAN&gt;” &lt;/SPAN&gt;노드에서 선택한 개별 알고리즘 노드를 평가할 수 있습니다&lt;SPAN&gt;. “&lt;/SPAN&gt;로지스틱 회귀&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 이항&lt;SPAN&gt;(Binary) &lt;/SPAN&gt;및 명목&lt;SPAN&gt;(Nominal) &lt;/SPAN&gt;변수의 값을 예측하려고 시도합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;로지스틱 회귀&lt;SPAN&gt;” &lt;/SPAN&gt;노드를 선택하는 이유는 개별 관측치가 타겟 변수의 관심 수준에 속하는지 여부에 대한 확률을 근사화 할 수 있는 기능이 있기 때문입니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 하나 이상의 예측변수 데이터 항목의 값을 사용하여 값 응답 데이터 항목을 예측합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드 사용의 또 다른 이점은 누락된 데이터를 처리한다는 것인데&lt;SPAN&gt;, &lt;/SPAN&gt;이는 타겟 변수에서 예측을 생성하는 데 도움이 되는 일련의 규칙을 통해 처리할 수 있습니다&lt;SPAN&gt;. “&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델은 분석 데이터 세트를 여러 번 재표본 추출하여 해당 데이터 세트의 가중 평균을 반영하여 예측 결과를 생성하는 부스팅&lt;SPAN&gt;(Boosting) &lt;/SPAN&gt;접근 방식을 제공합니다&lt;SPAN&gt;. &lt;/SPAN&gt;마지막으로&lt;SPAN&gt;, &lt;/SPAN&gt;우리는 &lt;SPAN&gt;“&lt;/SPAN&gt;신경망&lt;SPAN&gt;”&lt;/SPAN&gt;이 인간의 뇌를 모방하며&lt;SPAN&gt;, &lt;/SPAN&gt;은닉층이 있는 예측 변수&lt;SPAN&gt;, &lt;/SPAN&gt;타겟&lt;SPAN&gt;(&lt;/SPAN&gt;또는 출력&lt;SPAN&gt;) &lt;/SPAN&gt;레이어 및 각 레이어 간의 연결로 구성되어 있음을 살펴봅니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_27-1745374977367.png" style="width: 1032px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106458iD6C04A608EDD7D8F/image-dimensions/1032x181?v=v2" width="1032" height="181" role="button" title="jennyryu_27-1745374977367.png" alt="jennyryu_27-1745374977367.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;우리는 상위 두 모델인 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;(&lt;/SPAN&gt;챔피언 모델&lt;SPAN&gt;)”&lt;/SPAN&gt;과 &lt;SPAN&gt;“&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드만 살펴볼 것입니다&lt;SPAN&gt;. &lt;/SPAN&gt;두 모델은&lt;SPAN&gt; 86%&lt;/SPAN&gt;의 정확도를 보였으며&lt;SPAN&gt;, &lt;/SPAN&gt;모델 선택 기준인 &lt;SPAN&gt;“KS &lt;/SPAN&gt;통계량&lt;SPAN&gt;”&lt;/SPAN&gt;이&lt;SPAN&gt; 0.5132&lt;/SPAN&gt;로 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델이 챔피언 모델로 선정되었습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;그래디언트 부스팅&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_28-1745374977370.png" style="width: 1065px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106460iB79C35393114D489/image-dimensions/1065x192?v=v2" width="1065" height="192" role="button" title="jennyryu_28-1745374977370.png" alt="jennyryu_28-1745374977370.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;변수 중요도에 대한 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델을 살펴보면 연령&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;은 상대적 중요도가&lt;SPAN&gt; 1&lt;/SPAN&gt;이고 타겟 변수에 대한 상대적 중요도가 &lt;SPAN&gt;68%&lt;/SPAN&gt;인 제품수&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;를 볼 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이것은 은행 회원의 연령과 그들이 회사에서 소유하고 있는 제품의 수를 살펴보는 것을 제안합니다&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_29-1745374977380.png" style="width: 785px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106462iE929279713F94101/image-dimensions/785x460?v=v2" width="785" height="460" role="button" title="jennyryu_29-1745374977380.png" alt="jennyryu_29-1745374977380.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;평균 제곱 오차에 대한 오차 플롯은 트리 수가 증가함에 따라 훈련 오류가 감소하는 것을 보여주지만&lt;SPAN&gt;, &lt;/SPAN&gt;검증 오류가 감소 후 증가를 보이거나 학습&lt;SPAN&gt;(Train)&lt;/SPAN&gt;과 검증&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 차이가 많으면 이는 과적합의 징후일 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 모델의 경우 검증 데이터&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 최소 오차는&lt;SPAN&gt; 0.109&lt;/SPAN&gt;이고 &lt;SPAN&gt;29&lt;/SPAN&gt;개의 트리에 대해 발생하므로 검증 오류는 마지막 트리에서 계속 감소하고 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, &lt;/SPAN&gt;학습&lt;SPAN&gt;(Train)&lt;/SPAN&gt;과 검증&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 최소 오차 차이가&lt;SPAN&gt; 0.01&lt;/SPAN&gt;으로 과적합을 방지하기 위하여 모델의 옵션이나 조기중지 옵션을 수정해야 할 수도 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;의사결정트리&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;데이터에 대한 더 많은 인사이트를 얻기 위해 의사결정트리 결과를 살펴봅니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드보다 정확도가 &lt;SPAN&gt;0.2% &lt;/SPAN&gt;낮았을 뿐이며&lt;SPAN&gt;, &lt;/SPAN&gt;이는&lt;SPAN&gt; 86%&lt;/SPAN&gt;에서 여전히 허용 가능한 것으로 간주됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;그러나&lt;SPAN&gt;, KS &lt;/SPAN&gt;통계량이 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드보다 &lt;SPAN&gt;0.05&lt;/SPAN&gt;이상 낮기 때문에 챔피언 모델로 사용하기에는 부족한 것도 사실입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_30-1745374977382.png" style="width: 985px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106461iC5619B114752ECDB/image-dimensions/985x155?v=v2" width="985" height="155" role="button" title="jennyryu_30-1745374977382.png" alt="jennyryu_30-1745374977382.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;”&lt;/SPAN&gt;의 변수 중요도는 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드 결과와 다르게 제품수&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;가 &lt;SPAN&gt;1&lt;/SPAN&gt;순위로 높았으며&lt;SPAN&gt;, &lt;/SPAN&gt;연령&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;은 상대적 중요도가 &lt;SPAN&gt;0.8219&lt;/SPAN&gt;임을 알 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_31-1745374977394.png" style="width: 974px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106463i0CF25EF0AC72F562/image-dimensions/974x575?v=v2" width="974" height="575" role="button" title="jennyryu_31-1745374977394.png" alt="jennyryu_31-1745374977394.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 향상도&lt;SPAN&gt;(Lift) &lt;/SPAN&gt;보고서를 검토하여 타겟 이벤트와 관련된 누적향상도를 이해합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 결과는 모델이 모집단에서 양성 사례&lt;SPAN&gt;(&lt;/SPAN&gt;퇴사한 사람&lt;SPAN&gt;)&lt;/SPAN&gt;를 얼마나 잘 식별하는지 평가하는 데 사용됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;누적향상도가 높을수록 모델이 특히 예측이 더 높은 확률 그룹에서 이러한 이탈고객을 더 잘 식별할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;검증용&lt;SPAN&gt;(Validate) &lt;/SPAN&gt;데이터에 대한 누적향상도가&lt;SPAN&gt; 3.9098&lt;/SPAN&gt;이고 학습용&lt;SPAN&gt;(Train) &lt;/SPAN&gt;데이터에 대한 누적향상도가&lt;SPAN&gt; 3.8766&lt;/SPAN&gt;인 것은 모델이 고객 이탈 스코어 상위&lt;SPAN&gt; 10%&lt;/SPAN&gt;에 속하는 사람들을 식별하는 데 매우 우수하다는 것을 보여줍니다&lt;SPAN&gt;. &lt;/SPAN&gt;이는 이탈할 가능성이 높은 상위&lt;SPAN&gt; 10% &lt;/SPAN&gt;고객을 선별하는 데 매우 유용하게 적용할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT size="3" color="#3366FF"&gt;&lt;STRONG&gt;결론&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;결론적으로&lt;SPAN&gt;, &lt;/SPAN&gt;머신러닝 모델 파이프라인을 수행하여 얻은 지식은 고객이 은행을 떠나는 이유를 이해하는 데 엄청난 통찰력을 제공합니다&lt;SPAN&gt;. &lt;/SPAN&gt;지도 학습 노드&lt;SPAN&gt;(&lt;/SPAN&gt;그래디언트 부스팅 및 의사결정트리&lt;SPAN&gt;)&lt;/SPAN&gt;를 사용하여 이탈률을 줄이는 데 도움이 될 수 있는 주요 변수에 대한 통찰력 있는 지식을 얻었으며&lt;SPAN&gt;, &lt;/SPAN&gt;이를 통해 유지율을 크게 향상시킬 수 있었습니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, &lt;/SPAN&gt;잠재적으로 젊은 고객을 타겟팅하고 데이터 세트에 나열된 지역&lt;SPAN&gt;-&lt;/SPAN&gt;나라의 지리적 어려움을 해결하기 위한 광고 홍보에 초점을 맞출 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT color="#3366FF"&gt;&lt;STRONG&gt;자세한 정보:&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/default/vdmmladvug/n0wthqppw0ohm1n14y6szxzj15yo.htm" target="_blank" rel="noopener"&gt;지도 학습 개요&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://support.sas.com/en/software/machine-learning-on-sas-viya.html" target="_blank" rel="noopener"&gt;SAS Viya 파이프라인&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction" target="_blank" rel="noopener"&gt;은행 데이터셋&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/default/vdmmladvug/n0wthqppw0ohm1n14y6szxzj15yo.htm" target="_blank" rel="noopener"&gt;그래디언트 부스팅&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/v_027/vdmmlref/p0eu2y2vpivlbtn1pnztwqzhdm4s.htm" target="_blank" rel="noopener"&gt;의사결정트리&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;FONT color="#000000"&gt;-----------------------------------------------------------------&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;글이 흥미로웠다면 댓글로 알려주세요!&amp;nbsp;&lt;/P&gt;</description>
    <pubDate>Wed, 23 Apr 2025 02:32:21 GMT</pubDate>
    <dc:creator>jennyryu</dc:creator>
    <dc:date>2025-04-23T02:32:21Z</dc:date>
    <item>
      <title>고객 유지 전략을 최적화하기 위해 은행 이탈률 분석</title>
      <link>https://communities.sas.com/t5/SAS-News-and-Q-A/%EA%B3%A0%EA%B0%9D-%EC%9C%A0%EC%A7%80-%EC%A0%84%EB%9E%B5%EC%9D%84-%EC%B5%9C%EC%A0%81%ED%99%94%ED%95%98%EA%B8%B0-%EC%9C%84%ED%95%B4-%EC%9D%80%ED%96%89-%EC%9D%B4%ED%83%88%EB%A5%A0-%EB%B6%84%EC%84%9D/m-p/964912#M170</link>
      <description>&lt;P&gt;&lt;FONT color="#000000"&gt;&lt;A href="https://communities.sas.com/t5/SAS-Communities-Library/Analyzing-Banking-Churn-Rates-to-Optimize-Customer-Retention/ta-p/955652" target="_self"&gt;미국 Communites Site&lt;/A&gt;에 게시된&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;글을 번역하여 공유드립니다.&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;가볍게 읽어보시고, 진행 중인 댓글 이벤트에도 많은 참여 부탁드립니다!&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;원제:&amp;nbsp;Analyzing Banking Churn Rates to Optimize Customer Retention Strategies&lt;/LI&gt;
&lt;LI&gt;저자:&amp;nbsp;DeeMckoy&amp;nbsp;&lt;/LI&gt;
&lt;LI&gt;포스팅 날짜: ‎01-09-2025&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;FONT color="#000000"&gt;-----------------------------------------------------------------&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT size="5" color="#3366FF"&gt;&lt;STRONG&gt;고객 유지 전략을 최적화하기 위해 은행 이탈률 분석&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;오늘날의 사회에서 고객 이탈률을 이해하는 것은 고객을 유지하고 회사의 전반적인 성과를 개선하는 데 필수적입니다&lt;SPAN&gt;. &lt;/SPAN&gt;비즈니스 산업에서 이탈 분석을 통해 프로모션 요청&lt;SPAN&gt;, &lt;/SPAN&gt;고객 만족과 관련된 특정 문제 해결&lt;SPAN&gt;, &lt;/SPAN&gt;현재 고객 또는 신규 고객에게 할인 광고와 같은 회사의 방향성을 결정할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이번 포스트에서는&lt;SPAN&gt;&amp;nbsp;&lt;A href="https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction" target="_blank" rel="noopener"&gt;Kaggle&lt;/A&gt;&lt;/SPAN&gt;을 통해 제공하는 가상의 은행에 대한 고객 이탈률을 살펴보도록 하겠습니다&lt;SPAN&gt;. &lt;/SPAN&gt;우리는 고객이 은행에서 이탈하는 이유에 대한 몇 가지 주요 요인을 더 잘 이해하고자 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;데이터 세트는&lt;SPAN&gt; 10,001&lt;/SPAN&gt;개의 관측값이 있는&lt;SPAN&gt; 14&lt;/SPAN&gt;개의 열로 구성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 데이터 세트의 일부 변수는 다음과 같이 구성됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;SPAN&gt;Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;CreditScore(&lt;/SPAN&gt;신용점수&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;CustomerID(&lt;/SPAN&gt;고객&lt;SPAN&gt;ID)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;EstimatedSalary(&lt;/SPAN&gt;예상급여&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Gender(&lt;/SPAN&gt;성별&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;국가&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;HasCrCard(&lt;/SPAN&gt;신용카드보유여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Surname(&lt;/SPAN&gt;성씨&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;Tenure(&lt;/SPAN&gt;재직기간&lt;SPAN&gt;)&lt;/SPAN&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_11-1745374977322.png" style="width: 784px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106444iA4A485AD1E06F3D0/image-dimensions/784x642?v=v2" width="784" height="642" role="button" title="jennyryu_11-1745374977322.png" alt="jennyryu_11-1745374977322.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;먼저&lt;SPAN&gt; SAS Viya &lt;/SPAN&gt;소프트웨어를 사용하여 모델링을 위하여 &lt;SPAN&gt;“&lt;/SPAN&gt;데이터 분할&lt;SPAN&gt;”&lt;/SPAN&gt;을 설정합니다&lt;SPAN&gt;.&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;이때&lt;SPAN&gt;, &lt;/SPAN&gt;학습과 검증의 비율은 보통&lt;SPAN&gt; 6:4, 7:3&lt;/SPAN&gt;으로 설정을 하며&lt;SPAN&gt;, &lt;/SPAN&gt;테스트는 홀드아웃 테스트를 일반적으로 진행하기 때문에&lt;SPAN&gt; 0&lt;/SPAN&gt;으로 지정합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;그런 다음 모델링의 주목적인 타겟 변수를 식별하는 것으로 시작합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 분석의 타겟 변수는 범주형 이진 변수인&lt;SPAN&gt; "Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;)"&lt;/SPAN&gt;가 될 것입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_12-1745374977323.png" style="width: 356px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106445i172D75DAB0A39017/image-dimensions/356x554?v=v2" width="356" height="554" role="button" title="jennyryu_12-1745374977323.png" alt="jennyryu_12-1745374977323.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;파이프라인의 타겟 변수를 설정한 후 다음으로&lt;SPAN&gt; "&lt;/SPAN&gt;데이터 탐색&lt;SPAN&gt;"&lt;/SPAN&gt;을 사용하여 데이터를 확인하려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 노드는 어떤 변수가 중요한지 더 자세히 알려주고 데이터 내의 변수에 대한 더 나은 통찰력을 제공합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_13-1745374977324.png" style="width: 369px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106443i6FED27F3F0C53259/image-dimensions/369x341?v=v2" width="369" height="341" role="button" title="jennyryu_13-1745374977324.png" alt="jennyryu_13-1745374977324.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;파이프라인 실행이 완료되면&lt;SPAN&gt; "&lt;/SPAN&gt;데이터 탐색&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 마우스 오른쪽 버튼으로 클릭하고 &lt;SPAN&gt;“&lt;/SPAN&gt;결과&lt;SPAN&gt;”&lt;/SPAN&gt;를 확인합니다&lt;SPAN&gt;. &lt;/SPAN&gt;결과는 &lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;), Tenure(&lt;/SPAN&gt;재직기간&lt;SPAN&gt;), Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;와 같은 변수에 대한 시각화로 구성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;이렇게 하면 파이프라인을 빌드하는 방법을 더 잘 이해하는 데 도움이 됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;상대적 중요도&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_14-1745374977330.png" style="width: 745px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106446i42B988AA38C11ABA/image-dimensions/745x314?v=v2" width="745" height="314" role="button" title="jennyryu_14-1745374977330.png" alt="jennyryu_14-1745374977330.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 상대적으로 중요도가 높은 변수에 대한 통찰력을 얻을 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;)&lt;/SPAN&gt;는 상대적 중요도가&lt;SPAN&gt; 1.0&lt;/SPAN&gt;이고 &lt;SPAN&gt;NumOfProducts(&lt;/SPAN&gt;제품수&lt;SPAN&gt;)&lt;/SPAN&gt;는 상대적 중요도가&lt;SPAN&gt; 0.987%&lt;/SPAN&gt;입니다&lt;SPAN&gt;. &lt;/SPAN&gt;우리는 또한&lt;SPAN&gt; "IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)", Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;), Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;국가&lt;SPAN&gt;) &lt;/SPAN&gt;및 &lt;SPAN&gt;CreditScore(&lt;/SPAN&gt;신용점수&lt;SPAN&gt;)&lt;/SPAN&gt;와 같이 중요하지만&lt;SPAN&gt; 50 % &lt;/SPAN&gt;미만인 것을 볼 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_15-1745374977335.png" style="width: 753px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106448i54617006D1B2244E/image-dimensions/753x362?v=v2" width="753" height="362" role="button" title="jennyryu_15-1745374977335.png" alt="jennyryu_15-1745374977335.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 발생 수준을 이해하기 위해 &lt;SPAN&gt;“&lt;/SPAN&gt;범주형 변수&lt;SPAN&gt;”&lt;/SPAN&gt;의 카디널리티를 살펴봅니다&lt;SPAN&gt;. &lt;/SPAN&gt;카디널리티는 데이터 속성이 데이터 세트에서 사용할 수 있는 고유 값의 수입니다&lt;SPAN&gt;. Geography(&lt;/SPAN&gt;지역&lt;SPAN&gt;-&lt;/SPAN&gt;나라&lt;SPAN&gt;)&lt;/SPAN&gt;에 대한 카디널리티가 높다는 것을 알 수 있습니다&lt;SPAN&gt;. "HasCrCard(&lt;/SPAN&gt;신용카드 보유여부&lt;SPAN&gt;)" &lt;/SPAN&gt;및 &lt;SPAN&gt;“IsActiveMember(&lt;/SPAN&gt;활동회원여부&lt;SPAN&gt;)”&lt;/SPAN&gt;에 대한 중간 카디널리티는 레벨 수가 &lt;SPAN&gt;3&lt;/SPAN&gt;입니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, “&lt;/SPAN&gt;연속형 변수&lt;SPAN&gt;”&lt;/SPAN&gt;에 대한 기초 통계량은 확인할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_16-1745374977341.png" style="width: 863px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106447i0F4ACBFB7109AF9C/image-dimensions/863x184?v=v2" width="863" height="184" role="button" title="jennyryu_16-1745374977341.png" alt="jennyryu_16-1745374977341.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위 그림에서 연령은&lt;SPAN&gt; 18&lt;/SPAN&gt;세에서&lt;SPAN&gt; 92&lt;/SPAN&gt;세의 분포를 보이며&lt;SPAN&gt;, &lt;/SPAN&gt;평균 연령은&lt;SPAN&gt; 38.9&lt;/SPAN&gt;세 입니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, &lt;/SPAN&gt;재직기간은&lt;SPAN&gt; 0 ~ 10&lt;/SPAN&gt;년의 분포를 보이며 평균 재직기간은&lt;SPAN&gt; 5&lt;/SPAN&gt;년임을 알 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;다음으로&lt;SPAN&gt;, &lt;/SPAN&gt;은행 회사를 떠나는 고객의&lt;SPAN&gt; "&lt;/SPAN&gt; &lt;SPAN&gt;Exited(&lt;/SPAN&gt;이탈여부&lt;SPAN&gt;) " &lt;/SPAN&gt;빈도 백분율을 살펴봅니다&lt;/P&gt;
&lt;P&gt;우리의 주된 관심사항인 회사에서 얼마나 많은 고객이 이탈했는지&lt;SPAN&gt;(1 = &lt;/SPAN&gt;예&lt;SPAN&gt;, 0 = &lt;/SPAN&gt;아니오&lt;SPAN&gt;)&lt;/SPAN&gt;를 살펴보기로 하겠습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_17-1745374977345.png" style="width: 784px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106451iAAF69D976892C946/image-dimensions/784x388?v=v2" width="784" height="388" role="button" title="jennyryu_17-1745374977345.png" alt="jennyryu_17-1745374977345.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위그림에서는 은행이 고객의&lt;SPAN&gt; 80%&lt;/SPAN&gt;를 유지할 수 있었고 회사에서 이탈한 사람은&lt;SPAN&gt; 20%&lt;/SPAN&gt;인 것을 알 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;고객이 이탈했을 수 있는 이유를 이해하고 고객의 유지 수준을 평가하여&lt;SPAN&gt; 80% &lt;/SPAN&gt;이상으로 유지하는 방법을 찾으려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이제 섹션의&lt;SPAN&gt; "&lt;/SPAN&gt;대체&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 사용하여 이상값을 대체해야 합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_18-1745374977346.png" style="width: 419px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106450i6409E3A0423455F3/image-dimensions/419x394?v=v2" width="419" height="394" role="button" title="jennyryu_18-1745374977346.png" alt="jennyryu_18-1745374977346.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;"&lt;/SPAN&gt;대체&lt;SPAN&gt;" &lt;/SPAN&gt;노드를 사용하면 지정된 값으로 모든 이상치와 알 수 없는 클래스 수준을 대체하고 제거할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이렇게 하면 데이터 세트 내에 있을 수 있는 가능한 오류를 조정하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_19-1745374977347.png" style="width: 374px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106449i31DB501E48E3292F/image-dimensions/374x627?v=v2" width="374" height="627" role="button" title="jennyryu_19-1745374977347.png" alt="jennyryu_19-1745374977347.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위 그림과 같이 범주형 또는 연속형 변수에 대하여 다양한 방법으로 대체를 수행할 수 있습니다&lt;SPAN&gt;.&amp;nbsp; &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이 후&lt;SPAN&gt;, &lt;/SPAN&gt;우리는 데이터 세트에서 변환 노드를 수행하며&lt;SPAN&gt;, &lt;/SPAN&gt;이 노드는 입력 변수에 숫자 또는 구간화&lt;SPAN&gt;(Binning)&lt;/SPAN&gt;를 적용합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_20-1745374977348.png" style="width: 349px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106452iE3E8A64219E56469/image-dimensions/349x544?v=v2" width="349" height="544" role="button" title="jennyryu_20-1745374977348.png" alt="jennyryu_20-1745374977348.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;각 변환에 대해 결측처리와 같이 새로운 변수가 생성됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;변환을 사용하면 접두사가 사용된 변환에 따라 달라집니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, &lt;/SPAN&gt;로그 변환된 변수는&lt;SPAN&gt; LOG_&lt;/SPAN&gt;로 시작합니다&lt;SPAN&gt;. &lt;/SPAN&gt;연속형 변수의 변환방법은 디폴트로 &lt;SPAN&gt;“(&lt;/SPAN&gt;없음&lt;SPAN&gt;)”&lt;/SPAN&gt;로 설정되며 원래 변수는 데이터 세트에서 삭제되지 않지만 기본적으로&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;STRONG&gt;거부됨&lt;/STRONG&gt;으로 설정되므로 모델에서 사용되지 않습니다&lt;SPAN&gt;. &lt;/SPAN&gt;나머지 입력은 기본 설정으로 유지되며&lt;SPAN&gt; WOE(&lt;/SPAN&gt;희귀 차단 및 증거 가중치&lt;SPAN&gt;) &lt;/SPAN&gt;조정 값은&lt;SPAN&gt; 0.5&lt;/SPAN&gt;로 유지됩니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_21-1745374977350.png" style="width: 300px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106453iE6C0D8D61F48BF65/image-dimensions/300x875?v=v2" width="300" height="875" role="button" title="jennyryu_21-1745374977350.png" alt="jennyryu_21-1745374977350.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;변환&lt;SPAN&gt;” &lt;/SPAN&gt;노드에 대한 매개 변수를 설정한 후 연속형 변수&lt;SPAN&gt; "&lt;/SPAN&gt;변환방법&lt;SPAN&gt;"&lt;/SPAN&gt;을 &lt;SPAN&gt;“&lt;/SPAN&gt;로그&lt;SPAN&gt;”&lt;/SPAN&gt;로 변경하려고 합니다&lt;SPAN&gt;. &lt;/SPAN&gt;그 이유는 왜도를 줄이고 데이터 분포를 돕는 데 도움이 되는 것입니다&lt;SPAN&gt;. &lt;/SPAN&gt;변환 노드가 성공적으로 실행된 후 입력 변수 통계&lt;SPAN&gt;, &lt;/SPAN&gt;변환된 변수 요약을 볼 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_22-1745374977353.png" style="width: 958px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106454i1120AC6988BD95F4/image-dimensions/958x231?v=v2" width="958" height="231" role="button" title="jennyryu_22-1745374977353.png" alt="jennyryu_22-1745374977353.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 &lt;SPAN&gt;“&lt;/SPAN&gt;대체&lt;SPAN&gt;” &lt;/SPAN&gt;노드의 왜도를 확인하기 위해 연속형 변수를 살펴봅니다&lt;SPAN&gt;. &lt;/SPAN&gt;왜도&lt;SPAN&gt;(Skewness)&lt;/SPAN&gt;는 변수 분포의 대칭성을 측정하며&lt;SPAN&gt;, &lt;/SPAN&gt;이로 인해 분포가 오른쪽 또는 왼쪽 꼬리 쪽으로 늘어납니다&lt;SPAN&gt;. &lt;/SPAN&gt;대체된 &lt;SPAN&gt;Estimated Salary(&lt;/SPAN&gt;예상 급여&lt;SPAN&gt;)&lt;/SPAN&gt;의 경우 왜도는&lt;SPAN&gt; 0.0133&lt;/SPAN&gt;으로 정규분포의 이상적인 왜도값인 &lt;SPAN&gt;0&lt;/SPAN&gt;에 가깝습니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한 대체된 &lt;SPAN&gt;Age(&lt;/SPAN&gt;연령&lt;SPAN&gt;) &lt;/SPAN&gt;변수의 경우 왜도값은 &lt;SPAN&gt;0.9672&lt;/SPAN&gt;이며&lt;SPAN&gt;, &lt;/SPAN&gt;대체된 &lt;SPAN&gt;Balance(&lt;/SPAN&gt;잔액&lt;SPAN&gt;), Credit Score(&lt;/SPAN&gt;신용 점수&lt;SPAN&gt;) &lt;/SPAN&gt;변수는 음의 왜도값을 확인할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_23-1745374977357.png" style="width: 1061px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106457iE30E230D4351C567/image-dimensions/1061x175?v=v2" width="1061" height="175" role="button" title="jennyryu_23-1745374977357.png" alt="jennyryu_23-1745374977357.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 변환 요약에는 대체된 입력 변수와 각 변수에 사용된 변환 공식이 표시됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;공식&lt;SPAN&gt;, “n +1”&lt;/SPAN&gt;을 수행하는 이유는 연속형 변수에 대한 음수 값을 제거하기 위해 설정된 메타데이터 제한으로 인해 변수 입력이&lt;SPAN&gt; 0&lt;/SPAN&gt;인 경우 오류를 피하기 위한 것입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;이제 데이터 변환을 처리했으므로 &lt;SPAN&gt;“&lt;/SPAN&gt;결측값 처리&lt;SPAN&gt;” &lt;/SPAN&gt;노드를 사용하여 범주형 및 연속형 입력변수에 대한 결측값을 확인하려고 합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;결측값 처리&lt;SPAN&gt;” &lt;/SPAN&gt;노드의 경우 기본 매개 변수로 입력 설정을 유지합니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_24-1745374977359.png" style="width: 225px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106455iAA6B0A5AA55B5BB9/image-dimensions/225x906?v=v2" width="225" height="906" role="button" title="jennyryu_24-1745374977359.png" alt="jennyryu_24-1745374977359.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;결측값 처리의 경우 범주형 변수의 기본 방법은 &lt;SPAN&gt;“&lt;/SPAN&gt;개수&lt;SPAN&gt;”&lt;/SPAN&gt;가 되고 연속형 변수의 경우 설정된 &lt;SPAN&gt;“&lt;/SPAN&gt;데이터 제한 백분율&lt;SPAN&gt;”(&lt;/SPAN&gt;디폴트&lt;SPAN&gt; 5%)&lt;/SPAN&gt;이 절삭 또는 윈저화된 데이터를 사용하여 설정된 기본방법&lt;SPAN&gt;(&lt;/SPAN&gt;디폴트 &lt;SPAN&gt;“&lt;/SPAN&gt;평균&lt;SPAN&gt;”)&lt;/SPAN&gt;으로 결측값을 처리합니다&lt;SPAN&gt;. &lt;/SPAN&gt;지도 학습 노드 섹션과 선택된 노드를 살펴보기 전에 변수 선택 노드를 살펴보겠습니다&lt;SPAN&gt;. &lt;/SPAN&gt;변수 선택 노드는 변수 선택의 비지도 및 여러 지도 방법을 수행하여 입력 수를 줄입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_25-1745374977361.png" style="width: 232px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106456i0D9D8214723989EC/image-dimensions/232x630?v=v2" width="232" height="630" role="button" title="jennyryu_25-1745374977361.png" alt="jennyryu_25-1745374977361.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;변수 선택&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 입력 변수를 식별하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;타겟 변수에 대한 유용한 예측을 수행하는 데 도움이 됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;그런 다음 입력 변수에서 수집된 정보를 지도 학습 노드에서 더 자세히 평가할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_26-1745374977366.png" style="width: 663px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106459i156CF6CDAC7E74E1/image-dimensions/663x604?v=v2" width="663" height="604" role="button" title="jennyryu_26-1745374977366.png" alt="jennyryu_26-1745374977366.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;파이프라인이 성공적으로 실행되면 &lt;SPAN&gt;“&lt;/SPAN&gt;모델 비교&lt;SPAN&gt;” &lt;/SPAN&gt;노드에서 선택한 개별 알고리즘 노드를 평가할 수 있습니다&lt;SPAN&gt;. “&lt;/SPAN&gt;로지스틱 회귀&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 이항&lt;SPAN&gt;(Binary) &lt;/SPAN&gt;및 명목&lt;SPAN&gt;(Nominal) &lt;/SPAN&gt;변수의 값을 예측하려고 시도합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;로지스틱 회귀&lt;SPAN&gt;” &lt;/SPAN&gt;노드를 선택하는 이유는 개별 관측치가 타겟 변수의 관심 수준에 속하는지 여부에 대한 확률을 근사화 할 수 있는 기능이 있기 때문입니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 하나 이상의 예측변수 데이터 항목의 값을 사용하여 값 응답 데이터 항목을 예측합니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드 사용의 또 다른 이점은 누락된 데이터를 처리한다는 것인데&lt;SPAN&gt;, &lt;/SPAN&gt;이는 타겟 변수에서 예측을 생성하는 데 도움이 되는 일련의 규칙을 통해 처리할 수 있습니다&lt;SPAN&gt;. “&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델은 분석 데이터 세트를 여러 번 재표본 추출하여 해당 데이터 세트의 가중 평균을 반영하여 예측 결과를 생성하는 부스팅&lt;SPAN&gt;(Boosting) &lt;/SPAN&gt;접근 방식을 제공합니다&lt;SPAN&gt;. &lt;/SPAN&gt;마지막으로&lt;SPAN&gt;, &lt;/SPAN&gt;우리는 &lt;SPAN&gt;“&lt;/SPAN&gt;신경망&lt;SPAN&gt;”&lt;/SPAN&gt;이 인간의 뇌를 모방하며&lt;SPAN&gt;, &lt;/SPAN&gt;은닉층이 있는 예측 변수&lt;SPAN&gt;, &lt;/SPAN&gt;타겟&lt;SPAN&gt;(&lt;/SPAN&gt;또는 출력&lt;SPAN&gt;) &lt;/SPAN&gt;레이어 및 각 레이어 간의 연결로 구성되어 있음을 살펴봅니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_27-1745374977367.png" style="width: 1032px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106458iD6C04A608EDD7D8F/image-dimensions/1032x181?v=v2" width="1032" height="181" role="button" title="jennyryu_27-1745374977367.png" alt="jennyryu_27-1745374977367.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;우리는 상위 두 모델인 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;(&lt;/SPAN&gt;챔피언 모델&lt;SPAN&gt;)”&lt;/SPAN&gt;과 &lt;SPAN&gt;“&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드만 살펴볼 것입니다&lt;SPAN&gt;. &lt;/SPAN&gt;두 모델은&lt;SPAN&gt; 86%&lt;/SPAN&gt;의 정확도를 보였으며&lt;SPAN&gt;, &lt;/SPAN&gt;모델 선택 기준인 &lt;SPAN&gt;“KS &lt;/SPAN&gt;통계량&lt;SPAN&gt;”&lt;/SPAN&gt;이&lt;SPAN&gt; 0.5132&lt;/SPAN&gt;로 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델이 챔피언 모델로 선정되었습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;그래디언트 부스팅&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_28-1745374977370.png" style="width: 1065px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106460iB79C35393114D489/image-dimensions/1065x192?v=v2" width="1065" height="192" role="button" title="jennyryu_28-1745374977370.png" alt="jennyryu_28-1745374977370.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;변수 중요도에 대한 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;모델을 살펴보면 연령&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;은 상대적 중요도가&lt;SPAN&gt; 1&lt;/SPAN&gt;이고 타겟 변수에 대한 상대적 중요도가 &lt;SPAN&gt;68%&lt;/SPAN&gt;인 제품수&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;를 볼 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이것은 은행 회원의 연령과 그들이 회사에서 소유하고 있는 제품의 수를 살펴보는 것을 제안합니다&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_29-1745374977380.png" style="width: 785px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106462iE929279713F94101/image-dimensions/785x460?v=v2" width="785" height="460" role="button" title="jennyryu_29-1745374977380.png" alt="jennyryu_29-1745374977380.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;평균 제곱 오차에 대한 오차 플롯은 트리 수가 증가함에 따라 훈련 오류가 감소하는 것을 보여주지만&lt;SPAN&gt;, &lt;/SPAN&gt;검증 오류가 감소 후 증가를 보이거나 학습&lt;SPAN&gt;(Train)&lt;/SPAN&gt;과 검증&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 차이가 많으면 이는 과적합의 징후일 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 모델의 경우 검증 데이터&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 최소 오차는&lt;SPAN&gt; 0.109&lt;/SPAN&gt;이고 &lt;SPAN&gt;29&lt;/SPAN&gt;개의 트리에 대해 발생하므로 검증 오류는 마지막 트리에서 계속 감소하고 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;또한&lt;SPAN&gt;, &lt;/SPAN&gt;학습&lt;SPAN&gt;(Train)&lt;/SPAN&gt;과 검증&lt;SPAN&gt;(Validate)&lt;/SPAN&gt;의 최소 오차 차이가&lt;SPAN&gt; 0.01&lt;/SPAN&gt;으로 과적합을 방지하기 위하여 모델의 옵션이나 조기중지 옵션을 수정해야 할 수도 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;&lt;U&gt;의사결정트리&lt;/U&gt;&lt;/STRONG&gt;&lt;/P&gt;
&lt;P&gt;데이터에 대한 더 많은 인사이트를 얻기 위해 의사결정트리 결과를 살펴봅니다&lt;SPAN&gt;. “&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;” &lt;/SPAN&gt;노드는 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드보다 정확도가 &lt;SPAN&gt;0.2% &lt;/SPAN&gt;낮았을 뿐이며&lt;SPAN&gt;, &lt;/SPAN&gt;이는&lt;SPAN&gt; 86%&lt;/SPAN&gt;에서 여전히 허용 가능한 것으로 간주됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;그러나&lt;SPAN&gt;, KS &lt;/SPAN&gt;통계량이 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드보다 &lt;SPAN&gt;0.05&lt;/SPAN&gt;이상 낮기 때문에 챔피언 모델로 사용하기에는 부족한 것도 사실입니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_30-1745374977382.png" style="width: 985px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106461iC5619B114752ECDB/image-dimensions/985x155?v=v2" width="985" height="155" role="button" title="jennyryu_30-1745374977382.png" alt="jennyryu_30-1745374977382.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;“&lt;/SPAN&gt;의사결정트리&lt;SPAN&gt;”&lt;/SPAN&gt;의 변수 중요도는 &lt;SPAN&gt;“&lt;/SPAN&gt;그래디언트 부스팅&lt;SPAN&gt;” &lt;/SPAN&gt;노드 결과와 다르게 제품수&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;가 &lt;SPAN&gt;1&lt;/SPAN&gt;순위로 높았으며&lt;SPAN&gt;, &lt;/SPAN&gt;연령&lt;SPAN&gt;(&lt;/SPAN&gt;대체 및 변환된 값&lt;SPAN&gt;)&lt;/SPAN&gt;은 상대적 중요도가 &lt;SPAN&gt;0.8219&lt;/SPAN&gt;임을 알 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;span class="lia-inline-image-display-wrapper lia-image-align-inline" image-alt="jennyryu_31-1745374977394.png" style="width: 974px;"&gt;&lt;img src="https://communities.sas.com/t5/image/serverpage/image-id/106463i0CF25EF0AC72F562/image-dimensions/974x575?v=v2" width="974" height="575" role="button" title="jennyryu_31-1745374977394.png" alt="jennyryu_31-1745374977394.png" /&gt;&lt;/span&gt;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;위의 그림에서 향상도&lt;SPAN&gt;(Lift) &lt;/SPAN&gt;보고서를 검토하여 타겟 이벤트와 관련된 누적향상도를 이해합니다&lt;SPAN&gt;. &lt;/SPAN&gt;이 결과는 모델이 모집단에서 양성 사례&lt;SPAN&gt;(&lt;/SPAN&gt;퇴사한 사람&lt;SPAN&gt;)&lt;/SPAN&gt;를 얼마나 잘 식별하는지 평가하는 데 사용됩니다&lt;SPAN&gt;. &lt;/SPAN&gt;누적향상도가 높을수록 모델이 특히 예측이 더 높은 확률 그룹에서 이러한 이탈고객을 더 잘 식별할 수 있습니다&lt;SPAN&gt;. &lt;/SPAN&gt;검증용&lt;SPAN&gt;(Validate) &lt;/SPAN&gt;데이터에 대한 누적향상도가&lt;SPAN&gt; 3.9098&lt;/SPAN&gt;이고 학습용&lt;SPAN&gt;(Train) &lt;/SPAN&gt;데이터에 대한 누적향상도가&lt;SPAN&gt; 3.8766&lt;/SPAN&gt;인 것은 모델이 고객 이탈 스코어 상위&lt;SPAN&gt; 10%&lt;/SPAN&gt;에 속하는 사람들을 식별하는 데 매우 우수하다는 것을 보여줍니다&lt;SPAN&gt;. &lt;/SPAN&gt;이는 이탈할 가능성이 높은 상위&lt;SPAN&gt; 10% &lt;/SPAN&gt;고객을 선별하는 데 매우 유용하게 적용할 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT size="3" color="#3366FF"&gt;&lt;STRONG&gt;결론&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;결론적으로&lt;SPAN&gt;, &lt;/SPAN&gt;머신러닝 모델 파이프라인을 수행하여 얻은 지식은 고객이 은행을 떠나는 이유를 이해하는 데 엄청난 통찰력을 제공합니다&lt;SPAN&gt;. &lt;/SPAN&gt;지도 학습 노드&lt;SPAN&gt;(&lt;/SPAN&gt;그래디언트 부스팅 및 의사결정트리&lt;SPAN&gt;)&lt;/SPAN&gt;를 사용하여 이탈률을 줄이는 데 도움이 될 수 있는 주요 변수에 대한 통찰력 있는 지식을 얻었으며&lt;SPAN&gt;, &lt;/SPAN&gt;이를 통해 유지율을 크게 향상시킬 수 있었습니다&lt;SPAN&gt;. &lt;/SPAN&gt;예를 들어&lt;SPAN&gt;, &lt;/SPAN&gt;잠재적으로 젊은 고객을 타겟팅하고 데이터 세트에 나열된 지역&lt;SPAN&gt;-&lt;/SPAN&gt;나라의 지리적 어려움을 해결하기 위한 광고 홍보에 초점을 맞출 수 있습니다&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;SPAN&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/P&gt;
&lt;P&gt;&lt;FONT color="#3366FF"&gt;&lt;STRONG&gt;자세한 정보:&lt;/STRONG&gt;&lt;/FONT&gt;&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/default/vdmmladvug/n0wthqppw0ohm1n14y6szxzj15yo.htm" target="_blank" rel="noopener"&gt;지도 학습 개요&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://support.sas.com/en/software/machine-learning-on-sas-viya.html" target="_blank" rel="noopener"&gt;SAS Viya 파이프라인&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction" target="_blank" rel="noopener"&gt;은행 데이터셋&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/default/vdmmladvug/n0wthqppw0ohm1n14y6szxzj15yo.htm" target="_blank" rel="noopener"&gt;그래디언트 부스팅&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;SPAN&gt;&lt;A href="https://go.documentation.sas.com/doc/en/vdmmlcdc/v_027/vdmmlref/p0eu2y2vpivlbtn1pnztwqzhdm4s.htm" target="_blank" rel="noopener"&gt;의사결정트리&lt;/A&gt;&lt;/SPAN&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;&lt;FONT color="#000000"&gt;-----------------------------------------------------------------&lt;/FONT&gt;&lt;/P&gt;
&lt;P&gt;글이 흥미로웠다면 댓글로 알려주세요!&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Wed, 23 Apr 2025 02:32:21 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-News-and-Q-A/%EA%B3%A0%EA%B0%9D-%EC%9C%A0%EC%A7%80-%EC%A0%84%EB%9E%B5%EC%9D%84-%EC%B5%9C%EC%A0%81%ED%99%94%ED%95%98%EA%B8%B0-%EC%9C%84%ED%95%B4-%EC%9D%80%ED%96%89-%EC%9D%B4%ED%83%88%EB%A5%A0-%EB%B6%84%EC%84%9D/m-p/964912#M170</guid>
      <dc:creator>jennyryu</dc:creator>
      <dc:date>2025-04-23T02:32:21Z</dc:date>
    </item>
  </channel>
</rss>

