안녕하세요
이번 게시글은 [ SAS 활용 노하우 ] Data Modeling part5의 이어지는 글 입니다.
예측변수가 설명변수에 의해 어떻게 설명 또는 예측되는지 설명변수의 함수로 예측하는 분석방법입니다.
* Regression의 종류
1) Logistic Regression
종속변수의 범주가 0,1과 같이 이산형이고 설명변수가 k개인 경우에 적용합니다.
종속변수가 1또는 0이 될 확률을 설명할 수 있는 함수로 추정과 새로운 데이터가 각 범주에 속할 확률을 비교하여 판별 합니다.
2)Linear Regression
종속변수가 연속형이고 설명변수가 한 개 또는 k개인 경우에 적용합니다.
k개의 설명변수의 함수로서 종속변수와의 인과관계를 설명하는 정확한 예측을 수행합니다.
3) Non - Linear Regresssion
설명변수의 함수가 비선형 함수를 사용하는 회귀분석입니다.
4) Rank(ordinal) Logistic Regression
종속변수가 상,중,하와 같이 순서형 분류인 경우 사용합니다.
종속변수의 개수에 맞도록 확률을 추정합니다.
* Using Enterprise Miner
회귀(Regression)노드를 이용하여 예측 모형 생성할 수 있습니다.
* Regression 노드의 주요 속성
비선형 모형 중 하나로 반복적인 학습 과정을 거쳐 데이터에 내재되어 있는 패턴을 찾아가는 모델링 방법입니다.
* 신경망 구조
복잡한 구조를 가진 자료의 분류 및 예측에 사용되는 비선형 모형으로 입력층, 은닉층, 출력층으로 구성된 신경망을 MLP(Multi-Layer Perceptron ; 다층 신경망) 이라고 합니다.
입력층 (Input Layer) |
각 입력 변수에 대응하는 마디 |
은닉층 (Hidden Layer) |
입력층으로부터 전달되는 변수 값들의 선형 결합을 비선형 함수로 처리하여 출력층 또는 은닉층에 전달합니다. |
출력층 (Output Layer) |
타겟 변수에 대응하는 마디로 구성되며 여러 개의 타겟 변수 또는 세 개 이상의 수준을 사지는 범주형 타겟 변수가 있을 경우에는 여러 개의 출력마기가 존재합니다. |
* 결합/활성 함수
결합함수 : 입력층 또는 은닉층 마디 결합기능으로 대배분의 선형함수에 이용가능합니다.
활성함수 : 입력변수 또는 은닉 마디 결합을 변환하는 함수로 Logistic Function, Hypertangent Function등이 있습니다.
* Using Enterprise Miner
신경망(Neural Network) 노드를 이용하여 예측 모델을 생성합니다.
* Data Partition 노드의 주요 속성
1. 신경망 구조 : GLM , MLP, ORBFEQ, ORBFUN, NRBFEH 등 총 10가지 중 한 가지 선택가능합니다.
2. 은닉마디 수 : 은닉층에서 은닉 마디 수 설정 가능합니다. (1~64)
3. 은닉층 결합함수 : 신경망에서 사용될 결합함수
종류: Linear, EQSlopes, EQRadial, EHRadial, EWRadial, EVRadial, Xradial 등
4. 은닉층 활성함수 : 신경망에서 사용될 활성함수
종류: Identify, Linear, Exponential, Reciprocal, Square, Logistic, Multiple Logistic 등
범주형 타겟과 연속형 타겟을 동시에 사용하며 모델링하는 방법
* Two Stage 목적
구매가 이루어졌다면 구매 금액이 얼마가 될지 예측하는 것처럼 구매여부(범주형 타겟), 금액(연속형 타겟)을 동시에 예측하고자 합니다.
* 방식
방법 | |
순차 (Sequential) |
|
병행 (Concurrent) |
|
* Using Enterprise Miner
Two Stage 노드를 이용하여 분석 예측 모델을 생성합니다.
* Two Stage 노드의 주요 속성
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Lock in the best rate now before the price increases on April 1.