About LeeKiWon

LeeKiWon · ‎09-15-2020

대단히 감사합니다. 많은 도움이 되었습니다.

LeeKiWon · ‎09-15-2020

일단, 관심가져 주셔서 너무 감사합니다. 1. 1차항이 유의하지 않더라도 넣어주는 것이 관례 ==> 1차항을 넣으면 공선성이 발생하여 뺐습니다. 관례라는 의미가 반듯이 넣어야 되는 의미인지? 아니면 상황에 따라 안넣어도 되는 건지요? 상관없으면 빼는게 공선성지수가 잘 나옵니다. 2. 말씀하신대로 하나씩 으로 비교 하였습니다. 공선성지수(Vif/Condition index)에 문제가 없는데 방향은 변수 하나씩 할때와 반대로 나오는 경우가 있네요 참고 위해 코드를 드립니다. 슈더코드 형태로 작성하겠습니다. x = 선행종합지수, x2 = 국고채 금리, x3 = 주택매매가격지수, Y(종속변수) = 부도율 독립변수 위 3개를 stdize 하여 평균을 빼서 생성했습니다. proc stdize data = corp_data_all method = mean out l corp_data_all2 var x1 x2 x3 run; 독립변수의 산점도가 2차, 3차, 4차 함수에 가까워 제곱/세제곱/네제곱 다항회귀모형으로 만들었습니다.(ck2= x1**2, ck3=x1**3, ck4=x1**4; ch2= x2**2, ch3=x2**3, ch4=x2**4; cr2= x3**2, cr3=x3**3, cr4=x3**4;...이런식으로 다른변수도 변환하였습니다. ) 종속변수는 1/Y(Lambda 값 -1)로 변환하였습니다.(이건 sql select 1/y로 select 하였습니다. 괜찮은건지? 모르겠습니다.) 이런변환을 한 이유는 시계열 자료고 3개의 독립변수가 모두 높은 상관관계를 보여 다중공선성/잔차의 등분산성을 위하여 변환하였습니다. 이후에 proc reg 하였는데 예를들어 x1, ck2(제곱), x2, ch2(제곱), ch3(세제곱) 등 1차항부터 3, 4차 항까지 넣으면 공선성 지수가 너무 많이 나옵니다. 그래서 제곱 or 세제곱 or 네제곱 만을 넣었습니다. 람다 -1값이나, 멱등변환은 모두 sas 코드를 찾아서 study 해서 적용하였습니다. 첫째, 이 분석 방법이 맞는지 궁금하구요. 잘못된게 있으면 머가 있을까요? 자료에서도 보면 1차항부터 순서대로 들어가는게 맞는거 같은데 순서대로요..들어가면 다중공선성이 생겨서요.. 둘째, 1/y (sql select 한 값 즉 select 1/y from data 이런식입니다.) 인데 이게 box-cox 변환이라고 할 수 있는건지 궁금합니다. 역변환할때 y로 그냥 변경해주면 되는지 특별한 코드가 있는지 궁금합니다. 웹에서 찾아보면 보정이 필요하다고 하는것 같은데 궁금합니다. 셋째, 그리고 하나씩 할때와 방향이 틀리게 나오면 그건 잘못된 다항회귀모형일까요? 아니면 다항회귀모형에서는 그럴수도 있는걸까요? 그럴수도 있으면 그거에 대한 설명방법은 머가 있을까요? 읽어주셔서 감사합니다.

LeeKiWon · ‎09-11-2020

1. 거시경제변수를 이용하여 부도율을 산출하는 다항회귀모형을 만들었습니다. 잔차의 등분산성등을 고려하여 BOX-COX 변환을 하였고, 아래와 같이 회귀식을 만들었습니다. 첫번째: 1/Y = 0.4360x + 0.25258x2^2 - 0.013x3^2 + 28.8454 => 2차항이 포함된 다항회귀모형 여기에서 x = 선행종합지수, x2 = 국고채 금리, x3 = 주택매매가격지수, Y(종속변수) = 부도율 입니다. 이럴때 상식적으로 선행종합지수와 주택매매가격지수는 부도율과 Negative 입니다.(경기가좋아지면 부도율하락 및 분석 데이타 기준) 반대로 국고채 금리는 부도율과 Positive 입니다.(금리가 오르면 돈을 갚기 어려워지고 부도상승, 분석 데이타 기준) R-Square = 89%, 잔차의 등분산성 정규성 모두 만족하는 결과입니다. (종속변수가 1/Y 임을 고려) 그런데 위 회귀식을 보면 x 선행종합지수는 상승하면 부도율은 하락하니(Negative방향성) 맞으나, 국고채금리 x2는 상승하면 부도율이 올라야 상식적이지만 위 회귀식에서는 반대로 Y값은 하락하게 되어있고 주택매매가격지수 x3는 -회귀계수로, 상승하면 부도율이 하락하는게 맞지만 위 회귀식에서는 Y값은 상승하는 회귀식을 도출했습니다. 즉 x(선행종합지수) 방향정상, (x2국고채금리, x3주택매매가격지수)는 상식적으로 방향성 이해가 안됨. 이런 결과가 도출 되는게 어떻한 이유에서 그런지? 절편값이 상대적으로 커서 그런건지 상식적이지 않은 회귀식을 얻어서 문의 합니다. 어떻게 해석을 해야 맞는 걸까요? 두번째: BOX-COX 변환한 1/Y를 역변환 하는 코드가 어떻게 되는지요? 아시는 바와같이 회귀식의 결과를 추후 적용하기 위해서는 Y값을 얻는 코드는 어떻게 되는지 궁금합니다. 많은 의견 부탁 드립니다. 감사합니다.

LeeKiWon · ‎09-11-2020

1. 거시경제변수를 이용하여 부도율을 산출하는 다항회귀모형을 만들었습니다. 잔차의 등분산성등을 고려하여 BOX-COX 변환을 하였고, 아래와 같이 회귀식을 만들었습니다. 첫번째: 1/Y = 0.4360x + 0.25258x2^2 - 0.013x3^2 + 28.8454 => 2차항이 포함된 다항회귀모형 여기에서 x = 선행종합지수, x2 = 국고채 금리, x3 = 주택매매가격지수, Y(종속변수) = 부도율 입니다. 이럴때 상식적으로 선행종합지수와 주택매매가격지수는 부도율과 Negative 입니다.(경기가좋아지면 부도율하락 및 분석 데이타 기준) 반대로 국고채 금리는 부도율과 Positive 입니다.(금리가 오르면 돈을 갚기 어려워지고 부도상승, 분석 데이타 기준) R-Square = 89%, 잔차의 등분산성 정규성 모두 만족하는 결과입니다. (종속변수가 1/Y 임을 고려) 그런데 위 회귀식을 보면 x 선행종합지수는 상승하면 부도율은 하락하니(Negative방향성) 맞으나, 국고채금리 x2는 상승하면 부도율이 올라야 상식적이지만 위 회귀식에서는 반대로 Y값은 하락하게 되어있고 주택매매가격지수 x3는 -회귀계수로, 상승하면 부도율이 하락하는게 맞지만 위 회귀식에서는 Y값은 상승하는 회귀식을 도출했습니다. 즉 x(선행종합지수) 방향정상, (x2국고채금리, x3주택매매가격지수)는 상식적으로 방향성 이해가 안됨. 이런 결과가 도출 되는게 어떻한 이유에서 그런지? 절편값이 상대적으로 커서 그런건지 상식적이지 않은 회귀식을 얻어서 문의 합니다. 어떻게 해석을 해야 맞는 걸까요? 두번째: BOX-COX 변환한 1/Y를 역변환 하는 코드가 어떻게 되는지요? 아시는 바와같이 회귀식의 결과를 추후 적용하기 위해서는 Y값을 얻는 코드는 어떻게 되는지 궁금합니다. 많은 의견 부탁 드립니다. 감사합니다.

Online Status	Offline
Date Last Visited	‎09-25-2020 08:04 AM

Re: 다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

Re: 다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

다항회귀모형 에서의 회귀계수 방향성에 대한 해석 및 box cox 역변환 방법

다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

Re: 다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

Re: 다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

Re: 다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문

다항회귀모형 에서의 회귀계수 방향성에 대한 해석 및 box cox 역변환 방법

다항회귀모형 해석에 대한 질문 및 BOX-COX 역변환에 관한 질문