일단, 관심가져 주셔서 너무 감사합니다. 1. 1차항이 유의하지 않더라도 넣어주는 것이 관례 ==> 1차항을 넣으면 공선성이 발생하여 뺐습니다. 관례라는 의미가 반듯이 넣어야 되는 의미인지? 아니면 상황에 따라 안넣어도 되는 건지요? 상관없으면 빼는게 공선성지수가 잘 나옵니다. 2. 말씀하신대로 하나씩 으로 비교 하였습니다. 공선성지수(Vif/Condition index)에 문제가 없는데 방향은 변수 하나씩 할때와 반대로 나오는 경우가 있네요 참고 위해 코드를 드립니다. 슈더코드 형태로 작성하겠습니다. x = 선행종합지수, x2 = 국고채 금리, x3 = 주택매매가격지수, Y(종속변수) = 부도율 독립변수 위 3개를 stdize 하여 평균을 빼서 생성했습니다. proc stdize data = corp_data_all method = mean out l corp_data_all2 var x1 x2 x3 run; 독립변수의 산점도가 2차, 3차, 4차 함수에 가까워 제곱/세제곱/네제곱 다항회귀모형으로 만들었습니다.(ck2= x1**2, ck3=x1**3, ck4=x1**4; ch2= x2**2, ch3=x2**3, ch4=x2**4; cr2= x3**2, cr3=x3**3, cr4=x3**4;...이런식으로 다른변수도 변환하였습니다. ) 종속변수는 1/Y(Lambda 값 -1)로 변환하였습니다.(이건 sql select 1/y로 select 하였습니다. 괜찮은건지? 모르겠습니다.) 이런변환을 한 이유는 시계열 자료고 3개의 독립변수가 모두 높은 상관관계를 보여 다중공선성/잔차의 등분산성을 위하여 변환하였습니다. 이후에 proc reg 하였는데 예를들어 x1, ck2(제곱), x2, ch2(제곱), ch3(세제곱) 등 1차항부터 3, 4차 항까지 넣으면 공선성 지수가 너무 많이 나옵니다. 그래서 제곱 or 세제곱 or 네제곱 만을 넣었습니다. 람다 -1값이나, 멱등변환은 모두 sas 코드를 찾아서 study 해서 적용하였습니다. 첫째, 이 분석 방법이 맞는지 궁금하구요. 잘못된게 있으면 머가 있을까요? 자료에서도 보면 1차항부터 순서대로 들어가는게 맞는거 같은데 순서대로요..들어가면 다중공선성이 생겨서요.. 둘째, 1/y (sql select 한 값 즉 select 1/y from data 이런식입니다.) 인데 이게 box-cox 변환이라고 할 수 있는건지 궁금합니다. 역변환할때 y로 그냥 변경해주면 되는지 특별한 코드가 있는지 궁금합니다. 웹에서 찾아보면 보정이 필요하다고 하는것 같은데 궁금합니다. 셋째, 그리고 하나씩 할때와 방향이 틀리게 나오면 그건 잘못된 다항회귀모형일까요? 아니면 다항회귀모형에서는 그럴수도 있는걸까요? 그럴수도 있으면 그거에 대한 설명방법은 머가 있을까요? 읽어주셔서 감사합니다.
... View more