Clusterプロシジャの使用方法についてご質問です。
クラスタ分析(Ward法)をClusterプロシジャで行っているのですが、
使用するデータセットにkeep文で変数を絞り込むのと、絞り込まないのとで
クラスターの結果が異なってしまいます。
こちらはどういう仕様であるか、また、変数は絞り込むべきであるか否か、
ご存知でしょうか?
PROC CLUSTER DATA=WORK.dt1(keep=PARTS_ID var1)
METHOD=WARD
CCC
PSEUDO
OUTTREE=WORK.fotree
PRINT=15
PLOTS=PSF
PLOTS=PST2
PLOTS=CCC
;
VAR var1;
ID PARTS_ID;
RUN;
PROC TREE DATA=WORK.fotree
OUT=WORK.TREETreeData
ncl=3
;
ID PARTS_ID;
copy var1;
RUN;