En un caso práctico donde se pretende utilizar una determinada variable para construir un modelo predictivo, la cual es categórica nominal y además tiene 743 niveles diferentes, cuáles de estas acciones sería la más conveniente si se desea construir una modelo de regresión con el fin de mejorar el poder predictivo de la variable, incluso para conjuntos nuevos de datos:
a)Asegurarse que la variable es estadísticamente significativa mediante algún método de selección de variables.
b)Modificar la macro variable del proyecto EM_TRAIN_MAXLEVELS.
c)Convertir cada nivel de la variable a un numero entre 1 y 743.
d)Utilizar el nodo de transformación de variables para crear variables dummy utilizando la variable original.
e)Plantear un punto de corte para reducir niveles en la variable, posteriormente implementar el método de Smoothed weight of evidence para codificar la misma.
f)Utilizar el método de Smoothed weight of evidence para codificar la variable