Solved: Proc GMAP after proc GAM - Page 2

jonathanch · Posted 08-13-2014 03:21 PM

PS: "WARNING: Some observations were discarded when charting P_nombre. Only first matching observation was used." ne se produit pas quand je mets en choro l'âge du conducteur moyen.

PGStats · Posted 08-13-2014 03:24 PM

Le message d'avertissement signifie que votre dataset contient plusieurs valeurs prédites (p_nombre) pour chaque départenent. L'option STATISTIC= indique comment combiner ces valeurs (FREQ : compter le nombre de valeurs, MEAN: en faire la moyenne, FIRST: prendre la première valeur) . Selon moi, le dataset qui est nommé dans l'énoncé SCORE de proc GAM ne devrait contenir qu'un seul enregistrement pour chaque département et par conséquent ne générer qu'une valeur prédite par département.

Les options DISCRETE, LEVELS, MIDPOINTS et RANGE de l'énoncé CHORO, anisi que l'utiliation d'un format pour la variable illustrée (p_nombre) permettent de contrôler la classification qui est illustrée. C"est le genre de détail qu'il vaut mieux garder pour la fin du processus.

PG

jonathanch · Posted 08-13-2014 04:28 PM

J'ai sorti une carte plus haut de la conversation et vous ait exposé une idée, je ne sais pas si vous avez vu.

"Selon moi, la dataset qui est nommé dans l'énoncé SCORE de proc GAM ne devrait contenir qu'un seul enregistrement pour chaque département".

Je pensais que le SCORE était calculé sur les individus (clients) et comme certains clients peuvent habiter dans le même département cela engendre des doublons de code_departement. C'est que j'ai l'impression que cela fait dans mon cas d'où le warning dans le log.

PGStats · Posted 08-13-2014 05:30 PM

L'énoncé SCORE permet d'obtenir des prédictions pour un ensemble de données autre que celui qui sert à ajuster le modèle. Comme il vous faut illustrer une et une seule valeur prédite pour chaque département, le dataset passé à SCORE doit comporter une seule observation pour chaque département. Vous pourriez par exemple y fixer ageconducteur=40 pour tous les départements et ainsi illustrer la répartition géographique des prédictions (p_nombre) pour les conducteurs de 40 ans. - PG

PG

jonathanch · Posted 08-13-2014 06:18 PM

"L'énoncé SCORE permet d'obtenir des prédictions pour un ensemble de données autre que celui qui sert à ajuster le modèle":

"le dataset passé à SCORE doit comporter une seule observation pour chaque département"

Alors je prends une unique personne de 40 ans dans chaque département avant de lancer proc GAM même s'il y en a plusieurs de 40 ans dans chaque département?

Pas de problème en terme de convergence, les propriétés asymptotiques de mes prédicteurs ne seront pas violées?

Ps: Etes-vous professeur ou formateur? si ce n'est pas le cas vous auriez dû.

PGStats · Posted 08-13-2014 08:55 PM

L'ensemble de vos données (contrats) peut servir à l'ajustement du modèle GAM. Vous spécifiez cet ensemble de données dans PROC GAM DATA=mesDonnees;

Vous assemblez aussi un autre ensemble de données décrivant des clients fictifs de 40 ans situés au centroïde de chaque département. Vous réclamez les prédictions de votre modèle pour ces clients fictifs dans SCORE DATA=mesClientsFictifs OUT=mesPredictions; Ce sont ces prédictions que vous illustrez sur votre carte.

En résumé,

le dataset mesDonnees contiendrait les variables X, Y, ageconducteur, Nombre

et le dataset mesClientsFictifs contiendrait les variables ID_GEOFLA, X(=X_CENTROID), Y(=Y_CENTROID), ageconducteur(=40)

La procédure créera le dataset mesPredictions contenant les variables ID_GEOFLA, X, Y, ageconducteur(=40), P_Nombre

où seules les variables ID_GEOFLA et P_Nombre sont requises par GMAP pour colorer la carte.

proc gmap map=departements data=mesPredictions;

id ID_GEOFLA;

choro P_Nombre;

run;

quit;

Bonne chance!

PG (pas pédagogue pour deux sous )

PG

jonathanch · Posted 08-14-2014 07:38 AM

Pas pédagogue et pourtant j'ai réussi à comprendre votre démarche pour avoir un predicteur à chaque département donc pas de warning. Coup de chance? Je ne pense pas! Merci beaucoup et à bientôt peut-être.

Ma prochaine étape: regarder au niveau de proc fastclus/proc cluster pour déterminer le nombre de levels.

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM

Re: Proc GMAP after proc GAM