BookmarkSubscribeRSS Feed
🔒 This topic is solved and locked. Need further help from the community? Please sign in and ask a new question.
jonathanch
Calcite | Level 5

PS: "WARNING: Some observations were discarded when charting P_nombre.  Only first matching observation was used." ne se produit pas quand je mets en choro l'âge du conducteur moyen.


PGStats
Opal | Level 21

Le message d'avertissement signifie que votre dataset contient plusieurs valeurs prédites (p_nombre) pour chaque départenent. L'option STATISTIC= indique comment combiner ces valeurs (FREQ : compter le nombre de valeurs, MEAN: en faire la moyenne, FIRST: prendre la première valeur) . Selon moi, le dataset qui est nommé dans l'énoncé SCORE de proc GAM ne devrait contenir qu'un seul enregistrement pour chaque département et par conséquent ne générer qu'une valeur prédite par département.

Les options DISCRETE, LEVELS, MIDPOINTS et RANGE de l'énoncé CHORO, anisi que l'utiliation d'un format pour la variable illustrée (p_nombre) permettent de contrôler la classification qui est illustrée. C"est le genre de détail qu'il vaut mieux garder pour la fin du processus.

PG

PG
jonathanch
Calcite | Level 5

J'ai sorti une carte plus haut de la conversation et vous ait exposé une idée, je ne sais pas si vous avez vu.

"Selon moi, la dataset qui est nommé dans l'énoncé SCORE de proc GAM ne devrait contenir qu'un seul enregistrement pour chaque département".

Je pensais que le SCORE était calculé sur les individus (clients) et comme certains clients peuvent habiter dans le même département cela engendre des doublons de code_departement. C'est que j'ai l'impression que cela fait dans mon cas d'où le warning dans le log.

PGStats
Opal | Level 21

L'énoncé SCORE permet d'obtenir des prédictions pour un ensemble de données autre que celui qui sert à ajuster le modèle. Comme il vous faut illustrer une et une seule valeur prédite pour chaque département, le dataset passé à SCORE doit comporter une seule observation pour chaque département. Vous pourriez par exemple y fixer ageconducteur=40 pour tous les départements et ainsi illustrer la répartition géographique des prédictions (p_nombre) pour les conducteurs de 40 ans. - PG

PG
jonathanch
Calcite | Level 5

"L'énoncé SCORE permet d'obtenir des prédictions pour un ensemble de données autre que celui qui sert à ajuster le modèle":

"le dataset passé à SCORE doit comporter une seule observation pour chaque département"


Alors je prends une unique personne de 40 ans dans chaque département avant de lancer proc GAM même s'il y en a plusieurs de 40 ans dans chaque département?

Pas de problème en terme de convergence, les propriétés asymptotiques de mes prédicteurs ne seront pas violées?

Ps: Etes-vous professeur ou formateur? si ce n'est pas le cas vous auriez dû.

PGStats
Opal | Level 21

L'ensemble de vos données (contrats) peut servir à l'ajustement du modèle GAM. Vous spécifiez cet ensemble de données dans PROC GAM DATA=mesDonnees;

Vous assemblez aussi un autre ensemble de données décrivant des clients fictifs de 40 ans situés au centroïde de chaque département. Vous réclamez les prédictions de votre modèle pour ces clients fictifs dans SCORE DATA=mesClientsFictifs OUT=mesPredictions; Ce sont ces prédictions que vous illustrez sur votre carte.

En résumé,

le dataset mesDonnees contiendrait les variables X, Y, ageconducteur, Nombre

et le dataset mesClientsFictifs contiendrait les variables ID_GEOFLA, X(=X_CENTROID), Y(=Y_CENTROID), ageconducteur(=40)

La procédure créera le dataset mesPredictions contenant les variables ID_GEOFLA, X, Y, ageconducteur(=40), P_Nombre

où seules les variables ID_GEOFLA et P_Nombre sont requises par GMAP pour colorer la carte.

proc gmap map=departements data=mesPredictions;

id ID_GEOFLA;

choro P_Nombre;

run;

quit;


Bonne chance!


PG (pas pédagogue pour deux sous Smiley Happy)

PG
jonathanch
Calcite | Level 5

Pas pédagogue et pourtant j'ai réussi à comprendre votre démarche pour avoir un predicteur à chaque département donc pas de warning. Coup de chance? Je ne pense pas! Merci beaucoup et à bientôt peut-être.

Ma prochaine étape: regarder au niveau de proc fastclus/proc cluster pour déterminer le nombre de levels.

gmap11.png

sas-innovate-2024.png

Don't miss out on SAS Innovate - Register now for the FREE Livestream!

Can't make it to Vegas? No problem! Watch our general sessions LIVE or on-demand starting April 17th. Hear from SAS execs, best-selling author Adam Grant, Hot Ones host Sean Evans, top tech journalist Kara Swisher, AI expert Cassie Kozyrkov, and the mind-blowing dance crew iLuminate! Plus, get access to over 20 breakout sessions.

 

Register now!

What is ANOVA?

ANOVA, or Analysis Of Variance, is used to compare the averages or means of two or more populations to better understand how they differ. Watch this tutorial for more.

Find more tutorials on the SAS Users YouTube channel.

Discussion stats
  • 21 replies
  • 2926 views
  • 6 likes
  • 2 in conversation