Mal wieder eine Dummy Frage aus dem DI Studio.
Ich habe für ein und dasselbe Datum umd dieselbe Kundennummer unter Umständen mehrere Datensätze, die sich geringfügig im Namen unterscheiden. Für eine Auswertung will ich nur jeweils einen Namenseintrag mitnehmen. Gibt es hier irgendeine Funktion?
Danke vorab für die Hilfe!
Also wenn es egal ist welche der Datensätze erhalten bleibt, würde ich eine einfach SORT Transformation verwenden.
Unter "SORT BY Spalten" Datum und Kundennummer auswählen und im Tab "Optionen" bei "SAS Sort"-->"Doppelte Datensätze entfernen" die Option "Zeilen mit doppelten Schlüsseln entfernen (NODUPKEY)" auswählen.
Ohne DI Studio würde das so aussehen:
proc sort data=have ;
by datum kunr;
run;
data names;
set have (keep=datum kunr name);
by datum kunr;
if first.kunr;
run;
data want;
merge
have (drop=name)
names
;
by datum kunr;
run;
AndreasMenrath schrieb:
Warum so umständlich und nicht einfach
proc sort data=have out=want NODUPKEY;
by datum kunr;
run;
Wenn in den Datensätzen noch andere Daten ausser dem Namen vorhanden sind, würden diese verlorengehen.
Vielen lieben Dank für die Unterstützung!! Das scheint funktioniert zu haben. Wenn ich jetzt noch meinen Table loader dazu bringen kann seinen Job zu machen, ist der Tag gerettet 😉
Don't miss out on SAS Innovate - Register now for the FREE Livestream!
Can't make it to Vegas? No problem! Watch our general sessions LIVE or on-demand starting April 17th. Hear from SAS execs, best-selling author Adam Grant, Hot Ones host Sean Evans, top tech journalist Kara Swisher, AI expert Cassie Kozyrkov, and the mind-blowing dance crew iLuminate! Plus, get access to over 20 breakout sessions.