Hallo Kartrin,
Du kannst der scan() Funktion sagen, welche Zeichen sie als Trenner interpretieren soll, und welche Teil des Textes sind. Wenn die Form IMMER "Nachnahme - KOMMA - weiterer Text" ist, dann trennt das Komma den Nachnahmen von allen weiteren Namensbestandteilen. Hier ein Beispiel:
data names;
Length name $256;
Input name $50.;
Cards;
Mayer, Lena
Müller-Lüdenscheid, Gans Günter
Hoffmann von der Fallersleben, Dr. Irgeneiner
;
Run;
Data split;
Length lastName firstName $64;
Set names;
lastName = scan(name,1,",");
firstName = scan(name,2,",");
Drop name;
Put lastName= firstName=;
Run;
Im LOG steht dann:
lastName=Mayer firstName=Lena
lastName=Müller-Lüdenscheid firstName=Gans Günter
lastName=Hoffmann von der Fallersleben firstName=Dr. Irgeneiner
NOTE: There were 3 observations read from the data set WORK.NAMES.
NOTE: The data set WORK.SPLIT has 3 observations and 2 variables.
NOTE: DATA statement used (Total process time):
real time 0.02 seconds
cpu time 0.03 seconds
Hoffe das hilft weiter - und die Datenqualität stimmt 😉
Viele Grüße,
Grischa