About AndreasBachert

AndreasBachert · ‎04-24-2019

Wenn ich die Frage richtig verstehe, sollte eine einfache Selektion ausreichen: PROC SQL; CREATE TABLE <Nur2Wochen> AS SELECT * FROM <AlleDaten> WHERE <Datum> BETWEEN '07NOV2018'd + 14 AND '07NOV2018'd + 21 ; QUIT; Die Platzhalter zwischen den spitzen Klammern müssen durch die richtigen Werte für die Tabellen und Variablen ersetzt werden. Viele Grüße Andreas

AndreasBachert · ‎02-27-2018

Ich sehe neben einem Join mit einer externen Tabelle noch mindestens zwei weitere effektive Wege, wie die 'Umbenennung' von statten gehen kann: Erzeugen eines Formates, das das mapping von altem zu neuem Namen übernimmt Verwenden von Regular Expressions Diese Variante ist dann interessant, wenn es Regeln für die Umbenennung gibt Dann muss man nicht jeden alten und neuen Wert selbst in irgendeiner Form benennen Code für Variante 1: PROC FORMAT LIB=WORK; VALUE $fmtNewNames "BIV1" = "BIV1Y" "BIV2" = "BIV2Y" "BIV3" = "BIV3Y" "BIV" = "BIVY" "BIV1_ABC" = "BIV1Y_ABC" "BIV2_ABC" = "BIV2Y_ABC" "BIV3_ABC" = "BIV3Y_ABC" ; RUN; DATA _NULL_; LENGTH Vorher Nachher $20 ; Vorher = "BIV"; Nachher = PUT (Vorher, $fmtNewNames.); PUT Vorher= Nachher=; Vorher = "BIV1"; Nachher = PUT (Vorher, $fmtNewNames.); PUT Vorher= Nachher=; Vorher = "BIV2_ABC"; Nachher = PUT (Vorher, $fmtNewNames.); PUT Vorher= Nachher=; Vorher = "UNBEKANNT"; Nachher = PUT (Vorher, $fmtNewNames.); PUT Vorher= Nachher=; RUN; /* Ausgabe im Log: */ Vorher=BIV Nachher=BIVY Vorher=BIV1 Nachher=BIV1Y Vorher=BIV2_ABC Nachher=BIV2Y_ABC Vorher=UNBEKANNT Nachher=UNBEKANNT Code für Variante 2: /* Angenommen die Regel lautet: - Es kommen Werte, - die mit BIV beginnen - und danach 0 bis 1 Ziffer haben - und danach - enden - oder ein Unterstrich und weitere Zeichen folgen - Ergänze diese Werte um den Buchstaben Y - bei 3-stelligen Werten am Ende - sonst nach der ersten Ziffer */ DATA _NULL_; LENGTH oPattern 8 sPattern $100 Vorher Nachher $20 ; /* Definieren des Such- und Ersetzungsmusters */ sPattern = 's/(BIV\d?)(_?)(.*)/$1Y$2$3/'; /* Suchmuster validieren */ oPattern = PRXParse (sPattern); Vorher = "BIV"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; Vorher = "BIV_ABC"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; Vorher = "BIV1"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; Vorher = "BIV2ABC"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; Vorher = "BIV3_ABC"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; Vorher = "UNBEKANNT"; Nachher = PRXChange (oPattern, 1, Vorher); PUT Vorher= Nachher=; RUN; /* Ausgabe im Log: */ Vorher=BIV Nachher=BIVY Vorher=BIV_ABC Nachher=BIVY_ABC Vorher=BIV1 Nachher=BIV1Y Vorher=BIV2ABC Nachher=BIV2YABC Vorher=BIV3_ABC Nachher=BIV3Y_ABC Vorher=UNBEKANNT Nachher=UNBEKANNT Viele Grüße Andreas

AndreasBachert · ‎03-10-2017

Hallo Michael, wie gesagt, ich denke auch, dass das mit der nur 2-stelligen Jahreszahl bei datetime18. ein kleiner Bug ist. Mich stört so etwas nicht weiter, da ich ja, wenn ich den formatierten Wert als Text ohne führende Leerzeichen in einer Dataset-Variablen weiterverwenden will, die führenden Leerzeichen ja entfernen kann. Meine Variable test_string hat im Gegensatz zu der Variablen test_string aus deinem vorangegangenen Code-Beispiel eine 4-stellige Jahreszahl und keine führenden Leerzeichen. (Dafür hat sie aber 2 abschließende Leerzeichen, da ich ja mit dateime20. formatiert habe.) Der Code ... data test; test_datum = '01JAN1915:07:45:12'dt; test_string = strip (put(test_datum, datetime20.)); test_ergebnis = input(test_string, datetime18.); format test_ergebnis datetime20.; put test_string=; put test_ergebnis=; run; ... ergibt im Log die folgende Ausgabe: test_string=01JAN1915:07:45:12 test_ergebnis=01JAN1915:07:45:12 Viele Grüße Andreas

AndreasBachert · ‎03-10-2017

Hallo mfab, deine Frage müsste eigentlich lauten: Wie wendet SAS Formatierungen bei Datetime-Werten an? Denn die Breite deines Datetime-Feldes, das den Namen 'test' und in der Tabelle 'test' zu finden ist, ist 8 Bytes. Was dein Programm angeht, so nimmst du ja nur unterschiedliche Formatierungen des Datetime-Wertes vor. Grundsätzlich gilt dabei, dass du durch die Zahl vor dem Punkt die Gesamtlänge des formatierten Wertes vorgibst und eine evtl. nach dem Punkt angegebene Zahl die Anzahl der Nachkommastellen festlegt. Die Formatangabe datetime18. ist somit äquivalent zu datetime18.0. Das datetime-Format ist ein Zahlenformat, denn es wird ja ein Zahlenwert formatiert. Wenn ein formatierter Zahlerwert weniger Zeichen benötigt, als du durch deine Gesamtlängenangabe bei der Formatierung mitgibst, werden die übrigen Zeichen als Lerrzeichen vorangestellt. Deshalb siehst du bei der Verwendung von datetime19. ein führendes Leerzeichen und bei der Verwendung von datetime20. eben zwei führende Leerzeichen. Denn für den auszugegebenen Wert werden ja nur 18 Zeichen benötigt. Abschließende Hinweise: Warum SAS bei datetime18. nicht die vierstellige Jahreszahl ausgibt, kann ich nicht sagen Ich würde halt immer datimetime19. verwenden (und davon ggf. das führende Leerzeichen abschneiden) Eine Formatangabe von dateime22.2 bedeutet Gibt mir den Zeitstempel aus in einer Gesamtlänge von 22 Zeichen und zeigen nach den Sekunden noch 2 Stellen an, die die Bedeutung von 1/100 Sekunden haben In den 22 Gesamtzeichen muss der Dezimaltrenner separat mitgezählt werden Wir haben dann also 20 Zeichen zur Darstellung des Zeitstempelwertes bis zu den vollen Sekunden Danach folgt ein Punkt als TRennzeichen vor den 1/100 Sekunden Und dann folgenden die Zeichen 21 und 22 für die Anzeoige der 1/100 Sekunden Man kann Datetime-Werte maximal mit 3 Nachkommastellen (für 1/1000 Sekunden) ausgeben, also dateime<x>.3 Bei der Verwendung von Character-Formaten werden überflüssige Zeichen als abschließende Leerzeichen an den formatierten Werte angehängt (und nicht vorangestellt wie bei formatierten Zahlenwerten) Viele Grüße Andreas

AndreasBachert · ‎02-27-2017

Hallo, ich habe noch einen Nachtrag, der definitiv zeigt, dass beim EXPORT nach DBMS=dlm ein (bzw. mehrere) grobe Fehler vorliegen, wenn ein KEEP-Statement angegeben wird. Das folgende Beispiel zeigt, dass das KEEP beim Export mit DBMS=dlm auch dann nicht sauber berücksichtigt wird, wenn man die Listen-Notation für die Aufzählung von Variablen verwendet Das folgende Beispiel zeigt, dass das KEEP beim Export nach EXCEL immer sauber berücksichtigt wird Das gilt, wenn viele Variablen einzeln benannt werden Das gilt auch, wenn man die Listen-Notation für die Aufzählung von Variablen verwendet /* Eine weitere Art mit ARRAYS Listen von Variablen anzusprechen */ DATA test2; LENGTH a0001 - a0050 8 b 8 c0001 - c0050 8 ; ARRAY arVariablesA a0001 -- a0050 ; ARRAY arVariablesC c0001 -- c0050 ; /* Einzelvariable initialisieren */ b = 1; /* Alle anderen Variablen initialisieren */ DO i = 1 TO 50; arVariablesA (i) = 1; arVariablesC (i) = 1; END; RUN; /* Dieses Beispiel zeigt den Bug bei der Verarbeitung von KEEP beim Export nach DBMS=dlm: Variablenlisten im KEEP werden falsch aufgelöst. - In der Exportdatei stehen späer nur 5 Variablen (statt 81), nämlich a0001, a0040, b, c0001 und c0040 */ FILENAME outfile3 "C:\TEMP\test3.csv" LRECL=1000; PROC EXPORT DATA = test2 (KEEP = a0001 -- a0040 b c0001 -- c0040 ) OUTFILE = outfile3 DBMS=DLM REPLACE ; RUN; /* PROC EXPORT nach EXCEL läuft fehlerfrei, auch wenn viele einzelne Variablen im KEEP aufgeführt werden - Die Zieldatei hat, wie erwartet, 81 Variablen */ PROC EXPORT DATA = test2 (KEEP = a0001 a0002 a0003 a0004 a0005 a0006 a0007 a0008 a0009 a0010 a0011 a0012 a0013 a0014 a0015 a0016 a0017 a0018 a0019 a0020 a0021 a0022 a0023 a0024 a0025 a0026 a0027 a0028 a0029 a0030 a0031 a0032 a0033 a0034 a0035 a0036 a0037 a0038 a0039 a0040 b c0001 c0002 c0003 c0004 c0005 c0006 c0007 c0008 c0009 c0010 c0011 c0012 c0013 c0014 c0015 c0016 c0017 c0018 c0019 c0020 c0021 c0022 c0023 c0024 c0025 c0026 c0027 c0028 c0029 c0030 c0031 c0032 c0033 c0034 c0035 c0036 c0037 c0038 c0039 c0040 ) OUTFILE = "C:\TEMP\test2.xlsx" DBMS=EXCEL REPLACE ; RUN; /* PROC EXPORT nach EXCEL läuft fehlerfrei, auch wenn die Listen-Notation verwendet wird - Die Zieldatei hat, wie erwartet, 81 Variablen */ PROC EXPORT DATA = test2 (KEEP = a0001 -- a0040 b c0001 -- c0040 ) OUTFILE = "C:\TEMP\test3.xlsx" DBMS=EXCEL REPLACE ; RUN; So lange dieser Bug besteht, muss man wohl den Workaround aus meiner vorhergehenden Antwort zu diesem Problem einsetzen. Viele Grüße Andreas

AndreasBachert · ‎02-27-2017

Hallo, ich kann den Fehler reproduzieren und er liegt m.E. nicht am KEEP-Statement sondern an dem internen SCL-Code, den SAS verwendet, um den DATASTEP für den Datenexport zu generieren. Das ist ein echter Bug. Am Ende meines Codes seht ihr einen Workaround für das Problem. /* Eine andere Art eine Dataset mit 99 durchnummerierten und gleich initialisierten Variablen zu erzeugen - Das gute alte ARRAY */ DATA test; LENGTH a0001 - a0099 8 ; ARRAY arVariables a0001 -- a0099 ; DO OVER arVariables; arVariables = 1; END; RUN; /* Dieser PROC EXPORT läuft auf einen Fehler. - Das muss ein Bug in SAS sein und zwar in dem Programmteil, der den Datasteop für den EXPORT zusmamenbaut. - Das Problem liegt somit nicht am KEEP-Statement */ FILENAME outfile1 "C:\TEMP\test1.csv" LRECL=1000; PROC EXPORT DATA = test (KEEP = a0001 a0002 a0003 a0004 a0005 a0006 a0007 a0008 a0009 a0010 a0011 a0012 a0013 a0014 a0015 a0016 a0017 a0018 a0019 a0020 a0021 a0022 a0023 a0024 a0025 a0026 a0027 a0028 a0029 a0030 a0031 a0032 a0033 a0034 a0035 a0036 a0037 a0038 a0039 a0040 a0041 a0042 a0043 a0044 a0045 a0046 a0047 a0048 a0049 a0050 a0051 a0052 a0053 a0054 a0055 a0056 a0057 a0058 a0059 a0060 a0061 a0062 a0063 a0064 a0065 a0066 a0067 a0068 a0069 a0070 a0071 a0072 a0073 a0074 a0075 a0076 a0077 a0078 a0079 a0080 a0081 a0082 a0083 a0084 a0085 a0086 a0087 a0088 a0089 a0090 ) OUTFILE = outfile1 DBMS=DLM REPLACE ; RUN; /* Workaround: Wenn man das Keep in einer View kapselt und dann die View (natürlich ohne KEEP) exportiert, funktioniert alles */ PROC SQL NOPRINT; CREATE VIEW vwTest AS SELECT * FROM test (KEEP = a0001 a0002 a0003 a0004 a0005 a0006 a0007 a0008 a0009 a0010 a0011 a0012 a0013 a0014 a0015 a0016 a0017 a0018 a0019 a0020 a0021 a0022 a0023 a0024 a0025 a0026 a0027 a0028 a0029 a0030 a0031 a0032 a0033 a0034 a0035 a0036 a0037 a0038 a0039 a0040 a0041 a0042 a0043 a0044 a0045 a0046 a0047 a0048 a0049 a0050 a0051 a0052 a0053 a0054 a0055 a0056 a0057 a0058 a0059 a0060 a0061 a0062 a0063 a0064 a0065 a0066 a0067 a0068 a0069 a0070 a0071 a0072 a0073 a0074 a0075 a0076 a0077 a0078 a0079 a0080 a0081 a0082 a0083 a0084 a0085 a0086 a0087 a0088 a0089 a0090 ) ; QUIT; FILENAME outfile2 "C:\TEMP\test2.csv" LRECL=1000; PROC EXPORT DATA = vwTest OUTFILE = outfile2 DBMS=DLM REPLACE ; RUN; Viele Grüße Andreas

AndreasBachert · ‎01-25-2017

Hallo, nur noch als Ergänzung: Im Beispiel handelt es sich um eine Rohdaten-Datei, in der die unterschiedlichen Werte nicht durch ein Trennzeichen getrennt sind, sondern immer an dedizierten Spalten beginnen. In diesem Fall ist man ganz 'sauber', wenn man spaltenorientiert einliest, d.h., wenn man bei jedem Wert, den man auslesen will, angibt, an welcher Spalte er beginnt und wo er endet. Der Programmcode sähe dann so aus: data test; infile datei03 obs=999999999 LRECL=555 missover pad end=end ; length kundnum $10 anldat_a $8 loevm_A $1 sperr $1 anrede $15 name1 name2 $40 strasse $40 plz $5 ort $40 ; input kundnum $ 1 - 10 anldat_A $ 11 - 18 loevm_A $ 19 - 19 sperr $ 20 - 20 anrede $ 21 - 26 name1 $ 27 - 41 name2 $ 42 - 56 strasse $ 57 - 74 plz $ 75 - 80 ort $ /* Den Rest der Zeile als 'Ort' lesen */ ; output; run; proc print data=test; run; Abschließende Hinweise: Das Length-Statement wird nur benötigt, wenn man in der Zieltabelle andere Variablen-Längen definieren will, als sie in der Rohdatendatei vorgesehen sind Wenn man z.B. das Length-Statement für name2 weglässt, würde die Variable mit einer Länge von 15 in der Zieltabelle deklariert (da man ja der Variablen die Zeichen aus den Spalten 42 - 56 zuweisen lässt) Ein Informat benötigt man, wenn man z.B. einen Text einlesen will, der ein Datum bedeutet. Dann muss man SAS 'sagen', wie die betrffenden Zeichen zu übernemen sind. z.B. muss der Text 12NOV2016 mit dem Informat DATE9. eingelesen werden, damit der Text in der Zieltabelle zu einem Datumswert wird Wenn man, wie im Code-Beispiel zu sehen, bei jedem Wert angibt, wo er beginnt und wo er endet, kann man auch Werte einfach überspringen, wenn man sie nicht in der Zieltabelle benötigt Wenn man z.B. den Wert für loevm_A ncht benötigt, lässt man loevm_A einfach aus dem Input-Statement weg und der Code funktioniert immer noch Dann wird einfach das Zeichen, das in der Spalte 19 der Rohdatenzeile steht, einfach nirgendwo verwendet Viele Grüße Andreas

Online Status	Offline
Date Last Visited	‎08-19-2024 05:21 AM

Betreff: Zeitraum anzeigen lassen

Betreff: Ersetzen/Ändern

Betreff: Datetime Width

Betreff: Datetime Width

Betreff: Keep Option im PROC Export

Betreff: Keep Option im PROC Export

Betreff: Character-Feld mit Inhalt 'Punkt' aus Datei korrekt einlesen

Betreff: Zeitraum anzeigen lassen

Betreff: Ersetzen/Ändern

Betreff: Zeitraum anzeigen lassen

Betreff: Ersetzen/Ändern

Betreff: Datetime Width

Betreff: Datetime Width

Betreff: Keep Option im PROC Export

Betreff: Keep Option im PROC Export

Betreff: Character-Feld mit Inhalt 'Punkt' aus Datei korrekt einlesen

CoDe SAS German