<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>Thema "Logistische Regression mit 31.500 unabhängigen Variablen" in CoDe SAS German</title>
    <link>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326398#M2167</link>
    <description>&lt;P&gt;Hallo Kollegen,&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;ich möchte ein Modell&amp;nbsp;mit der&amp;nbsp;logistischen Regression auf folgender Datenbasis erstellen:&lt;/P&gt;
&lt;P&gt;1 abhängige Variable (Zielmerkmal: reag)&lt;/P&gt;
&lt;P&gt;31.500 unabhängige Variablen (viele, viele Einzelmerkmale zu einer Beobachtung)&lt;/P&gt;
&lt;P&gt;200.000 Beobachtungen&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Dafür habe ich folgenden Code verwendet:&lt;/P&gt;
&lt;PRE&gt;proc logistic data=lib.mod_learn descending;
	model 	reag = %do i=1 %to 7; &amp;amp;&amp;amp;list&amp;amp;i.. %end; 
			/selection=stepwise fast slentry=0.05 slstay=0.05;
	ODS OUTPUT ModelBuildingSummary	= LR_S5_mvar;
	ODS OUTPUT ParameterEstimates	= LR_S5_mpara;
run; 
ods output close;&lt;/PRE&gt;
&lt;P&gt;Die 31.500 unabhängigen Variablen werden mittels 7 Makrovariablen übergeben.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Ich erhielt folgende Fehlermeldung:&lt;/P&gt;
&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;ERROR: Memory required by the hessian matrix exceeds the largest long integer.
ERROR: The SAS System stopped processing this step because of insufficient memory.
NOTE: There were 200000 observations read from the data set LIB.MOD_LEARN.
NOTE: PROCEDURE LOGISTIC used (Total process time):
      real time           7:55.82
      cpu time            5:52.62
&lt;/CODE&gt;&lt;/PRE&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Nun kann ich leider gar nichts damit anfangen, daher die Bitte an Euch, mich zu unterstützen:&lt;/P&gt;
&lt;P&gt;-- Wie kann ich meinen Code umstellen, damit das Modell durchläuft und die entsprechenden Modellparameter-Dateien ausgegeben werden?&lt;/P&gt;
&lt;P&gt;-- Oder wie kann ich Speicher für das Modell freigegeben? Anscheinend scheint dieser ja zu fehlen.&lt;/P&gt;
&lt;P&gt;-- Oder welchen Code&amp;nbsp;bzw. welche Methode&amp;nbsp;für die LR würdet Ihr verwenden bei so vielen Merkmalen?&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Mit weniger unabhängigen Variablen hatte ich nie Probleme ;-).&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Danke vorab und schönes Wochenende,&lt;/P&gt;
&lt;P&gt;Hendrik&lt;/P&gt;</description>
    <pubDate>Fri, 20 Jan 2017 20:13:05 GMT</pubDate>
    <dc:creator>HendrikE</dc:creator>
    <dc:date>2017-01-20T20:13:05Z</dc:date>
    <item>
      <title>Logistische Regression mit 31.500 unabhängigen Variablen</title>
      <link>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326398#M2167</link>
      <description>&lt;P&gt;Hallo Kollegen,&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;ich möchte ein Modell&amp;nbsp;mit der&amp;nbsp;logistischen Regression auf folgender Datenbasis erstellen:&lt;/P&gt;
&lt;P&gt;1 abhängige Variable (Zielmerkmal: reag)&lt;/P&gt;
&lt;P&gt;31.500 unabhängige Variablen (viele, viele Einzelmerkmale zu einer Beobachtung)&lt;/P&gt;
&lt;P&gt;200.000 Beobachtungen&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Dafür habe ich folgenden Code verwendet:&lt;/P&gt;
&lt;PRE&gt;proc logistic data=lib.mod_learn descending;
	model 	reag = %do i=1 %to 7; &amp;amp;&amp;amp;list&amp;amp;i.. %end; 
			/selection=stepwise fast slentry=0.05 slstay=0.05;
	ODS OUTPUT ModelBuildingSummary	= LR_S5_mvar;
	ODS OUTPUT ParameterEstimates	= LR_S5_mpara;
run; 
ods output close;&lt;/PRE&gt;
&lt;P&gt;Die 31.500 unabhängigen Variablen werden mittels 7 Makrovariablen übergeben.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Ich erhielt folgende Fehlermeldung:&lt;/P&gt;
&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;ERROR: Memory required by the hessian matrix exceeds the largest long integer.
ERROR: The SAS System stopped processing this step because of insufficient memory.
NOTE: There were 200000 observations read from the data set LIB.MOD_LEARN.
NOTE: PROCEDURE LOGISTIC used (Total process time):
      real time           7:55.82
      cpu time            5:52.62
&lt;/CODE&gt;&lt;/PRE&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Nun kann ich leider gar nichts damit anfangen, daher die Bitte an Euch, mich zu unterstützen:&lt;/P&gt;
&lt;P&gt;-- Wie kann ich meinen Code umstellen, damit das Modell durchläuft und die entsprechenden Modellparameter-Dateien ausgegeben werden?&lt;/P&gt;
&lt;P&gt;-- Oder wie kann ich Speicher für das Modell freigegeben? Anscheinend scheint dieser ja zu fehlen.&lt;/P&gt;
&lt;P&gt;-- Oder welchen Code&amp;nbsp;bzw. welche Methode&amp;nbsp;für die LR würdet Ihr verwenden bei so vielen Merkmalen?&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Mit weniger unabhängigen Variablen hatte ich nie Probleme ;-).&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Danke vorab und schönes Wochenende,&lt;/P&gt;
&lt;P&gt;Hendrik&lt;/P&gt;</description>
      <pubDate>Fri, 20 Jan 2017 20:13:05 GMT</pubDate>
      <guid>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326398#M2167</guid>
      <dc:creator>HendrikE</dc:creator>
      <dc:date>2017-01-20T20:13:05Z</dc:date>
    </item>
    <item>
      <title>Re: Logistische Regression mit 31.500 unabhängigen Variablen</title>
      <link>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326503#M2168</link>
      <description>Ich würde an Deiner Stelle die Anzahl der Prädiktoren zusammendampfen.&lt;BR /&gt;&lt;BR /&gt;1. Kriterium: Eine von Dir festzulegenden bivariate Korrelation mit dem&lt;BR /&gt;Target.&lt;BR /&gt;Alle Prädiktoren, die darunter liegen, fliegen raus.&lt;BR /&gt;&lt;BR /&gt;2. Kriterium: Sind die Prädiktoren überhaupt befüllt?&lt;BR /&gt;Nur die verwenden, die einen Mindest-Befüllungsgrad haben.&lt;BR /&gt;&lt;BR /&gt;Dieses Vorgehen kann helfen, das Feld der infragekommenden "Kandidaten"&lt;BR /&gt;auszudünnen.&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;##- Please type your reply above this line. Simple formatting, no&lt;BR /&gt;attachments. -##</description>
      <pubDate>Sat, 21 Jan 2017 14:37:08 GMT</pubDate>
      <guid>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326503#M2168</guid>
      <dc:creator>RedDwarf</dc:creator>
      <dc:date>2017-01-21T14:37:08Z</dc:date>
    </item>
    <item>
      <title>Betreff: Logistische Regression mit 31.500 unabhängigen Variablen</title>
      <link>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326631#M2169</link>
      <description>&lt;P&gt;Wenn ich mir &lt;A href="https://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_logistic_sect054.htm" target="_blank"&gt;https://support.sas.com/documentation/cdl/en/statug/63347/HTML/default/viewer.htm#statug_logistic_sect054.htm&lt;/A&gt; ansehe, dann glaube ich nicht, dass 31.500 Variable mit handelsüblicher Hardware zu schaffen sind. Eher denke ich bei 31.500 Einflussvariablen an Overkill um zumindest 2 Größenordnungen.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Mon, 23 Jan 2017 08:30:45 GMT</pubDate>
      <guid>https://communities.sas.com/t5/CoDe-SAS-German/Logistische-Regression-mit-31-500-unabh%C3%A4ngigen-Variablen/m-p/326631#M2169</guid>
      <dc:creator>Kurt_Bremser</dc:creator>
      <dc:date>2017-01-23T08:30:45Z</dc:date>
    </item>
  </channel>
</rss>

