<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Scoring new obs after clustering , need help with syntax in Statistical Procedures</title>
    <link>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8096#M32</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Hi all,&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;I did some research but could use a confirmation.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;1) Cluster procedure:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc cluster data = /* WHICH DATA */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; method=ward /* WHAT LINKAGE */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; outtree=&lt;/P&gt;&lt;P&gt;&amp;nbsp; ccc pseudo print=15/* OUTPUT DATA INCLUDING SOLUTION */; &lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; id CHOSEN ID /*VAR THAT WILL BE CLUSTERED */;&lt;/P&gt;&lt;P&gt;var&amp;nbsp;&amp;nbsp; /*VARS TO BE CLUSTERED */;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;/*Produce tree so as to see the shape of solution */&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;ods graphics on;&lt;/P&gt;&lt;P&gt;proc tree nclusters=5 /* HOW MANY CLUSTERS */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; data= /* OUTPUT DATA OF STEP 1 IS INPUT DATA IN STEP 2 */&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; out=/* FINAL DATA INCLUDING SOLUTION */;&lt;/P&gt;&lt;P&gt;id chosen ID;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;ods graphics off;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc sort data =&lt;/P&gt;&lt;P&gt;out=;&lt;/P&gt;&lt;P&gt;by Cluster;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc means data =;&lt;/P&gt;&lt;P&gt;output out=;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus data=&amp;lt;newdata&amp;gt;&lt;/P&gt;&lt;P&gt;maxclusters=&amp;lt;nclusters&amp;gt;&lt;/P&gt;&lt;P&gt;seed=&amp;lt;centroids&amp;gt;&lt;/P&gt;&lt;P&gt;maxiter=0 out=&amp;lt;scored&amp;gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;My question here is how the proc means syntax should be cause it doesnt make sense to use the output from the tree that contains only the cluster and ID.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;2) Fastclus&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus data=&lt;/P&gt;&lt;P&gt;outstat=&lt;/P&gt;&lt;P&gt;maxclusters=5;&lt;/P&gt;&lt;P&gt;var ;&lt;/P&gt;&lt;P&gt;id chosen ID;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc means data=&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus instat=&lt;/P&gt;&lt;P&gt;out=score data;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Same here as above&amp;nbsp; regarding the proc means syntax, what should be my input?&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Thnx in advance&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Sat, 03 Dec 2011 15:37:01 GMT</pubDate>
    <dc:creator>chemicalab</dc:creator>
    <dc:date>2011-12-03T15:37:01Z</dc:date>
    <item>
      <title>Scoring new obs after clustering , need help with syntax</title>
      <link>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8096#M32</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Hi all,&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;I did some research but could use a confirmation.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;1) Cluster procedure:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc cluster data = /* WHICH DATA */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; method=ward /* WHAT LINKAGE */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; outtree=&lt;/P&gt;&lt;P&gt;&amp;nbsp; ccc pseudo print=15/* OUTPUT DATA INCLUDING SOLUTION */; &lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; id CHOSEN ID /*VAR THAT WILL BE CLUSTERED */;&lt;/P&gt;&lt;P&gt;var&amp;nbsp;&amp;nbsp; /*VARS TO BE CLUSTERED */;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;/*Produce tree so as to see the shape of solution */&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;ods graphics on;&lt;/P&gt;&lt;P&gt;proc tree nclusters=5 /* HOW MANY CLUSTERS */&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; data= /* OUTPUT DATA OF STEP 1 IS INPUT DATA IN STEP 2 */&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; out=/* FINAL DATA INCLUDING SOLUTION */;&lt;/P&gt;&lt;P&gt;id chosen ID;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;ods graphics off;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc sort data =&lt;/P&gt;&lt;P&gt;out=;&lt;/P&gt;&lt;P&gt;by Cluster;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc means data =;&lt;/P&gt;&lt;P&gt;output out=;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus data=&amp;lt;newdata&amp;gt;&lt;/P&gt;&lt;P&gt;maxclusters=&amp;lt;nclusters&amp;gt;&lt;/P&gt;&lt;P&gt;seed=&amp;lt;centroids&amp;gt;&lt;/P&gt;&lt;P&gt;maxiter=0 out=&amp;lt;scored&amp;gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;My question here is how the proc means syntax should be cause it doesnt make sense to use the output from the tree that contains only the cluster and ID.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;2) Fastclus&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus data=&lt;/P&gt;&lt;P&gt;outstat=&lt;/P&gt;&lt;P&gt;maxclusters=5;&lt;/P&gt;&lt;P&gt;var ;&lt;/P&gt;&lt;P&gt;id chosen ID;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc means data=&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc fastclus instat=&lt;/P&gt;&lt;P&gt;out=score data;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Same here as above&amp;nbsp; regarding the proc means syntax, what should be my input?&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Thnx in advance&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Sat, 03 Dec 2011 15:37:01 GMT</pubDate>
      <guid>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8096#M32</guid>
      <dc:creator>chemicalab</dc:creator>
      <dc:date>2011-12-03T15:37:01Z</dc:date>
    </item>
    <item>
      <title>Scoring new obs after clustering , need help with syntax</title>
      <link>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8097#M33</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;1) If I understand your code, the DATA= option for PROC MEANS is the OUT= data set for PROC TREE. The OUT= dataset for PROC MEANS would be "centroids," which is the SEED= input for PROC FASTCLUS.&amp;nbsp; You are correct that there doesn't seem to be a need for the MEANS step (or the SORT?).&lt;/P&gt;&lt;P&gt;2) Why do you need to find means at all? Use the OUTSTAT= data set the first time, and read that back in with teh INSTAT= option in order to score the new data.&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 05 Dec 2011 02:57:43 GMT</pubDate>
      <guid>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8097#M33</guid>
      <dc:creator>Rick_SAS</dc:creator>
      <dc:date>2011-12-05T02:57:43Z</dc:date>
    </item>
    <item>
      <title>Scoring new obs after clustering , need help with syntax</title>
      <link>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8098#M34</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Ok,&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;So for the second method i need the Outstat data set, that i understand.&lt;/P&gt;&lt;P&gt;Regarding the first method which will be my SEED dataset, the OUTTREE from PROC CLUSTER or the OUT from PROC TREE?&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Thnx in advance Rick&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 05 Dec 2011 09:01:36 GMT</pubDate>
      <guid>https://communities.sas.com/t5/Statistical-Procedures/Scoring-new-obs-after-clustering-need-help-with-syntax/m-p/8098#M34</guid>
      <dc:creator>chemicalab</dc:creator>
      <dc:date>2011-12-05T09:01:36Z</dc:date>
    </item>
  </channel>
</rss>

