<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: elimination of duplicate rows in SAS Data Science</title>
    <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90994#M634</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Or just using data step:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;data have;&lt;/P&gt;&lt;P&gt;input (firstname middle lastname ID) (:$10.) age (school city) (:$10.);&lt;/P&gt;&lt;P&gt;cards;&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;data _null_;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;if 0 then set have;&lt;/P&gt;&lt;P&gt;&amp;nbsp; dcl hash h(dataset:'have');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definekey(all:'y');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definedata(all:'y');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definedone();&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.output(dataset: 'want');&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;proc print;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;07:05 Friday, April 20, 2012 68&lt;/P&gt;&lt;P&gt;&amp;nbsp; Obs firstname middle lastname ID age school city&lt;/P&gt;&lt;P&gt;&amp;nbsp; 1 Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 2 Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 3 Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Haikuo&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Fri, 20 Apr 2012 17:33:39 GMT</pubDate>
    <dc:creator>Haikuo</dc:creator>
    <dc:date>2012-04-20T17:33:39Z</dc:date>
    <item>
      <title>elimination of duplicate rows</title>
      <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90991#M631</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;what is the best way to eliminate the duplicate records when there is a dataset like this:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;firstname&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; middle&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; lastname&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; ID&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; age&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; school&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; city&lt;/P&gt;&lt;P&gt;Debbie&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; R&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Popular&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 12&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 13&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; xyz&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; NY&lt;/P&gt;&lt;P&gt;Debbie&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; R&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Popular&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 21&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 13&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; xyz&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; NY&lt;/P&gt;&lt;P&gt;Debbie&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; R&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Popular&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 12&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 13&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; xyz&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; NY&lt;/P&gt;&lt;P&gt;Deb&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; R&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Popular&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 12&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 13&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; xyz&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; NY&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;note that only first and third records are duplicate, others are not the same.&amp;nbsp; we only want to eliminate either the first or the third record in this case.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;there is a distinct( ) in SQL, in SAS, is there a way to eliminate only the records that are duplicate in all columns?&amp;nbsp; thanks.&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 20 Apr 2012 17:20:10 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90991#M631</guid>
      <dc:creator>Cyndia</dc:creator>
      <dc:date>2012-04-20T17:20:10Z</dc:date>
    </item>
    <item>
      <title>Re: elimination of duplicate rows</title>
      <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90992#M632</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;&lt;BR /&gt;example:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;data&lt;/STRONG&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; have;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;/P&gt;&lt;P&gt;&lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;input&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; a b c;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;cards&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: #ffffc0; color: black; font-family: 'Courier New';"&gt;1 2 3&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: #ffffc0; color: black; font-family: 'Courier New';"&gt;3 2 1&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: #ffffc0; color: black; font-family: 'Courier New';"&gt;1 2 3&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;proc&lt;/STRONG&gt; &lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;sql&lt;/STRONG&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; &lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;create&lt;/SPAN&gt; &lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;table&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; want &lt;/SPAN&gt;&lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;as&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; &lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt; &lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;&amp;nbsp;&amp;nbsp; &lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;select&lt;/SPAN&gt; &lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;distinct&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; * &lt;/SPAN&gt;&lt;SPAN style="background: white; color: blue; font-family: 'Courier New';"&gt;from&lt;/SPAN&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; have;&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;quit&lt;/STRONG&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; &lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;proc&lt;/STRONG&gt; &lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;print&lt;/STRONG&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt; ;&lt;/SPAN&gt;&lt;STRONG style="color: navy; background: white; font-family: 'Courier New';"&gt;run&lt;/STRONG&gt;&lt;SPAN style="background: white; color: black; font-family: 'Courier New';"&gt;;&lt;/SPAN&gt;&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 20 Apr 2012 17:28:35 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90992#M632</guid>
      <dc:creator>Linlin</dc:creator>
      <dc:date>2012-04-20T17:28:35Z</dc:date>
    </item>
    <item>
      <title>Re: elimination of duplicate rows</title>
      <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90993#M633</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Use nodupkey in proc sort:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;data have;&lt;/P&gt;&lt;P&gt;input (firstname middle lastname ID) (:$10.) age (school city) (:$10.);&lt;/P&gt;&lt;P&gt;cards;&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;proc sort data=have out=want nodupkey;&lt;/P&gt;&lt;P&gt;by firstname middle lastname ID age school city;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;proc print;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;07:05 Friday, April 20, 2012 67&lt;/P&gt;&lt;P&gt;&amp;nbsp; Obs firstname middle lastname ID age school city&lt;/P&gt;&lt;P&gt;&amp;nbsp; 1 Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 2 Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 3 Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Haikuo&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Update: please be aware that in this case, 'nodup' option will not work, as the duplicated records are not adjacent. &lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 20 Apr 2012 17:28:50 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90993#M633</guid>
      <dc:creator>Haikuo</dc:creator>
      <dc:date>2012-04-20T17:28:50Z</dc:date>
    </item>
    <item>
      <title>Re: elimination of duplicate rows</title>
      <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90994#M634</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Or just using data step:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;data have;&lt;/P&gt;&lt;P&gt;input (firstname middle lastname ID) (:$10.) age (school city) (:$10.);&lt;/P&gt;&lt;P&gt;cards;&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;data _null_;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;if 0 then set have;&lt;/P&gt;&lt;P&gt;&amp;nbsp; dcl hash h(dataset:'have');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definekey(all:'y');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definedata(all:'y');&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.definedone();&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp; h.output(dataset: 'want');&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;proc print;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;07:05 Friday, April 20, 2012 68&lt;/P&gt;&lt;P&gt;&amp;nbsp; Obs firstname middle lastname ID age school city&lt;/P&gt;&lt;P&gt;&amp;nbsp; 1 Debbie R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 2 Deb R Popular 12 13 xyz NY&lt;/P&gt;&lt;P&gt;&amp;nbsp; 3 Debbie R Popular 21 13 xyz NY&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Haikuo&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 20 Apr 2012 17:33:39 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90994#M634</guid>
      <dc:creator>Haikuo</dc:creator>
      <dc:date>2012-04-20T17:33:39Z</dc:date>
    </item>
    <item>
      <title>Re: elimination of duplicate rows</title>
      <link>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90995#M635</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;hi ...&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;re:&amp;nbsp; "&lt;SPAN style="font-family: 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif; background-color: #ffffff;"&gt;Update: please be aware that in this case, 'nodup' option will not work, as the duplicated records are not adjacent&lt;/SPAN&gt;"&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;if you sort by all the variables, NODUP and NODUPKEY give the same result&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;also, if you want to sort by all the variables, you can use _ALL_&amp;nbsp; ...&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;SPAN style="font-family: 'courier new', courier;"&gt;&lt;STRONG&gt;proc sort data=have out=want nodup;&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&lt;SPAN style="font-family: 'courier new', courier;"&gt;&lt;STRONG&gt;by _all_;&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/P&gt;&lt;P&gt;&lt;SPAN style="font-family: 'courier new', courier;"&gt;&lt;STRONG&gt;run;&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 20 Apr 2012 20:14:16 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Data-Science/elimination-of-duplicate-rows/m-p/90995#M635</guid>
      <dc:creator>MikeZdeb</dc:creator>
      <dc:date>2012-04-20T20:14:16Z</dc:date>
    </item>
  </channel>
</rss>

