<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: Which word appears at most in SAS Programming</title>
    <link>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186320#M35299</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;You can do this in only one step using functions COUNTW and SCAN specifing the blank as separator of words.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt; data want ;&lt;/P&gt;&lt;P&gt; length word $ 20;&lt;/P&gt;&lt;P&gt; set m01;&lt;/P&gt;&lt;P&gt; do i = 1 to countw(a,' ');&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp; word=(scan(a,i,' '));&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp; output;&lt;/P&gt;&lt;P&gt; end;&lt;/P&gt;&lt;P&gt; run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Regards,&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Tue, 25 Feb 2014 18:26:08 GMT</pubDate>
    <dc:creator>CTorres</dc:creator>
    <dc:date>2014-02-25T18:26:08Z</dc:date>
    <item>
      <title>Which word appears at most</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186318#M35297</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Hi All,&lt;BR /&gt;Here is the original dataset:&lt;/P&gt;&lt;P&gt;data m01;&lt;/P&gt;&lt;P&gt;a="CGA&amp;nbsp; AMZN.COM&amp;nbsp;&amp;nbsp; CA";output;&lt;/P&gt;&lt;P&gt;a="CHA&amp;nbsp; AMZN.COM&amp;nbsp;&amp;nbsp; HK";output;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Output dataset like:&lt;BR /&gt;Word&lt;/P&gt;&lt;TABLE border="0" cellpadding="0" cellspacing="0" width="76"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD class="xl22" height="19" width="76"&gt;CGA&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD class="xl22" height="19" style="border-top: medium none;" width="76"&gt;AMZN.COM&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD class="xl22" height="19" style="border-top: medium none;" width="76"&gt;CA&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD class="xl22" height="19" style="border-top: medium none;" width="76"&gt;CHA&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD class="xl22" height="19" style="border-top: medium none;" width="76"&gt;AMZN.COM&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD class="xl23" height="20" style="border-top: medium none;" width="76"&gt;HK&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;BR /&gt;Any idea?&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Here is mine:&lt;/P&gt;&lt;P&gt;data m02;&lt;/P&gt;&lt;P&gt; set m01;&lt;/P&gt;&lt;P&gt; an=translate(a,"@"," ");&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;data m02_1;&lt;/P&gt;&lt;P&gt; set m02;&lt;/P&gt;&lt;P&gt; an=tranwrd(an,"@@","@");&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;%macro REEE;&lt;/P&gt;&lt;P&gt;%do i=1 %to 10;&lt;/P&gt;&lt;P&gt;data m02_1;&lt;/P&gt;&lt;P&gt; set m02_1;&lt;/P&gt;&lt;P&gt; an=tranwrd(an,"@@","@");&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;%end;&lt;/P&gt;&lt;P&gt;%mend;&lt;/P&gt;&lt;P&gt;%REEE;&lt;/P&gt;&lt;P&gt;data m03;&lt;/P&gt;&lt;P&gt; set m02_1;&lt;/P&gt;&lt;P&gt; bn=an;&lt;/P&gt;&lt;P&gt; No=_N_;&lt;/P&gt;&lt;P&gt; j=0;&lt;/P&gt;&lt;P&gt; do until(j=0);&lt;/P&gt;&lt;P&gt; j=find(bn,"@");&lt;/P&gt;&lt;P&gt; i=1;&lt;/P&gt;&lt;P&gt; Word=substr(bn,i,j-i);&lt;/P&gt;&lt;P&gt; i+j;&lt;/P&gt;&lt;P&gt; bn=substr(bn,i,j-i);&lt;/P&gt;&lt;P&gt; output;&lt;/P&gt;&lt;P&gt; end;&lt;/P&gt;&lt;P&gt;run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;In fact the original dataset contains thousands of &lt;SPAN class="short_text" id="result_box" lang="en"&gt;&lt;SPAN class="hps"&gt;merchants&lt;/SPAN&gt; &lt;SPAN class="hps"&gt;description,I want to break it down into words.&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;BR /&gt;What's your suggestion,please?&lt;/P&gt;&lt;P&gt;Thanks in advance.&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 25 Feb 2014 15:42:54 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186318#M35297</guid>
      <dc:creator>summy</dc:creator>
      <dc:date>2014-02-25T15:42:54Z</dc:date>
    </item>
    <item>
      <title>Re: Which word appears at most</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186319#M35298</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;more _infile_ magic at &lt;A href="http://www2.sas.com/proceedings/sugi28/086-28.pdf"&gt;http://www2.sas.com/proceedings/sugi28/086-28.pdf&lt;/A&gt; &lt;/P&gt;&lt;P&gt;shows a way to use the parsing of the input statement on data that comes from a table or data set variable.&lt;/P&gt;&lt;P&gt;Then you can populate a hash table of word counters, in a single pass.&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 25 Feb 2014 18:04:33 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186319#M35298</guid>
      <dc:creator>Peter_C</dc:creator>
      <dc:date>2014-02-25T18:04:33Z</dc:date>
    </item>
    <item>
      <title>Re: Which word appears at most</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186320#M35299</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;You can do this in only one step using functions COUNTW and SCAN specifing the blank as separator of words.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt; data want ;&lt;/P&gt;&lt;P&gt; length word $ 20;&lt;/P&gt;&lt;P&gt; set m01;&lt;/P&gt;&lt;P&gt; do i = 1 to countw(a,' ');&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp; word=(scan(a,i,' '));&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp; output;&lt;/P&gt;&lt;P&gt; end;&lt;/P&gt;&lt;P&gt; run;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;Regards,&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 25 Feb 2014 18:26:08 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Which-word-appears-at-most/m-p/186320#M35299</guid>
      <dc:creator>CTorres</dc:creator>
      <dc:date>2014-02-25T18:26:08Z</dc:date>
    </item>
  </channel>
</rss>

