<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic How do I get Cleaned Output? in SAS Programming</title>
    <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489719#M127939</link>
    <description>&lt;P&gt;Hello All,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;Problem:&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I have a Data Cleaning problem. I have this data where There is a Product manufacturer and Product Brand.&lt;/P&gt;&lt;P&gt;Each manufacturer has several Brands. The brands data is manually entered and is messy. I need to check the data which is manually entered and create standard brand name.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Here is the example,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Product Manufacturer&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Product Brand&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;TAQUILA&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;tAqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Samila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Here is the desired output,&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Product Manufacturer&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Product Brand&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Standard Brand&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;TAQUILA&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;tAqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;daqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;SAMmila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Samila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;The next step would be get the count of unique combinations. Which I can achieve once I got the above output.&lt;/P&gt;&lt;P&gt;The problem here is, I need to do this for only 2 Manufacturers but all brands there are (~3,000) of them.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;Approach:&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I did run a select distinct brand name and got around 200,000 names which are different combinations of same name. For example, the result retuned as&lt;/P&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;P&gt;abila&lt;/P&gt;&lt;P&gt;abla&lt;/P&gt;&lt;P&gt;cabla&lt;/P&gt;&lt;P&gt;Cabl&lt;/P&gt;&lt;P&gt;Cabla&lt;/P&gt;&lt;P&gt;..&lt;/P&gt;&lt;P&gt;So, Since I cannot extract all possible combinations, I extracted count as well, which gave me most frequent used notation, I ran a program to delete all less frequent notations of brand name.&lt;/P&gt;&lt;P&gt;Now I have list of Product Brands ~90,000&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;But, I cannot code multiple WHEN … THEN Statements like below (I should code (90,000) of them, which is impossible)&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;CASE

&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; WHEN MISC.PRD_BRAND_NM Like 'ABila%' OR MISC.PRD_BRAND_NM Like&amp;nbsp; 'abila%' OR MISC.PRD_BRAND_NM Like&amp;nbsp; 'ab%' THEN 'Abila' AS Standard_name&lt;/CODE&gt;&lt;/PRE&gt;&lt;P&gt;I’m looking is there a way that I create a macro and pass all variables through a function to create standard name?&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Some thing like below,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;CASE

&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; WHEN MISC.PRD_BRAND_NM Like &amp;amp;pass. OR MISC.PRD_BRAND_NM Like&amp;nbsp; &amp;amp;pass. OR MISC.PRD_BRAND_NM Like&amp;nbsp; &amp;amp;pass. THEN &amp;amp;pass. AS Standard_name&lt;/CODE&gt;&lt;/PRE&gt;&lt;P&gt;Do &amp;lt;this function&amp;gt; until &amp;lt;end of all brands&amp;gt;&lt;/P&gt;&lt;P&gt;&amp;lt;this function&amp;gt;&lt;/P&gt;&lt;P&gt;To replace macro variables with all combinations.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Or any other way I can achieve the objective?&lt;/P&gt;&lt;P&gt;Thanks a ton!&lt;/P&gt;</description>
    <pubDate>Fri, 24 Aug 2018 17:53:50 GMT</pubDate>
    <dc:creator>arunvaibhav2</dc:creator>
    <dc:date>2018-08-24T17:53:50Z</dc:date>
    <item>
      <title>How do I get Cleaned Output?</title>
      <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489719#M127939</link>
      <description>&lt;P&gt;Hello All,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;Problem:&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I have a Data Cleaning problem. I have this data where There is a Product manufacturer and Product Brand.&lt;/P&gt;&lt;P&gt;Each manufacturer has several Brands. The brands data is manually entered and is messy. I need to check the data which is manually entered and create standard brand name.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Here is the example,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Product Manufacturer&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Product Brand&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;TAQUILA&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;tAqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Samila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Here is the desired output,&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Product Manufacturer&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Product Brand&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Standard Brand&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;TAQUILA&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;tAqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Taquila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;daqueela&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Daqueela&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;Tambola&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;SAMmila&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;Samila&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;The next step would be get the count of unique combinations. Which I can achieve once I got the above output.&lt;/P&gt;&lt;P&gt;The problem here is, I need to do this for only 2 Manufacturers but all brands there are (~3,000) of them.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;Approach:&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I did run a select distinct brand name and got around 200,000 names which are different combinations of same name. For example, the result retuned as&lt;/P&gt;&lt;P&gt;Abila&lt;/P&gt;&lt;P&gt;abila&lt;/P&gt;&lt;P&gt;abla&lt;/P&gt;&lt;P&gt;cabla&lt;/P&gt;&lt;P&gt;Cabl&lt;/P&gt;&lt;P&gt;Cabla&lt;/P&gt;&lt;P&gt;..&lt;/P&gt;&lt;P&gt;So, Since I cannot extract all possible combinations, I extracted count as well, which gave me most frequent used notation, I ran a program to delete all less frequent notations of brand name.&lt;/P&gt;&lt;P&gt;Now I have list of Product Brands ~90,000&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;But, I cannot code multiple WHEN … THEN Statements like below (I should code (90,000) of them, which is impossible)&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;CASE

&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; WHEN MISC.PRD_BRAND_NM Like 'ABila%' OR MISC.PRD_BRAND_NM Like&amp;nbsp; 'abila%' OR MISC.PRD_BRAND_NM Like&amp;nbsp; 'ab%' THEN 'Abila' AS Standard_name&lt;/CODE&gt;&lt;/PRE&gt;&lt;P&gt;I’m looking is there a way that I create a macro and pass all variables through a function to create standard name?&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Some thing like below,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;PRE&gt;&lt;CODE class=" language-sas"&gt;CASE

&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; WHEN MISC.PRD_BRAND_NM Like &amp;amp;pass. OR MISC.PRD_BRAND_NM Like&amp;nbsp; &amp;amp;pass. OR MISC.PRD_BRAND_NM Like&amp;nbsp; &amp;amp;pass. THEN &amp;amp;pass. AS Standard_name&lt;/CODE&gt;&lt;/PRE&gt;&lt;P&gt;Do &amp;lt;this function&amp;gt; until &amp;lt;end of all brands&amp;gt;&lt;/P&gt;&lt;P&gt;&amp;lt;this function&amp;gt;&lt;/P&gt;&lt;P&gt;To replace macro variables with all combinations.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Or any other way I can achieve the objective?&lt;/P&gt;&lt;P&gt;Thanks a ton!&lt;/P&gt;</description>
      <pubDate>Fri, 24 Aug 2018 17:53:50 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489719#M127939</guid>
      <dc:creator>arunvaibhav2</dc:creator>
      <dc:date>2018-08-24T17:53:50Z</dc:date>
    </item>
    <item>
      <title>Re: How do I get Cleaned Output?</title>
      <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489721#M127941</link>
      <description>&lt;P&gt;Do you have a master list of what should be the names?&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Fri, 24 Aug 2018 17:57:56 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489721#M127941</guid>
      <dc:creator>Reeza</dc:creator>
      <dc:date>2018-08-24T17:57:56Z</dc:date>
    </item>
    <item>
      <title>Re: How do I get Cleaned Output?</title>
      <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489795#M127964</link>
      <description>&lt;P&gt;You have two choices. You can either labouriously code a custom, do-it-yourself solution to your problem or you could consider a tool that has this functionality built-in such as SAS Data Quality / Dataflux. The latter solution is definitely a better one if you are doing a lot of data cleansing. Does your organisation have any such tools?&lt;/P&gt;</description>
      <pubDate>Sat, 25 Aug 2018 01:58:50 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/How-do-I-get-Cleaned-Output/m-p/489795#M127964</guid>
      <dc:creator>SASKiwi</dc:creator>
      <dc:date>2018-08-25T01:58:50Z</dc:date>
    </item>
  </channel>
</rss>

