<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: Webpage scraping using SAS in SAS Programming</title>
    <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/423319#M270743</link>
    <description>&lt;P&gt;I've published some general guidance &lt;A href="https://blogs.sas.com/content/sasdummy/2017/12/04/scrape-web-page-data/" target="_self"&gt;about scraping data from web pages with SAS in this blog post&lt;/A&gt;.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;While your program is good and works well with the one style of page that you designed it for, it's a big challenge to build something that works for every web site out there.&amp;nbsp; The diversity of web pages and how they are produced (HTML, Javascript, DIV tags vs TABLE tags, etc.) is immense.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Others have written papers on the topic:&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;A href="http://support.sas.com/resources/papers/proceedings12/121-2012.pdf" target="_self"&gt;Accessing and Extracting Data from the Internet Using SAS&lt;/A&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;A href="http://support.sas.com/resources/papers/proceedings10/053-2010.pdf" target="_self"&gt;Your Friendly Neighborhood Web crawler: A Guide to Crawling the Web with SAS&lt;/A&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;SAS Text Miner (as&amp;nbsp;&lt;a href="https://communities.sas.com/t5/user/viewprofilepage/user-id/12447"&gt;@Patrick&lt;/a&gt;&amp;nbsp;mentioned) has a &lt;A href="http://go.documentation.sas.com/?docsetId=tmref&amp;amp;docsetTarget=n1f1hnf1pk8w3in1i2h4v94rty2m.htm&amp;amp;docsetVersion=14.3&amp;amp;locale=en" target="_self"&gt;built-in capability for crawling web sites&lt;/A&gt;&amp;nbsp;with the %TMFILTER macro - and is designed to be more robust, with safeguards for performance and web-crawling etiquette.&lt;/P&gt;</description>
    <pubDate>Fri, 22 Dec 2017 14:21:43 GMT</pubDate>
    <dc:creator>ChrisHemedinger</dc:creator>
    <dc:date>2017-12-22T14:21:43Z</dc:date>
    <item>
      <title>Webpage scraping using SAS</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312396#M270739</link>
      <description>&lt;DIV&gt;&lt;FONT face="Calibri"&gt;I been working on the program. I do have issues using other websites though. I am currently lost to what to do so to use the other websites. Example of the other websites are&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;A href="http://www.legislature.ca.gov/cgi-bin/port-statquery" target="_blank"&gt;&lt;SPAN&gt;&lt;FONT face="Calibri"&gt;http://www.legislature.ca.gov/cgi-bin/port-statquery&lt;/FONT&gt;&lt;/SPAN&gt;&lt;/A&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;A href="http://law.lis.virginia.gov/uncodifiedacts" target="_blank"&gt;&lt;FONT face="Calibri"&gt;http://law.lis.virginia.gov/uncodifiedacts&lt;/FONT&gt;&lt;/A&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;A href="http://www.ncleg.net/gascripts/BillSearch/BillSearch.asp?typeToSearch=RATIFIED&amp;amp;chamberToSearch=&amp;amp;sessionToSearch=2015&amp;amp;searchCriteria=chapter&amp;amp;sortBy=relevance" target="_blank"&gt;&lt;FONT face="Calibri"&gt;http://www.ncleg.net/gascripts/BillSearch/BillSearch.asp?typeToSearch=RATIFIED&amp;amp;chamberToSearch=&amp;amp;sessionToSearch=2015&amp;amp;searchCriteria=chapter&amp;amp;sortBy=relevance&lt;/FONT&gt;&lt;/A&gt;&lt;FONT face="Calibri"&gt;.&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Calibri"&gt;Here is the code. &lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&amp;nbsp;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;filename&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; LAW &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;url&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;"&lt;A href="http://delcode.delaware.gov/sessionlaws/ga148/" target="_blank"&gt;http://delcode.delaware.gov/sessionlaws/ga148/&lt;/A&gt;"&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*website name go here;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;filename&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; chptrs &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;TEMP&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*You can remove temp. It make "chptrs" temporary until it is closed;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="navy" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;%macro&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; chapter(url=);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;filename LAW url &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;"&amp;amp;url"&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*pulling in the website from above into a macro;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;data &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;%scan&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;(&amp;amp;url, -&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;2&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;%str&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;(/&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;.&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;))(keep=xx found);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*scan search for the words you want. &lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;String is the delimiters for all the webpage. The "-2" is to show how many strings to go back.;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*Do not change these numbers;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;length found $&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;40&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;infile law length=len lrecl=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;32767&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;input x &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;$varying32767.&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; len;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;retain flag;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if (_n_=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;) then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;RETAIN patternID;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*You can add or subtract the names you want it to search for in each page below;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;patternID=prxparse(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'/(DISTRICT|SCHOOL|PUBLIC|BOARD|DRAINAGE)/i'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;put patternID=;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if x=: &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'&amp;lt;body&amp;gt;'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;flag=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*if any of the words are found, the webpage is flag;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if flag then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;xx=prxchange(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'s/\&amp;lt;[^\&amp;lt;\&amp;gt;]+\&amp;gt;//'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, -&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, x); &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;* this remove the different signs in the body of the text;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if not prxmatch(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'/^\s+$/'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, xx) then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;start=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;stop=length(xx);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*put xx=;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;/* Search for one of the target words */&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;CALL PRXNEXT(patternID , start, stop, xx, position, length);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do while (position &amp;gt; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;0&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;found=substr(xx, position, length);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*It pulls part of the statement out for the&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;words that was found;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;PUT found=start=stop=position=length=;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;output;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;CALL PRXNEXT(patternID , start, stop, xx, position, length);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;run;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="navy" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;%mend&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;/* Extract all Chapter links */&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="navy" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;data&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; have(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;keep&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=xx) _urls(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;keep&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=uri);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;length&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; uri $&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;300&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; ;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;infile&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; law &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;length&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=len &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;lrecl&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;32767&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;input&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; x &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;$varying32767.&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; len;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;retain&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; flag ;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;FILE&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; chptrs &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;lrecl&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;400&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;/* Holds derived FILENAME Statements */&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; x=: &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'&amp;lt;body&amp;gt;'&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;flag=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; flag &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;xx=prxchange(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'s/\&amp;lt;[^\&amp;lt;\&amp;gt;]+\&amp;gt;//'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, -&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;1&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, x);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; not prxmatch(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'/^\s+$/'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, xx) &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;output&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; have;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; prxmatch(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'/CHAPTER\s+\d+/i'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, x) &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;temp=scan(x, &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;2&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'"'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*the 2 tells how man delimiter they go up to working left to rightt.&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;If it is negative its from right to left (blank ! $ % &amp;amp; ( ) * + , – . /&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;lt;|);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;if&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; not missing(temp) &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;then&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;do&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;uri=cats(&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'&lt;A href="http://delcode.delaware.gov/sessionlaws/ga148/" target="_blank"&gt;http://delcode.delaware.gov/sessionlaws/ga148/&lt;/A&gt;'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;, temp);&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;*cats remove spacing before and after;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="green" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;/* Write out the Filename Statement */&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;PUT&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'%chapter(url=%str('&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; uri &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="purple" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;'));'&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;output&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; _urls;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;end&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="navy" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;run&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;options&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;source&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;source2&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;mprint&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;%include&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt; chptrs / &lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;lrecl&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;=&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT color="teal" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&lt;STRONG&gt;400&lt;/STRONG&gt;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;filename&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;_all_&lt;/SPAN&gt;&lt;/FONT&gt; &lt;FONT color="blue" face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;clear&lt;/SPAN&gt;&lt;/FONT&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;DIV&gt;&lt;FONT face="Courier New" size="2"&gt;&lt;SPAN style="font-size: 10pt; background-color: white;"&gt;&amp;nbsp;&lt;/SPAN&gt;&lt;/FONT&gt;&lt;/DIV&gt;&lt;P&gt;Thanks for your help,&lt;/P&gt;</description>
      <pubDate>Thu, 17 Nov 2016 17:35:59 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312396#M270739</guid>
      <dc:creator>kevin12</dc:creator>
      <dc:date>2016-11-17T17:35:59Z</dc:date>
    </item>
    <item>
      <title>Re: Webpage scraping using SAS</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312710#M270740</link>
      <description>&lt;P&gt;You may need to be a bit more detailed with your question.&lt;/P&gt;
&lt;P&gt;Does the program example runs for the given site and get the expected, or at least useable, data?&lt;/P&gt;
&lt;P&gt;Are you asking on how to modify this program to access other sites? with different keywords?&lt;/P&gt;
&lt;P&gt;Please not that attempting to read PDF files is likely to be a less-than-joyous experience. So are you attempting to down load PDFs? Or Html?&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Your first other URL shows a page that implies it is expecting some kind of query, so you likley need to change the URL but I a have no clue to what.&lt;/P&gt;</description>
      <pubDate>Fri, 18 Nov 2016 18:51:29 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312710#M270740</guid>
      <dc:creator>ballardw</dc:creator>
      <dc:date>2016-11-18T18:51:29Z</dc:date>
    </item>
    <item>
      <title>Re: Webpage scraping using SAS</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312714#M270741</link>
      <description>&lt;P&gt;The program works for the given websitethat is currently in the program. After running the program, it can be seen that each chapter comes up with the word that one is looking for. I would want to access other websites with the same key words. The key words can be changed but the problem is whenever the websites are change it does not work as well. It is mainly html. I already have a program that scan PDFs.&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Fri, 18 Nov 2016 19:15:43 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312714#M270741</guid>
      <dc:creator>kevin12</dc:creator>
      <dc:date>2016-11-18T19:15:43Z</dc:date>
    </item>
    <item>
      <title>Re: Webpage scraping using SAS</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312771#M270742</link>
      <description>&lt;P&gt;Ideally you'd have the SAS Text Analytics bundle licensed as this would give you everything you need (and more).&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;I'm sure there are ways to do everything in Foundation SAS (eventually with the help of calling some 3rd party tools out of SAS like Tika) but I'd assume it's going to cost you a lot of effort to get it right and every change to your sources will cause you a lot of additional work.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;If you don't have access to SAS Text Analytics or at least some of it's sub-components like Web Crawler then consider to look into using Python for at least the data retrieval and data prep part of your task.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Python is an open source programming environment which integrates quite well with SAS (and it will integrate even better in future releases).&lt;/P&gt;</description>
      <pubDate>Sat, 19 Nov 2016 03:24:07 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/312771#M270742</guid>
      <dc:creator>Patrick</dc:creator>
      <dc:date>2016-11-19T03:24:07Z</dc:date>
    </item>
    <item>
      <title>Re: Webpage scraping using SAS</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/423319#M270743</link>
      <description>&lt;P&gt;I've published some general guidance &lt;A href="https://blogs.sas.com/content/sasdummy/2017/12/04/scrape-web-page-data/" target="_self"&gt;about scraping data from web pages with SAS in this blog post&lt;/A&gt;.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;While your program is good and works well with the one style of page that you designed it for, it's a big challenge to build something that works for every web site out there.&amp;nbsp; The diversity of web pages and how they are produced (HTML, Javascript, DIV tags vs TABLE tags, etc.) is immense.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Others have written papers on the topic:&lt;/P&gt;
&lt;UL&gt;
&lt;LI&gt;&lt;A href="http://support.sas.com/resources/papers/proceedings12/121-2012.pdf" target="_self"&gt;Accessing and Extracting Data from the Internet Using SAS&lt;/A&gt;&lt;/LI&gt;
&lt;LI&gt;&lt;A href="http://support.sas.com/resources/papers/proceedings10/053-2010.pdf" target="_self"&gt;Your Friendly Neighborhood Web crawler: A Guide to Crawling the Web with SAS&lt;/A&gt;&lt;/LI&gt;
&lt;/UL&gt;
&lt;P&gt;SAS Text Miner (as&amp;nbsp;&lt;a href="https://communities.sas.com/t5/user/viewprofilepage/user-id/12447"&gt;@Patrick&lt;/a&gt;&amp;nbsp;mentioned) has a &lt;A href="http://go.documentation.sas.com/?docsetId=tmref&amp;amp;docsetTarget=n1f1hnf1pk8w3in1i2h4v94rty2m.htm&amp;amp;docsetVersion=14.3&amp;amp;locale=en" target="_self"&gt;built-in capability for crawling web sites&lt;/A&gt;&amp;nbsp;with the %TMFILTER macro - and is designed to be more robust, with safeguards for performance and web-crawling etiquette.&lt;/P&gt;</description>
      <pubDate>Fri, 22 Dec 2017 14:21:43 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Webpage-scraping-using-SAS/m-p/423319#M270743</guid>
      <dc:creator>ChrisHemedinger</dc:creator>
      <dc:date>2017-12-22T14:21:43Z</dc:date>
    </item>
  </channel>
</rss>

