<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic How do I catagorize my data using if/then statements? in SAS Programming</title>
    <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-catagorize-my-data-using-if-then-statements/m-p/444967#M111454</link>
    <description>&lt;P&gt;I'm stuck on how to use sas to categorize my data while using the original excel file. I need to categorize as DMV or Non DMV... Does anyone know how to do it? I think an if/then statement is required.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Prompt:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Most Marine Corps Marathon runners are from the greater DC-Maryland-Virginia (DMV) metro area. Nevertheless, the race attracts enthusiasts nationally and internationally. Since out-of-the-area runners incur additional travel, hotel, food, etc expenses, it seems plausible they might, as a group, be more dedicated runners than local participants.&lt;/P&gt;&lt;P&gt;For simplicity, define anyone from DC, Maryland or Virginia as originating from the DMV. Moreover, consider anyone with a finish time under 6 hours as a “runner” and with 6 hours or more as a “walker”. Exclude walkers from the analysis.&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;OL&gt;&lt;LI&gt;(5 Pts) Using Sample01, test the assertion that runners from outside the DMV have a faster mean (or median) finish time than runners from the DMV. Use . What do you conclude about the assertion?&lt;/LI&gt;&lt;LI&gt;(5 Pts) Provide a 95% confidence interval for the difference (in minutes) between the mean (or median) finish time of outside the DMV and DMV runners.&lt;/LI&gt;&lt;/OL&gt;&lt;P&gt;Sample 1:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;170&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;72&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;10665&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;10933&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6963&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7022&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5037&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;4265&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;15606&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;14513&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;623&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;709&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11168&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11293&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7723&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7274&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6215&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5053&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16667&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16113&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1044&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;1950&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11169&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11497&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;8821&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7677&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6363&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5066&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16812&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;17698&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1180&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;2288&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11691&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;12228&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9242&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;8728&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6522&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5233&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;17038&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18104&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1921&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;3391&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;15528&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;14118&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9503&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9751&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6678&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6530&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18697&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18639&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;So far I've had sas produce a table with just the sample 1 runners in it.&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Code:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;%LET WorkingDirectory = C:\;&lt;/P&gt;&lt;P&gt;PROC IMPORT DATAFILE="&amp;amp;WorkingDirectory.mcm_2017.csv"&lt;BR /&gt;OUT=Runners DBMS=csv REPLACE;&lt;BR /&gt;RUN;&lt;/P&gt;&lt;P&gt;*Question 1;&lt;BR /&gt;Data Sample01;&lt;BR /&gt;INPUT Overall_Place @@;&lt;BR /&gt;DATALINES;&lt;BR /&gt;170 72 10665 10933 6963&lt;BR /&gt;7022 5037 4265 15606 623&lt;BR /&gt;709 11168 11293 7723 7274&lt;BR /&gt;6215 5053 * 1044 1950&lt;BR /&gt;11169 11497 8821 7677 6363&lt;BR /&gt;5066 * 1180 2288 11691&lt;BR /&gt;12228 9242 8728 6522 5233&lt;BR /&gt;* 1921 3391 * 14118&lt;BR /&gt;9503 9751 6678 6530 *&lt;BR /&gt;;&lt;BR /&gt;RUN;&lt;/P&gt;&lt;P&gt;*Sample 01 Runners;&lt;BR /&gt;PROC SQL;&lt;BR /&gt;CREATE TABLE Sample01_Runners as&lt;BR /&gt;SELECT Name, Gender, Age, Time, b.Overall_Place, City, State, Country&lt;BR /&gt;FROM WORK.RUNNERS a, WORK.SAMPLE01 b&lt;BR /&gt;WHERE a.Overall_Place=b.Overall_Place;&lt;BR /&gt;Run;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;If you have questions don't hesitate to ask.&lt;/P&gt;</description>
    <pubDate>Mon, 12 Mar 2018 22:44:21 GMT</pubDate>
    <dc:creator>kilimanjaro_256</dc:creator>
    <dc:date>2018-03-12T22:44:21Z</dc:date>
    <item>
      <title>How do I catagorize my data using if/then statements?</title>
      <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-catagorize-my-data-using-if-then-statements/m-p/444967#M111454</link>
      <description>&lt;P&gt;I'm stuck on how to use sas to categorize my data while using the original excel file. I need to categorize as DMV or Non DMV... Does anyone know how to do it? I think an if/then statement is required.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Prompt:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Most Marine Corps Marathon runners are from the greater DC-Maryland-Virginia (DMV) metro area. Nevertheless, the race attracts enthusiasts nationally and internationally. Since out-of-the-area runners incur additional travel, hotel, food, etc expenses, it seems plausible they might, as a group, be more dedicated runners than local participants.&lt;/P&gt;&lt;P&gt;For simplicity, define anyone from DC, Maryland or Virginia as originating from the DMV. Moreover, consider anyone with a finish time under 6 hours as a “runner” and with 6 hours or more as a “walker”. Exclude walkers from the analysis.&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;OL&gt;&lt;LI&gt;(5 Pts) Using Sample01, test the assertion that runners from outside the DMV have a faster mean (or median) finish time than runners from the DMV. Use . What do you conclude about the assertion?&lt;/LI&gt;&lt;LI&gt;(5 Pts) Provide a 95% confidence interval for the difference (in minutes) between the mean (or median) finish time of outside the DMV and DMV runners.&lt;/LI&gt;&lt;/OL&gt;&lt;P&gt;Sample 1:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;TABLE&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;170&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;72&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;10665&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;10933&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6963&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7022&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5037&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;4265&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;15606&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;14513&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;623&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;709&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11168&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11293&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7723&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7274&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6215&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5053&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16667&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16113&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1044&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;1950&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11169&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11497&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;8821&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;7677&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6363&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5066&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;16812&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;17698&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1180&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;2288&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;11691&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;12228&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9242&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;8728&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6522&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;5233&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;17038&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18104&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&lt;P&gt;1921&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;3391&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;15528&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;14118&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9503&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;9751&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6678&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;6530&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18697&lt;/P&gt;&lt;/TD&gt;&lt;TD&gt;&lt;P&gt;18639&lt;/P&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;So far I've had sas produce a table with just the sample 1 runners in it.&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Code:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;%LET WorkingDirectory = C:\;&lt;/P&gt;&lt;P&gt;PROC IMPORT DATAFILE="&amp;amp;WorkingDirectory.mcm_2017.csv"&lt;BR /&gt;OUT=Runners DBMS=csv REPLACE;&lt;BR /&gt;RUN;&lt;/P&gt;&lt;P&gt;*Question 1;&lt;BR /&gt;Data Sample01;&lt;BR /&gt;INPUT Overall_Place @@;&lt;BR /&gt;DATALINES;&lt;BR /&gt;170 72 10665 10933 6963&lt;BR /&gt;7022 5037 4265 15606 623&lt;BR /&gt;709 11168 11293 7723 7274&lt;BR /&gt;6215 5053 * 1044 1950&lt;BR /&gt;11169 11497 8821 7677 6363&lt;BR /&gt;5066 * 1180 2288 11691&lt;BR /&gt;12228 9242 8728 6522 5233&lt;BR /&gt;* 1921 3391 * 14118&lt;BR /&gt;9503 9751 6678 6530 *&lt;BR /&gt;;&lt;BR /&gt;RUN;&lt;/P&gt;&lt;P&gt;*Sample 01 Runners;&lt;BR /&gt;PROC SQL;&lt;BR /&gt;CREATE TABLE Sample01_Runners as&lt;BR /&gt;SELECT Name, Gender, Age, Time, b.Overall_Place, City, State, Country&lt;BR /&gt;FROM WORK.RUNNERS a, WORK.SAMPLE01 b&lt;BR /&gt;WHERE a.Overall_Place=b.Overall_Place;&lt;BR /&gt;Run;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;If you have questions don't hesitate to ask.&lt;/P&gt;</description>
      <pubDate>Mon, 12 Mar 2018 22:44:21 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/How-do-I-catagorize-my-data-using-if-then-statements/m-p/444967#M111454</guid>
      <dc:creator>kilimanjaro_256</dc:creator>
      <dc:date>2018-03-12T22:44:21Z</dc:date>
    </item>
    <item>
      <title>Re: How do I catagorize my data using if/then statements?</title>
      <link>https://communities.sas.com/t5/SAS-Programming/How-do-I-catagorize-my-data-using-if-then-statements/m-p/444974#M111456</link>
      <description>&lt;P&gt;Using the data in Sample1 how do you identify the participants in DMV? I do not see any information that indicates where anyone is from.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;You likely do not need to add any variables at all. You can create analysis groups in data based on a single variable using a custom format.&lt;/P&gt;
&lt;P&gt;Something like:&lt;/P&gt;
&lt;P&gt;proc format library=work;&lt;/P&gt;
&lt;P&gt;value $dmv&lt;/P&gt;
&lt;P&gt;'MD', 'VA', 'DC' = 'DMV'&lt;/P&gt;
&lt;P&gt;other= 'non DMV'&lt;/P&gt;
&lt;P&gt;;&lt;/P&gt;
&lt;P&gt;run;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Then use the format for your state variable in procs such as freq, means, ttest etc.&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;Proc freq data=Sample01_Runners&amp;nbsp;;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp; tables state;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp; format state $dmv.;&lt;/P&gt;
&lt;P&gt;run;&lt;/P&gt;
&lt;P&gt;&amp;nbsp;&lt;/P&gt;
&lt;P&gt;If /then /else (or Select when or Case when) will be needed if two or more variables are involved.&lt;/P&gt;</description>
      <pubDate>Mon, 12 Mar 2018 23:07:12 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/How-do-I-catagorize-my-data-using-if-then-statements/m-p/444974#M111456</guid>
      <dc:creator>ballardw</dc:creator>
      <dc:date>2018-03-12T23:07:12Z</dc:date>
    </item>
  </channel>
</rss>

