<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: Pairwise cosine similarity of a large dataset in SAS Programming</title>
    <link>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609915#M177581</link>
    <description>&lt;P&gt;Calling&amp;nbsp;&lt;a href="https://communities.sas.com/t5/user/viewprofilepage/user-id/13684"&gt;@Rick_SAS&lt;/a&gt;&amp;nbsp;&lt;/P&gt;</description>
    <pubDate>Fri, 06 Dec 2019 11:43:32 GMT</pubDate>
    <dc:creator>Ksharp</dc:creator>
    <dc:date>2019-12-06T11:43:32Z</dc:date>
    <item>
      <title>Pairwise cosine similarity of a large dataset</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609851#M177562</link>
      <description>&lt;P&gt;Hi,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I have a table (matrix) like this:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;TABLE border="0" cellspacing="0" cellpadding="0"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;id&lt;/TD&gt;&lt;TD&gt;year&lt;/TD&gt;&lt;TD&gt;var1&lt;/TD&gt;&lt;TD&gt;var2&lt;/TD&gt;&lt;TD&gt;var3&lt;/TD&gt;&lt;TD&gt;….&lt;/TD&gt;&lt;TD&gt;var300&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;4&lt;/TD&gt;&lt;TD&gt;5&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;1998&lt;/TD&gt;&lt;TD&gt;5&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;2007&lt;/TD&gt;&lt;TD&gt;5&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;2007&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;4&lt;/TD&gt;&lt;TD&gt;5&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;4&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;2006&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;4&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;4&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;5000&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;TD&gt;……&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;5000&lt;/TD&gt;&lt;TD&gt;2006&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;That said, I have a lot of observations and variables.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Ideally, I want to calculate pairwise cosine similarity between two observations and output like this:&lt;/P&gt;&lt;TABLE border="0" cellspacing="0" cellpadding="0"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD&gt;d1&lt;/TD&gt;&lt;TD&gt;id2&lt;/TD&gt;&lt;TD&gt;year&lt;/TD&gt;&lt;TD&gt;distance&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;xx&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;3&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;xx&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;5000&lt;/TD&gt;&lt;TD&gt;2006&lt;/TD&gt;&lt;TD&gt;xx&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;1997&lt;/TD&gt;&lt;TD&gt;xx&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;5000&lt;/TD&gt;&lt;TD&gt;2006&lt;/TD&gt;&lt;TD&gt;xx&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;…&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I am exploring proc distance and proc iml but have not figured it out yet.&amp;nbsp; I will appreciate it very much if someone can help me out here.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Thanks!&lt;/P&gt;</description>
      <pubDate>Fri, 06 Dec 2019 16:53:44 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609851#M177562</guid>
      <dc:creator>daradanye</dc:creator>
      <dc:date>2019-12-06T16:53:44Z</dc:date>
    </item>
    <item>
      <title>Re: Pairwise cosine similarity of a large dataset</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609901#M177575</link>
      <description>Maybe you find some useful information in this blog: &lt;A href="https://blogs.sas.com/content/iml/2019/09/03/cosine-similarity.html" target="_blank"&gt;https://blogs.sas.com/content/iml/2019/09/03/cosine-similarity.html&lt;/A&gt;</description>
      <pubDate>Fri, 06 Dec 2019 09:49:55 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609901#M177575</guid>
      <dc:creator>JosvanderVelden</dc:creator>
      <dc:date>2019-12-06T09:49:55Z</dc:date>
    </item>
    <item>
      <title>Re: Pairwise cosine similarity of a large dataset</title>
      <link>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609915#M177581</link>
      <description>&lt;P&gt;Calling&amp;nbsp;&lt;a href="https://communities.sas.com/t5/user/viewprofilepage/user-id/13684"&gt;@Rick_SAS&lt;/a&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Fri, 06 Dec 2019 11:43:32 GMT</pubDate>
      <guid>https://communities.sas.com/t5/SAS-Programming/Pairwise-cosine-similarity-of-a-large-dataset/m-p/609915#M177581</guid>
      <dc:creator>Ksharp</dc:creator>
      <dc:date>2019-12-06T11:43:32Z</dc:date>
    </item>
  </channel>
</rss>

