Join Now

SAS Forum 2015: Optimering af fuzzy SQL-joins med hashtabeller

by SAS Employee GeorgMorsing on ‎10-08-2015 05:20 AM (262 Views)

 

Præsentation nummer 56 af Simon Daniel Eiriksson, Statens Serum Institut
8. oktober 2015

 

Beskrivelse:

I dette oplæg vil jeg præsentere matematikken og koden, der ved hjælp af datasteps med hashtabeller optimerer fuzzy SQL-joins intet mindre end 100 gange. Statens Serum Institut udtrækker ind imellem kontrolpopulationer til epidemiologiske undersøgelser. Her skal et antal kontrolpersoner matches på en case population med nogle givne kriterier, såsom køn, alder eller bopæl. Dette kræver, at kontroller matches på cases med et vist maksimumsinterval mellem deres fødselsdage. Denne type SQL-joins har SAS ikke mulighed for at optimere, hvilket medfører at SAS gennemløber ”det kartesiske produkt” af de to datasæt.Oplægget henvender sig til de mere teknisk og matematisk interesserede.