Join Now

Opbygning af database til tidsrækkeanalyse i SAS

by Contributor MikA on ‎03-25-2015 05:24 AM (144 Views)

Hej!

Jeg ligger inde med kvartalsvise data, som jeg ønsker at analysere over tid.

Men jeg behøver gode råd til, hvordan en database opbygges således, at jeg opnår

1) den største fleksibilitet i forhold til mulige sammenligninger og beregninger på variable over tid (kvartal mod kvartal, årlige ændringer, gennemsnitlige årlige og kvartalsvise vækstrater m.v.)

2) en struktur der er let at beregne på

3) og hvor der kan laves såvel aggregerede beregninger på kategoriserende variable og beregninger for de enkelte unikke identer


Jeg ser to muligheder - enten et stablet datasæt, hvor hver unikke ident indgår med en observation for hvert kvartal, eller et datasæt hvor variablene indgår en gang for hvert kvartal.


Data vil bestå af 25-50.000 identer og har 5 kategoriske variable og 20 "beregningsvariable", og skal køre løbende kvartalsvis fra 2013 og langt ind i fremtiden.


Et simplificeret eksempel på rådata:


Unik_IDKvartalGeo_kodeABCKategori
12015k111001,510,2JA
22015k112501,815JA
32015k1236000,7512JA
42015k123588213NEJ
52015k12500001,414JA
62015k14100,59NEJ
72015k135000,58NEJ
82015k1812000003,912NEJ
92015k194500416JA
102015k188000210JA


Unik_IDKvartalGeo_kodeABCKategori
12015k211051,57510,71NEJ
22015k21262,51,8915,75JA
42015k223767,42,113,65NEJ
52015k22525001,4714,7JA
62015k2410,50,5259,45NEJ
72015k235250,5258,4NEJ
82015k2812600004,09512,6NEJ
102015k2884002,110,5JA
112015k237000210JA
122015k2530065JA


Hvad er mon bedst - og er der gode råd til, hvordan der så beregnes på det efterfølgende?

Mvh Mikkel