Hallo Reinhard, vielen Dank für Deinen Kommentar.
Jetzt schreibe ich doch etwas mehr über den Hintergrund.
Ich habe 1700 Probanden, von denen jeweils ein 20-min-EKG genommen wurde. In der Summe sind es ca. 2,3 Millionen Herzschläge. Ein Algorithmus hat jeden Schlag identifiziert als normal, supraventrikulär, ventrikulär oder Artefakt.
Ein Arzt hat danach jeden Schlagtyp überprüft und bestätigt oder geändert (das ist mein Gold Standard, so dass ich für jeden Schlag und Typ ein Pärchen 0,0 oder 0,1 oder 1,0 oder 1,1 habe).
Die Anzahl der Schläge pro Proband schwankt zwischen 1000 und 2000.
Das ist alles lange vor meiner Zeit passiert ;-).
Ich will die Performance des Algorithmus beurteilen.
Bisher habe ich mit PROC FREQ die globale Sensitivität / Spezifität je Schlagtyp und über die Einzelwerte jedes EKG die gemittelte (jedes EKG gleich gewichtet).
Meine Idee war nun, mittels GEE die Korrelation der Schläge innerhalb der einzelnen EKGs (=pat_id) zu modellieren (mit AR).
Poisson habe ich gewählt, weil es sehr seltene Ereignisse sind (ca. 12 Tsd. bei 2,3 Mio.).
Verwunderlich ist nun, egal was ich als DIST oder LINK wähle, es bestimmt immer TYPE, was als Ergebnis erscheint, auf die Kommastelle genau.
Und die Unterschiede sind beträchtlich, obwohl meiner Meinung nach selbst eine falsche Wahl der Kovarianzstruktur TYPE das Ergebnis nicht so dramatisch verändern dürfte.
Auch die Betrachtung von QIC/QICu bringt kein Licht ins Dunkel.
In Ermangelung anderer (geclusterter) Datensätze wollte ich mit simulierten Daten experimentieren, um vielleicht ein Gefühl dafür zu bekommen, was hier eigentlich passiert.
Hoffentlich wird mein Ansinnen so klarer 🙂
Viele Grüße
Frank
... View more