LesezeichenAbonnierenRSS-Feed abonnieren
miray36
Calcite | Level 5

Hallo ihr Lieben,

eig halte ich mich nie in Foren auf, aber mein Studium hat erreicht, was keine Schule zuvor leisten konnte: pure Verzweiflung. Ich habe eine Studienleistung die gelöst werden muss (und nein, mein Studium hat GAR NICHTS mit Statistik am Hut). Dennoch hoffe ich hier auf Hilfe zu treffen.

Ein paar Infos:

- Wir sollen mit dem Programm SAS-Studio arbeiten
- wir haben einen Datensatz + eine Aufgabenstellung
- Aufgabenstellung: Ist der Wunsch, anderen helfen zu wollen, bei weiblichen Studierenden ausgeprägter als bei männlichen Studierenden?
- Variablen Q13.12 (Benevolenz1) und Q6 (Geschlecht)
- t-Test für unabhängige Proben (Paardifferenztest)
- Nullhypothese (H0): Der Wunsch, anderen helfen zu wollen, ist bei weiblichen Studierenden genauso ausgeprägt wie bei männlichen Studierenden (Mittelwert der Unterschiede = 0).
Alternativhypothese (HA): Der Wunsch, anderen helfen zu wollen, ist bei weiblichen Studierenden stärker ausgeprägt als bei männlichen Studierenden (Mittelwert der Unterschiede > 0).

Ich habe den t-Test bereits ausgeführt, habe auch die ein oder anderen Werte erhalten. Mein Problem ist das Feedback bei der Erstpräsentation (Schriftliche Ausarbeitung ist zum 30.09 fällig). Meine Dozentin sagte mir, ich müsse die Datensätze filtern, um die Ergebnisse/Tabellen für je Männlich, weiblich, divers und die Benevolenz1 zu erhalten.
Ab hier bin ich total ratlos. Wir hatten vor der Dozentin einen Dozenten, der kaum Deutsch sprechen konnte, 3 Tage vor den Präsis gekündigt hat, aufgrund der Sprachbarriere keine Fragen beantworten konnte. Als Ersatz kam die liebe Dame, die uns in Vereinbarung mit der Uni auch gestattet hat, mit Excel zu arbeiten (was ich noch weniger kann), die aber leider auch auf keine Fragen eingehen kann, da sie ja nun Urlaub macht. Also hoffe ich hier fündig zu werden, wie ich die Daten filtern kann, um die Benevolenz der jeweiligen Geschlechter zu erhalten.
Durch das was ich mir bisher selbst beigebracht habe, erreiche ich nur die Benevolenz aller laut meiner Dozentin (?)


2 ANTWORTEN 2
PaigeMiller
Diamond | Level 26

@miray36  schrieb:

Mein Problem ist das Feedback bei der Erstpräsentation (Schriftliche Ausarbeitung ist zum 30.09 fällig). Meine Dozentin sagte mir, ich müsse die Datensätze filtern, um die Ergebnisse/Tabellen für je Männlich, weiblich, divers und die Benevolenz1 zu erhalten.


Google Translate: My problem is the feedback on the first presentation (written elaboration is due on September 30th). My professor told me I needed to filter the records to get the results/tables for each of Male, Female, Diverse, and Benevolence1.

 

I'm not sure what you mean by tables for each of Male, Female (I though the goal was to compare males to females) and Diverse and Benevelonce have no meaning to me, perhaps these are variables in the data set?

 

Google Translate: Ich bin mir nicht sicher, was Sie mit den Tabellen „Männlich“, „Weiblich“ (ich dachte, das Ziel wäre es, Männer mit Frauen zu vergleichen) und „Diverse“ und „Benevelon“ meinen. Für mich haben sie keine Bedeutung. Vielleicht handelt es sich dabei um Variablen im Datensatz?

 

Please explain this part in a lot more detail. Bitte erläutern Sie diesen Teil ausführlicher.

--
Paige Miller
FreelanceReinh
Jade | Level 19

Hallo @miray36 und willkommen in den SAS Support Communities, speziell bei CoDe SAS!

 

Die Beschreibung klingt weitgehend nach einem lehrbuchmäßigen Vergleich zweier Gruppen (hier: männliche und weibliche Studierende) bzgl. des Mittelwerts einer stetigen Variablen (hier: Benevolenz). Bei Normalverteilungsannahme wäre die Lösung in SAS mittels PROC TTEST entsprechend kurz.

 

Ich sehe allerdings zwei Ungereimtheiten:

  1. Das Wort "Paardifferenztest" passt m. E. nicht zum t-Test für unabhängige Stichproben, sondern eher zum t-Test für verbundene (gepaarte) Stichproben. Dort werden nämlich tatsächlich Differenzen von Wertepaaren betrachtet und wie bei einem Ein-Stichproben-t-Test ausgewertet.
  2. Gleiches gilt für die Formulierung "Mittelwert der Unterschiede". Beim t-Test für zwei unabhängige Stichproben interessiert vielmehr der "Unterschied der Mittelwerte": Mit Hilfe einer Teststatistik, die ein Bruch mit der Differenz der beiden Stichprobenmittelwerte im Zähler ist, wird beurteilt, ob und in welcher Richtung sich die Mittelwerte der gesamten Gruppen (die Erwartungswerte) unterscheiden.

Zu klären ist also anhand der Aufgabenstellung und der Datenbeschreibung, welcher der beiden Fälle tatsächlich zutrifft. Im Fall verbundener Stichproben kann das PAIRED-Statement der TTEST-Prozedur verwendet werden. Die Struktur des Datasets, auf das PROC TTEST angewandt wird, würde aber anders aussehen als für den Zwei-Stichproben-t-Test: Man hätte zu jedem zusammengehörigen Paar (von Studierenden) zwei Variablen mit den Benevolenzwerten.

 

Bisher spricht mehr für die Situation zweier unabhängiger Stichproben. Wenn zudem das vorhandene Dataset die Struktur der nachfolgend erzeugten Beispieldaten hat, also (im PROC-PRINT-Output) etwa so aussieht,

Obs    id    Geschlecht    Benevolenz

  1     1        w           10.9001
  2     2        m           10.5543
  3     3        w           12.0563
  ...

kann PROC TTEST direkt darauf angewandt werden.

 

Code-Beispiel:

/* Erzeugung von Beispieldaten */

data have;
call streaminit(27182818);
length id 8 g $1 b 8;
do id=1 to 50;
  g=choosec(rand('table',0.49,0.49), 'm','w','d');
  b=rand('normal',10+(g='w'));
  output;
end;
label g='Geschlecht'
      b='Benevolenz';
run;

proc print data=have(obs=3) label;
run;

/* Vergleich der Erwartungswerte der Benevolenz zwischen den Geschlechtern 'm' und 'w' */

proc ttest data=have;
where g in ('m', 'w');
class g;
var b;
run;

 

Das "Filtern" des Datasets HAVE mittels WHERE-Statement ist im obigen Fall notwendig, weil PROC TTEST sonst mit der Fehlermeldung

ERROR: The CLASS variable has more than two levels.

scheitern würde. Die den Zwei-Stichproben-t-Test störenden "Diversen" (g='d') werden durch die WHERE-Bedingung (die im obigen Beispiel auch kürzer g ne 'd' geschrieben werden könnte) ausgeschlossen.

SAS Innovate 2025: Save the Date

 SAS Innovate 2025 is scheduled for May 6-9 in Orlando, FL. Sign up to be first to learn about the agenda and registration!

Save the date!

Diskussionsstatistiken
  • 2 Antworten
  • 3775 Aufrufe
  • 0 Kudos
  • 3 in Unterhaltung