Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Der t-Test für unabhängige Stichproben (nach Welch)

In der Praxis ist das größte Problem bei der Verwendung des t-Tests nach Student die dritte Annahme, die im vorherigen Abschnitt aufgeführt wurde. Es wird angenommen, dass beide Gruppen die gleiche Standardabweichung haben. Im wirklichen Leben ist dies selten der Fall. Wenn zwei Stichproben nicht den gleichen Mittelwert haben, warum sollten wir dann erwarten, dass sie die gleiche Standardabweichung haben? Es gibt wirklich keinen Grund, diese Annahme als wahr anzusehen. Wir werden später noch ein wenig darüber sprechen, wie man diese Annahme überprüfen kann, denn sie taucht an verschiedenen Stellen auf, nicht nur beim t-Test. Aber jetzt werde ich über eine andere Form des t-Tests sprechen (Welch, 1947), die sich nicht auf diese Annahme stützt. Eine grafische Veranschaulichung dessen, was der t-Test nach Welch über die Daten annimmt, wird in Abb. 92 gezeigt, im Vergleich zum t-Test nach Student in Abb. 90. Ich gebe zu, dass es etwas seltsam ist, über eine Lösung zu sprechen, bevor man das Problem dargestellt hat, aber der Welch's Test kann einfach mittels einer Option innerhalb des Independent Samples T-Test in jamovi angegeben werden, also ist dies wahrscheinlich der beste Ort, um ihn zu diskutieren.

Illustration: Null- und Alternativhypothesen für den *t*-Test nach Welch

Abb. 92 Grafische Darstellung der Null- und Alternativhypothesen, die beim t-Test nach Welch angenommen werden. Wie beim t-Test für unabhängige Stichproben nach Student (Abb. 90) wird davon ausgegangen, dass beide Stichproben aus einer normalverteilten Grundgesamtheit gezogen werden; die Alternativhypothese erfordert jedoch nicht mehr, dass beide Grundgesamtheiten die gleiche Varianz aufweisen.

Der t-Test nach Welch ist dem t-Test nach Student sehr ähnlich. Zum Beispiel wird die t-Statistik, die wir im t-Test nach Welch verwenden, auf die gleiche Weise berechnet wie beim t-Test nach Student. Das heißt, wir nehmen die Differenz zwischen den Stichprobenmittelwerten und teilen sie dann durch einen Schätzwert für den Standardfehler dieser Differenz:

\[t = \frac{\bar{X}_1 - \bar{X}_2}{SE(\bar{X}_1 - \bar{X}_2)}\]

Der Hauptunterschied besteht darin, dass die Berechnung der Standardfehler sich unterscheidet. Wenn die beiden Populationen unterschiedliche Standardabweichungen haben, dann ist es völliger Unsinn zu versuchen, eine gepoolte Standardabweichungsschätzung zu berechnen, weil man sonst Äpfel und Birnen miteinander vergleichen würde.[1]

Der Standardfehler der Differenz zwischen den Stichprobenmittelwerten lässt sich aber trotzdem schätzen, er sieht nur anders aus

\[SE(\bar{X}_1 - \bar{X}_2) = \sqrt{ \frac{{\hat{\sigma}_1}^2}{N_1} + \frac{{\hat{\sigma}_2}^2}{N_2} }\]

Der Grund, warum er auf diese Weise berechnet wird, würde den Rahmen dieses Buches sprengen. Für unsere Zwecke ist es wichtig zu wissen, dass sich die t-Statistik, die aus dem t-Test nach Welch hervorgeht, etwas von derjenigen unterscheidet, die aus dem t-Test nach Student hervorgeht.

Der zweite Unterschied zwischen den Tests nach Welch und Student besteht darin, dass die Freiheitsgrade auf andere Weise berechnet werden. Beim Test nach Welch müssen die „Freiheitsgrade“ nicht ganzzahlig sein, und sie entsprechen daher auch nicht mehr der Heuristik „Anzahl der Datenpunkte minus Anzahl der Einschränkungen“, die ich bisher verwendet habe.

Die Freiheitsgrade sind demnach

\[\mbox{df} = \frac{ ({\hat{\sigma}_1}^2 / N_1 + {\hat{\sigma}_2}^2 / N_2)^2 }{ ({\hat{\sigma}_1}^2 / N_1)^2 / (N_1 -1 ) + ({\hat{\sigma}_2}^2 / N_2)^2 / (N_2 -1 ) }\]

Das ist erfreulicherweise alles ziemlich einfach und offensichtlich? Vielleicht aber auch nicht. Für unsere Zwecke ist es nicht wirklich wichtig. Wichtig ist, dass Sie sehen werden, dass der „df“-Wert, der bei einem Test nach Welch herauskommt, in der Regel etwas kleiner ist als der, der für den Test nach Student verwendet wird, und er muss nicht unbedingt eine Ganzzahl sein.

Durchführen des t-Tests nach Welch in jamovi

Wenn Sie in der obigen Analyse die Checkbox für Welch's setzen, erhalten Sie folgendes Ergebnis Abb. 93:

Die Ergebnisse zeigen den *t*-Test nach Welch neben dem Standard *t*-Test nach Student

Abb. 93 Die Ergebnisse zeigen den t-Test nach Welch neben dem (standardmäßigen) t-Test nach Student in jamovi

Die Interpretation dieser Ausgabe sollte ziemlich offensichtlich sein. Sie lesen die Ausgabe für den t-Test nach Welch auf die gleiche Weise wie für den t-Test nach Student. Sie erhalten Ihre Deskriptivstatistik, die Testergebnisse und einige weitere Informationen. Das ist also alles ziemlich einfach.

Außer… dass unser Ergebnis nicht mehr signifikant ist. Als wir den t-Test nach Student durchführten, erhielten wir einen signifikanten Effekt, aber der t-Test nach Welch für denselben Datensatz ist nicht signifikant (t(23.02) = 2.03, p = 0.054). Was bedeutet das für uns? Sollten wir in Panik geraten? Wahrscheinlich nicht. Die Tatsache, dass ein Test signifikant ist und der andere nicht, bedeutet an sich nicht viel, vor allem, weil ich die Daten so generiert habe, dass genau das passiert. Im Allgemeinen ist es keine gute Idee, sich die Mühe zu machen, den Unterschied zwischen einem p-Wert von 0,049 und einem p-Wert von 0,051 zu interpretieren oder zu erklären. Wenn so etwas im wirklichen Leben vorkommt, ist der Unterschied zwischen diesen p-Werten mit ziemlicher Sicherheit dem Zufall geschuldet. Wichtig ist, dass Sie sich ein wenig Gedanken darüber machen, welchen Test Sie verwenden. Der t-Test nach Student und der t-Test nach Welch haben jeweils unterschiedliche Stärken und Schwächen. Wenn beide Populationen tatsächlich gleiche Varianzen aufweisen, ist der t-Test nach Student etwas aussagekräftiger (geringere Fehlerrate vom Typ II) als der t-Test nach Welch. Wenn jedoch die beiden Populationen nicht die gleichen Varianzen haben, werden die Annahmen des t-Test nach Student verletzt, und man kann sich nicht auf ihn verlassen; die Fehlerrate vom Typ I könnte höher sein. Es ist also eine Abwägung. In der Praxis bevorzuge ich jedoch eher den t-Test nach Welch, da fast niemand glaubt, dass die Varianzen der Grundgesamtheit identisch sind.

Voraussetzungen für den Test

Die Voraussetzungen für den t-Test nach Welch sind denen des t-Tests nach Student sehr ähnlich (siehe Voraussetzungen für den *t*-Test nach Student), mit der Ausnahme, dass der Welch-Test keine Varianzhomogenität voraussetzt. Damit bleibt nur noch die Annahme der Normalverteilung und die Annahme der Unabhängigkeit. Die Anforderungen in Bezug auf diese Annahmen sind für den Welch-Test die gleichen wie für den Student-Test.