Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Vergleich zweier Mittelwerte

Im Kapitel Analyse kategorialer Daten haben wir die Situation behandelt, in der Ihre Ergebnisvariable eine nominale Skala nominal und Ihre Prädiktorvariable ebenfalls eine nominale Skala nominal hat. Viele Situationen in der realen Welt haben diesen Charakter, und so werden Sie feststellen, dass insbesondere χ²-Tests recht häufig verwendet werden. Es ist jedoch viel wahrscheinlicher, dass Sie sich in einer Situation befinden, in der Ihre Ergebnisvariable eine Intervallskala oder eine höhere Skala continuous ist, und Sie daran interessiert sind, ob der Durchschnittswert der Ergebnisvariable in der einen oder anderen Gruppe höher ist. Ein Psychologe könnte beispielsweise wissen wollen, ob die Angstwerte bei Eltern höher sind als bei Nicht-Eltern oder ob die Kapazität des Arbeitsgedächtnisses durch das Hören von Musik verringert wird (im Vergleich zum Nicht-Hören von Musik). In medizinischem Kontext könnte man wissen wollen, ob ein neues Medikament den Blutdruck erhöht oder senkt. Ein Agrarwissenschaftler könnte wissen wollen, ob das Düngen mit Phosphor australische Pflanzen abtötet.[1] In all diesen Situationen ist unsere Ergebnisvariable eine kontinuierliche Variable auf einer Intervall- oder Verhältnisskala continuous, und unser Prädiktor ist eine binäre „Gruppierungs“-Variable nominal. Mit anderen Worten, wir wollen die Mittelwerte der beiden Gruppen vergleichen.

Die Standardantwort auf das Problem des Vergleichs von Mittelwerten ist das Verwenden eines t-Tests, von dem es mehrere Varianten gibt, je nachdem, welche Frage man beantworten möchte. Daher konzentriert sich der größte Teil dieses Kapitels auf verschiedene Arten von t-Tests: Zuerst werden t-Tests bei einer Stichproben besprochen, gefolgt von zwei verschiedenen Varianten des t-Tests für unabhängige Stichproben, dem Student-Test, der voraussetzt, dass die Gruppen die gleiche Standardabweichung haben, und dem Welch-Test bei dem diese Voraussetzung nicht erfüllt sein muss. Danach werden t-Tests für gepaarte Stichproben besprochen. Wir sprechen dann über einseitige Tests und danach ein wenig über Cohen’s d, welches das Standardmaß für die Effektstärke für einen t-Test ist. Die späteren Abschnitte des Kapitels konzentrieren sich auf die Voraussetzungen, um t-Tests durchführen zu können, insbesondere die Annahme der Normalverteilung sowie dem Wilcoxon-Test als mögliche Alternative, wenn diese Annahme verletzt ist. Bevor wir jedoch auf diese nützlichen Dinge eingehen, beginnen wir mit einer Diskussion über den z-Test.