Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Teststatistiken und Stichprobenverteilungen

An diesem Punkt müssen wir genauer darüber sprechen, wie ein Hypothesentest aufgebaut ist. Kehren wir zu diesem Zweck zum ESP-Beispiel zurück. Lassen wir die tatsächlichen Daten, die wir erhalten haben, für den Moment beiseite und denken wir über die Struktur des Experiments nach. Unabhängig von den tatsächlichen Zahlen lautet die Form der Daten, dass X von N Personen die Farbe der verdeckten Karte richtig erkannt haben. Nehmen wir weiter an, dass die Nullhypothese wirklich wahr ist, dass ESP nicht existiert und die wahre Wahrscheinlichkeit, dass jemand die richtige Farbe wählt, genau θ = 0,5 ist. Wie würden wir erwarten, dass die Daten aussehen? Nun, natürlich würden wir erwarten, dass der Anteil von Personen, welche die richtige Antwort geben, ziemlich nahe bei 50 % liegt. Oder, um es mathematisch auszudrücken, würden wir sagen, dass X / N ungefähr 0,5 ist. Natürlich würden wir nicht erwarten, dass dieser Anteil genau 0,5 beträgt. Wenn wir zum Beispiel N = 100 Personen getestet hätten und X = 53 von ihnen die Frage richtig beantwortet hätten, wären wir wahrscheinlich gezwungen zuzugeben, dass die Daten mit der Nullhypothese übereinstimmen. Wenn hingegen X = 99 unserer Teilnehmer die Frage richtig beantwortet haben, können wir ziemlich sicher sein, dass die Nullhypothese falsch ist. Und wenn nur X = 3 Personen die Frage richtig beantwortet haben, können wir ebenfalls davon überzeugt sein, dass die Nullhypothese falsch ist. Betrachten wir das Ganze ein wenig technischer. Wir haben eine Größe X, die wir anhand unserer Daten berechnen können. Nachdem wir uns den Wert von X angesehen haben, treffen wir eine Entscheidung darüber, ob wir glauben, dass die Nullhypothese korrekt ist, oder ob wir die Nullhypothese zugunsten der Alternativhypothese verwerfen. Der Name für das, was wir berechnen, um unsere Entscheidungen zu treffen, ist Teststatistik.

Nachdem wir eine Teststatistik ausgewählt haben, besteht der nächste Schritt darin, genau anzugeben, welche Werte der Teststatistik dazu führen würden, dass wir die Nullhypothese ablehnen, und welche Werte dazu führen würden, dass wir sie beibehalten müssen. Dazu müssen wir bestimmen, wie die Stichprobenverteilung der Teststatistik aussehen würde, wenn die Nullhypothese tatsächlich wahr wäre (über Stichprobenverteilungen haben wir bereits in Stichprobenverteilung des Mittelwertes gesprochen). Warum brauchen wir das? Weil diese Verteilung uns genau sagt, welche Werte von X unsere Nullhypothese erwarten lassen würde. Und deshalb können wir diese Verteilung als Hilfsmittel verwenden, um zu beurteilen, wie gut die Nullhypothese mit unseren Daten übereinstimmt.

Stichprobenverteilung, wenn die Nullhypothese wahr ist

Abb. 67 Die Stichprobenverteilung für unsere Teststatistik X, wenn die Nullhypothese wahr ist. Für unser ESP-Szenario ist dies eine Binomialverteilung. Da die Nullhypothese besagt, dass die Wahrscheinlichkeit einer richtigen Antwort θ = 0,5 ist, überrascht es uns kaum, dass der wahrscheinlichste Wert in unserer Stichprobenverteilung bei 50 (von 100) richtigen Antworten liegt. Der Anteil der Antworten mit der höchsten Wahrscheinlichkeitsdichte liegt zwischen 40 und 60.

Wie bestimmen wir eigentlich die Stichprobenverteilung unserer Teststatistik? Bei vielen Hypothesentests ist dieser Schritt ziemlich kompliziert, und später im Buch werden Sie sehen, dass ich bei einigen Tests etwas ausweichend reagiere (einige verstehe ich nicht einmal selbst). Manchmal ist es aber auch ganz einfach. Und zum Glück für uns bietet unser ESP-Beispiel einen der einfachsten Fälle. Unser Populationsparameter θ ist einfach die Gesamtwahrscheinlichkeit, dass die Leute richtig antworten, wenn ihnen die Frage nach der verdeckten Karte gestellt wird. Unsere Teststatistik X ist die Anzahl der Personen, die bei einer Stichprobengröße von N korrekt geantwortet haben. Wir haben eine Verteilung wie diese im Abschnitt Die Binomialverteilung schon einmal gesehen, und das ist genau das, was die Binomialverteilung beschreibt! Um also die Notation und Terminologie zu verwenden, die ich in diesem Abschnitt eingeführt habe, würden wir sagen, dass die Nullhypothese vorhersagt, dass X binomialverteilt ist, was wie folgt geschrieben wird:

X ~ Binomial(θ, N)

Da die Nullhypothese besagt, dass θ = 0,5 und unser Experiment N = 100 Personen hat, haben wir die Stichprobenverteilung, die wir brauchen. Diese Stichprobenverteilung ist in Abb. 67 eingezeichnet. Die Nullhypothese besagt, dass X = 50 das wahrscheinlichste Ergebnis ist, und sie besagt, dass wir mit ziemlicher Sicherheit zwischen 40 und 60 richtige Antworten erhalten werden.