Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Das Gesetz der großen Zahlen

Im vorherigen Abschnitt habe ich Ihnen die Ergebnisse eines fiktiven IQ-Experiments mit einer Stichprobengröße von N = 100 gezeigt. Die Ergebnisse waren einigermaßen ermutigend, da der wahre Mittelwert der Population bei 100 liegt und der Stichprobenmittelwert von 98,5 eine vernünftige Annäherung an diesen Wert darstellt. In vielen wissenschaftlichen Studien ist dieser Genauigkeitsgrad durchaus akzeptabel, aber in anderen Situationen muss man sehr viel genauer sein. Was können wir tun, wenn wir wollen, dass unsere Stichprobenstatistiken viel näher an den Parametern der Grundgesamtheit liegen?

Die offensichtliche Antwort ist, mehr Daten zu sammeln. Nehmen wir an, wir führen ein viel größeres Experiment durch, bei dem wir die IQs von 10.000 Personen messen. Wir können die Ergebnisse dieses Experiments mit jamovi simulieren. IQsim ist eine jamovi-Datendatei. In dieser Datei habe ich 10.000 Zufallszahlen erzeugt, die aus einer Normalverteilung für eine Population mit mean = 100 und sd = 15 entnommen wurden. Dies geschah durch die Berechnung einer neuen Variablen mit der Funktion = NORM(100,15). Ein Histogramm und ein Dichtediagramm zeigen, dass diese größere Stichprobe eine viel bessere Annäherung an die wahre Verteilung der Grundgesamtheit darstellt als die kleinere. Dies spiegelt sich auch in den Statistiken der Stichprobe wider. Der mittlere IQ der größeren Stichprobe beträgt 99,68 und die Standardabweichung 14,90. Diese Werte liegen nun sehr nahe an der wahren Werten in der Grundgesamtheit, wie Abb. 59 zeigt.

Mit jamovi aus einer Normalverteilung gezogene Zufallsstichprobe

Abb. 59 Mit jamovi aus einer Normalverteilung gezogene Zufallsstichprobe

Es kommt mir etwas albern vor, das zu sagen, aber ich möchte, dass Sie daraus mitnehmen, dass große Stichproben im Allgemeinen bessere Informationen liefern. Ich fühle mich albern, das zu sagen, weil es so verdammt offensichtlich ist, dass es eigentlich nicht gesagt werden müsste. Es ist sogar so offensichtlich, dass Jacob Bernoulli, einer der Begründer der Wahrscheinlichkeitstheorie, diesen Gedanken bereits 1713 formulierte und sich dabei ziemlich blöd anstellte. Er beschrieb die Tatsache, dass wir alle diese Intuition teilen, folgendermaßen:

Selbst der dümmste Mensch ist durch irgendeinen Naturinstinkt, von sich aus und ohne jede Belehrung (was eine bemerkenswerte Sache ist), davon überzeugt, dass die Gefahr, sich vom Ziel zu entfernen, umso geringer ist, je mehr Beobachtungen man gemacht hat (Stigler, 1986).

Okay, die Passage wirkt ein wenig herablassend (um nicht zu sagen sexistisch), aber sein Hauptargument ist richtig. Es ist wirklich offensichtlich, dass man mit mehr Daten bessere Antworten erhält. Die Frage ist, warum ist das so? Es überrascht nicht, dass diese Intuition, die wir alle teilen, sich als richtig erweist. Statistiker bezeichnen sie als das Gesetz der großen Zahlen. Das Gesetz der großen Zahlen ist ein mathematisches Gesetz, das auf viele verschiedene Stichprobenstatistiken anwendbar ist. Am einfachsten kann man es sich aber als Gesetz über Durchschnittswerte vorstellen. Der Stichprobenmittelwert ist das offensichtlichste Beispiel für eine Statistik, die auf der Mittelwertbildung beruht (denn genau das ist der Mittelwert… ein Durchschnitt), also schauen wir uns diesen an. Bei der Anwendung auf den Stichprobenmittelwert besagt das Gesetz der großen Zahlen, dass sich der Stichprobenmittelwert mit zunehmender Größe der Stichprobe tendenziell dem wahren Mittelwert der Grundgesamtheit annähert. Oder, um es etwas präziser auszudrücken, wenn der Stichprobenumfang sich der Unendlichkeit „nähert“ (geschrieben als N → ∞), nähert sich der Stichprobenmittelwert dem Mittelwert der Grundgesamtheit ( → µ).[1]

Ich will Ihnen nicht beweisen, dass das Gesetz der großen Zahlen wahr ist, aber es ist eines der wichtigsten Werkzeuge der statistischen Theorie. Mit dem Gesetz der großen Zahlen können wir unseren Glauben rechtfertigen, dass das Sammeln von immer mehr Daten uns schließlich zur Wahrheit führen wird. Die Stichprobenstatistiken, die wir für jeden Datensatz berechnen, sind nur ungenaue Schätzungen der Populationsparameter. Das Gesetz der großen Zahlen besagt jedoch, dass sich diese Stichprobenstatistiken, je mehr Daten wir sammeln, den wahren Populationsparametern immer mehr annähern.