Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Die Binomialverteilung

Wie Sie sich vielleicht vorstellen können, sind Wahrscheinlichkeitsverteilungen sehr unterschiedlich, und es gibt eine enorme Bandbreite an Verteilungen. Sie sind jedoch nicht alle gleich wichtig. Der größte Teil des Inhalts dieses Buches bezieht sich auf eine von fünf Verteilungen: die Binomialverteilung, die Normalverteilung, die t-Verteilung, die χ²-Verteilung (Chi-Quadrat) und die F-Verteilung. Aus diesem Grund werde ich in den nächsten Abschnitten eine kurze Einführung in alle fünf Verteilungen geben. Dabei werde ich besonders auf die Binomial- und die Normalverteilung eingehen. Ich beginne mit der Binomialverteilung, da sie die einfachste der fünf ist.

Einführung des Binomialsystems

Die Wahrscheinlichkeitstheorie hat ihren Ursprung in dem Versuch, die Funktionsweise von Glücksspielen zu beschreiben. Daher erscheint es passend, dass unsere Diskussion über die Binomialverteilung eine Diskussion über das Würfeln und das Werfen von Münzen einschließt. Stellen wir uns ein einfaches „Experiment“ vor. In meiner kleinen Hand halte ich 20 identische sechsseitige Würfel. Auf einer Seite eines jeden Würfels ist ein Totenkopf abgebildet, die anderen fünf Seiten sind leer. Wenn ich nun alle 20 Würfel werfe, wie hoch ist die Wahrscheinlichkeit, dass ich genau 4 Totenköpfe erhalte? Unter der Annahme, dass die Würfel „normal“ sind, wissen wir, dass die Wahrscheinlichkeit, dass ein Würfel einen Schädel zeigt, 1 zu 6 ist. Anders ausgedrückt: Die Wahrscheinlichkeit, dass ein einzelner Würfel einen Schädel ergibt, liegt bei 0,167. Das sind genug Informationen, um unsere Frage zu beantworten, also schauen wir uns an, wie das geht.

Tab. 7 Formeln für die Binomial- und Normalverteilung. Wir verwenden diese Formeln in diesem Buch eigentlich für nichts, aber sie sind ziemlich wichtig für fortgeschrittene Arbeiten, daher dachte ich, es wäre am besten, sie hier in einer Tabelle aufzuführen. In der Gleichung für die Binomialverteilung ist X! die Fakultät (d.h. alle ganzen Zahlen von 1 bis X multiplizieren), und für die Normalverteilung bezieht sich „exp“ auf die Exponentialfunktion, die wir in Kapitel Pragmatische Fragen besprochen haben. Wenn diese Gleichungen für Sie nicht viel Sinn ergeben, machen Sie sich nicht allzu viele Gedanken darüber.

Binomial

Normal

\(P(X \ | \ \theta, N) = \displaystyle\frac{N!}{X! (N-X)!} \theta^X (1-\theta)^{N-X}\)

\(p(X \ | \ \mu, \sigma) = \displaystyle\frac{1}{\sqrt{2\pi}\sigma} \exp \left( -\frac{(X - \mu)^2}{2\sigma^2} \right)\)

Wie üblich werden wir einige Namen und eine Notation einführen. Mit N bezeichnen wir die Anzahl der Würfelwürfe in unserem Experiment, was oft als Größenparameter unserer Binomialverteilung bezeichnet wird. Wir werden auch θ verwenden, um uns auf die Wahrscheinlichkeit zu beziehen, dass ein bestimmer Wurf einen Totenkopf ergibt, eine Größe, die gewöhnlich als Erfolgswahrscheinlichkeit der Binomialverteilung bezeichnet wird.[1] Schließlich werden wir X verwenden, um uns auf die Ergebnisse unseres Experiments zu beziehen, nämlich die Anzahl der Totenköpfe, die ich erhalte, wenn ich würfele. Da der tatsächliche Wert von X auf den Zufall zurückzuführen ist, bezeichnen wir ihn als Zufallsvariable. Da wir nun alle diese Begriffe und Bezeichnungen kennen, können wir sie verwenden, um das Problem ein wenig genauer zu formulieren. Die Größe, die wir berechnen wollen, ist die Wahrscheinlichkeit, dass X = 4 ist, wenn wir wissen, dass θ = 0,167 und N = 20 ist. Die allgemeine „Form“ der Sache, die ich berechnen möchte, könnte wie folgt geschrieben werden

P(X | θ, N)

und wir interessieren uns für den speziellen Fall, dass X = 4, θ = 0,167 und N = 20 ist. Es gibt nur noch eine weitere Notation, auf die ich hinweisen möchte, bevor ich zur Lösung des Problems übergehe. Wenn ich sagen möchte, dass X zufällig aus einer Binomialverteilung mit den Parametern θ und N generiert wird, würde ich die folgende Notation verwenden:

X ~ Binomial(θ, N)

Ja, ja, ja. Ich weiß, was Sie denken: Notation, Notation, Notation. Wirklich, wen interessiert das? Die wenigsten Leser dieses Buches sind wegen der Notation hier, also sollte ich wahrscheinlich weitermachen und darüber sprechen, wie man die Binomialverteilung verwendet. Ich habe die Formel für die Binomialverteilung in Tab. 7 aufgenommen, da einige Leser vielleicht selbst damit spielen wollen, aber da die meisten Leute sich wahrscheinlich nicht so sehr dafür interessieren und wir die Formel in diesem Buch nicht brauchen, werde ich nicht im Detail darauf eingehen. Stattdessen möchte ich Ihnen nur zeigen, wie die Binomialverteilung aussieht.

Binomialverteilung für *N* = 20 und θ = 1/6

Abb. 45 Binomialverteilung mit einem Größenparameter von N = 20 und einer zugrunde liegenden Erfolgswahrscheinlichkeit von θ = 1/6. Jeder vertikale Balken stellt die Wahrscheinlichkeit eines bestimmten Ergebnisses dar (d. h. einen möglichen Wert von X). Da es sich um eine Wahrscheinlichkeitsverteilung handelt, muss jede der Wahrscheinlichkeiten eine Zahl zwischen 0 und 1 sein, und die Höhe aller Balken muss sich ebenfalls zu 1 summieren.

Zu diesem Zweck zeigt Abb. 45 die binomischen Wahrscheinlichkeiten für alle möglichen Werte von X in unserem Würfelexperiment, von X = 0 (keine Totenköpfe) bis zu X = 20 (nur Totenköpfe). Beachten Sie, dass dies im Grunde ein Balkendiagramm ist und sich nicht von der Darstellung der „Hosenwahrscheinlichkeit“ unterscheidet, die ich in Abb. 44 gezeichnet habe. Auf der horizontalen Achse befinden sich alle möglichen Ereignisse, und auf der vertikalen Achse können wir die Wahrscheinlichkeit für jedes dieser Ereignisse ablesen. Die Wahrscheinlichkeit, bei 4 von 20 Würfen Totenköpfe zu erhalten, liegt also bei 0,20 (die genaue Antwort ist 0,2022036, wie wir gleich sehen werden). Mit anderen Worten, es wäre zu erwarten, dass dies in etwa 20 % der Fälle passiert, wenn das Experiment wiederholt wird.

Um Ihnen ein Gefühl dafür zu vermitteln, wie sich die Binomialverteilung verändert, wenn wir die Werte von θ und N ändern, nehmen wir an, dass ich statt zu würfeln, Münzen werfe. Dieses Mal besteht mein Experiment darin, eine „normale“ Münze wiederholt zu werfen. Das Ergebnis, das mich interessiert, ist die Anzahl der Kopf-Würfe, die ich beobachte. In diesem Szenario ist die Erfolgswahrscheinlichkeit θ = 1/2. Angenommen, ich werfe die Münze N = 20 Mal. In diesem Beispiel habe ich die Erfolgswahrscheinlichkeit geändert, aber den Umfang des Experiments gleich gelassen. Was bedeutet das für unsere Binomialverteilung? Nun, wie Abb. 46 (links) zeigt, besteht der Haupteffekt darin, die gesamte Verteilung zu verschieben, wie Sie es erwarten würden. Was würde passieren, wenn wir eine Münze N = 100 Mal werfen würden? In diesem Fall erhalten wir das, was auf der rechten Seite zu sehen ist. Die Verteilung bleibt ungefähr in der Mitte, aber es gibt etwas mehr Variabilität bei den möglichen Resultaten.

Binomialverteilung: θ = 1/2 und *N* = 20 (links) oder *N* = 100 (rechts)

Abb. 46 Zwei Binomialverteilungen in einem Szenario, in dem ich eine „normale“ Münze werfe, so dass die zugrunde liegende Erfolgswahrscheinlichkeit θ = 1/2 ist. Im linken Feld wird angenommen, dass ich die Münze N = 20 Mal werfe. Im rechten Feld nehmen wir an, dass die Münze N = 100-mal geworfen wird.