Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Grundlagen der Wahrscheinlichkeitsrechnung

Ungeachtet der ideologischen Auseinandersetzungen zwischen Bayesianern und Frequentisten zeigt sich, dass die meisten Menschen sich über die Regeln einig sind, denen Wahrscheinlichkeiten gehorchen sollten. Es gibt viele verschiedene Methoden, um zu diesen Regeln zu gelangen. Der am weitesten verbreitete Ansatz basiert auf der Arbeit von Andrej Kolmogorow, einem der großen sowjetischen Mathematiker des 20. Jahrhunderts. Ich werde nicht zu sehr ins Detail gehen, aber ich werde versuchen, Ihnen einen Eindruck davon zu vermitteln, wie es funktioniert. Und dazu muss ich über meine Hose sprechen.

Einführung in Wahrscheinlichkeitsverteilungen

Eine der beunruhigenden Wahrheiten über mein Leben ist, dass ich nur 5 Paar Hosen besitze. Drei Paar Jeans, die untere Hälfte eines Anzugs und eine Jogginghose. Noch trauriger ist, dass ich ihnen Namen gegeben habe: Ich nenne sie X1, X2, X3, X4 und X5. Das habe ich wirklich, deshalb nennt man mich auch Mister Fantasievoll. Jetzt suche ich mir jeden Tag genau eine Hose aus, die ich anziehen kann. Nicht einmal ich bin so dumm, dass ich versuche, zwei Hosen zu tragen, und dank jahrelangem Training gehe ich auch nie mehr ohne Hose aus dem Haus. Wenn ich diese Situation in der Sprache der Wahrscheinlichkeitstheorie beschreiben würde, könnte ich jede Hose (d. h. jedes X) als Elementarereignis bezeichnen. Das Hauptmerkmal von Elementarereignissen ist, dass jedes Mal, wenn wir eine Beobachtung machen (z. B. jedes Mal, wenn ich eine Hose anziehe), das Ergebnis eines und nur eines dieser Ereignisse sein kann. Wie ich schon sagte, trage ich heutzutage immer genau eine Hose, so dass meine Hose diese Bedingung erfüllt. In ähnlicher Weise wird die Menge aller möglichen Ereignisse als Stichprobenraum bezeichnet. Zugegeben, manche Leute würden ihn als „Kleiderschrank“ bezeichnen, aber das liegt daran, dass sie sich weigern, über meine Hosen in probabilistischen Begriffen zu denken. Schade.

Jetzt haben wir einen Stichprobenraum (einen Kleiderschrank), der aus vielen möglichen Elementarereignissen (Hosen) aufgebaut ist. Was wir tun wollen, ist, eine Wahrscheinlichkeit zu jedem dieser Elementarereignisse zuzuordnen. Für ein Ereignis X ist die Wahrscheinlichkeit dieses Ereignisses P(X) eine Zahl, die zwischen 0 und 1 liegt. Je größer der Wert von P(X), desto wahrscheinlicher ist das Eintreten des Ereignisses. Wenn also zum Beispiel P(X) = 0 ist, bedeutet dies, dass das Ereignis X unmöglich ist (d. h., ich trage diese Hose nie). Wenn andererseits P(X) = 1 ist, bedeutet dies, dass das Ereignis X mit Sicherheit eintritt (d. h., ich trage diese Hose immer). Für Wahrscheinlichkeitswerte in der Mitte bedeutet es, dass ich diese Hose manchmal trage. Wenn zum Beispiel P(X) = 0,5 ist, bedeutet dies, dass ich diese Hose die Hälfte der Zeit trage.

An diesem Punkt sind wir fast fertig. Das letzte, was wir erkennen müssen, ist, dass „immer etwas passiert“. Jedes Mal, wenn ich eine Hose anziehe, habe ich am Ende wirklich eine Hose an (verrückt, nicht wahr?). Diese etwas banale Aussage bedeutet in der Wahrscheinlichkeitsrechnung, dass sich die Wahrscheinlichkeiten der Elementarereignisse zu 1 addieren müssen. Dies ist als Gesetz der Gesamtwahrscheinlichkeit bekannt, auch wenn es niemanden von uns wirklich interessiert. Noch wichtiger ist, dass wir, wenn diese Voraussetzungen erfüllt sind, eine Wahrscheinlichkeitsverteilung haben. Dies ist zum Beispiel ein Beispiel für eine Wahrscheinlichkeitsverteilung:

Welche Hose?

Bezeichnung

Wahrscheinlichkeit

Blaue Jeans

X1

P(X1) = 0.5

Graue Jeans

X2

P(X2) = 0.3

Schwarze Jeans

X3

P(X3) = 0.1

Schwarze Anzughose

X4

P(X4) = 0

Blaue Trainingshose

X5

P(X5) = 0.1

Jedes der Ereignisse hat eine Wahrscheinlichkeit, die zwischen 0 und 1 liegt, und wenn wir die Wahrscheinlichkeiten aller Ereignisse addieren, ergeben sie 1. Fantastisch. Wir können sogar ein hübsches Balkendiagramm zeichnen (siehe Balkendiagramme), um diese Verteilung zu visualisieren, wie in Abb. 44 gezeigt. Und an diesem Punkt haben wir alle etwas erreicht. Sie haben gelernt, was eine Wahrscheinlichkeitsverteilung ist, und ich habe endlich einen Weg gefunden, ein Diagramm zu erstellen, das sich ausschließlich auf meine Hose konzentriert. Alle haben gewonnen!

„Hosen“-Wahrscheinlichkeitsverteilung

Abb. 44 Visuelle Darstellung der „Hosen“-Wahrscheinlichkeitsverteilung. Es gibt fünf „Elementarereignisse“, die den fünf Hosen entsprechen, die ich besitze. Jedes dieser Ereignis hat eine gewisse Eintrittswahrscheinlichkeit: Diese Wahrscheinlichkeit ist eine Zahl zwischen 0 und 1. Die Summe dieser Wahrscheinlichkeiten ist 1.

Die einzige andere Sache, auf die ich hinweisen muss, ist, dass man in der Wahrscheinlichkeitstheorie sowohl über nicht elementare Ereignisse als auch über elementare Ereignisse sprechen kann. Am einfachsten lässt sich das Konzept anhand eines Beispiels veranschaulichen. Im Hosenbeispiel ist es völlig legitim, von der Wahrscheinlichkeit zu sprechen, dass ich Jeans trage. In diesem Szenario gilt das Ereignis „Dani trägt Jeans“ als eingetreten, solange das Elementarereignis, das tatsächlich eingetreten ist, eines der entsprechenden Ereignisse ist. In diesem Fall „blaue Jeans“, „schwarze Jeans“ oder „graue Jeans“. Mathematisch gesehen haben wir das Ereignis „Jeans“ E so definiert, dass es der Menge der Elementarereignisse (X1, X2, X3)` entspricht. Wenn eines dieser Elementarereignisse eintritt, dann gilt auch E als eingetreten. Nachdem wir uns entschlossen haben, die Definition von E auf diese Weise niederzuschreiben, ist es ziemlich einfach, die Wahrscheinlichkeit P(E) zu bestimmen: Wir addieren einfach alles zusammen. In diesem besonderen Fall

P(E) = P(X1) + P(X2) + P(X3)

und da die Wahrscheinlichkeiten für blaue, graue und schwarze Jeans jeweils 0,5, 0,3 und 0,1 betragen, ist die Wahrscheinlichkeit, dass ich Jeans trage, gleich 0,9.

An dieser Stelle denken Sie vielleicht, dass dies alles furchtbar offensichtlich und einfach ist, und Sie hätten Recht. Alles, was wir bisher getan haben, ist, einige grundlegende mathematische Konzepte mit einigen Intuitionen auf der Basis gesunden Menschenverstands zu verbinden. Aus diesen einfachen Anfängen lassen sich jedoch einige äußerst leistungsfähige mathematische Werkzeuge konstruieren. Ich werde in diesem Buch sicher nicht ins Detail gehen, aber ich werde in Tab. 6 einige der anderen Regeln auflisten, die Wahrscheinlichkeiten erfüllen. Diese Regeln lassen sich aus den einfachen Annahmen ableiten, die ich oben skizziert habe. Aber da wir diese Regeln in diesem Buch nicht wirklich für irgendetwas verwenden, werde ich das hier nicht tun.

Tab. 6 Wahrscheinlichkeiten müssen einige grundlegende Regeln erfüllen. Sie müssen diese Regeln nicht unbedingt kennen, um die Analysen zu verstehen, über die wir später im Buch sprechen werden, aber sie sind wichtig, wenn Sie die Wahrscheinlichkeitstheorie etwas tiefer verstehen wollen.

Englisch

Notation

Formel

nicht A

P(¬ A)

=

1 - P(A)

A oder B

P(A ∪ B)

=

P(A) + P(B) - P(A ∩ B)

A und B

P(A ∩ B)

=

P(A|B) P(B)