Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Statistische Theorie: Ein Auftakt

Der Teil über die statistische Theorie ist bei weitem der theoretischste. Er sich konzentriert auf die Theorie der statistischen Inferenz. In den nächsten drei Kapiteln möchte ich Ihnen eine Einführung in die Wahrscheinlichkeitsrechnung, die Stichprobenbildung und Schätzung (Kapitel Schätzen unbekannter Größen anhand einer Stichprobe) und die statistische Hypothesenprüfung (Kapitel Das Überprüfen von Hypothesen) geben. Bevor wir jedoch loslegen, möchte ich etwas zum großen Ganzen sagen. Bei der statistischen Inferenz geht es in erster Linie darum, aus Daten zu lernen. Das Ziel besteht nicht mehr nur darin, unsere Daten zu beschreiben, sondern die Daten zu nutzen, um Schlussfolgerungen über die Welt zu ziehen. Um die Diskussion zu motivieren, möchte ich kurz auf ein philosophisches Rätsel eingehen, das als Rätsel der Induktion bekannt ist, weil es ein Problem anspricht, das im Laufe des Buches immer wieder auftauchen wird: Statistische Schlussfolgerungen beruhen auf Annahmen. Das klingt nach einer schlechten Sache. Im Alltag sagt man Dinge wie „man sollte niemals Annahmen treffen“, und im Psychologieunterricht werden Annahmen und Vorurteile oft als etwas Schlechtes bezeichnet, das man vermeiden sollte. Aus bitterer persönlicher Erfahrung habe ich gelernt, solche Dinge nie in Gegenwart von Philosophen zu sagen!

Über die Grenzen des logischen Denkens

Die ganze Kunst des Krieges besteht darin, vorherzusehen, was auf der anderen Seite des Hügels liegt, oder, mit anderen Worten, aus dem, was wir wissen, das zu lernen, was wir nicht wissen.

—Arthur Wellesley, 1st Duke of Wellington

Mir wurde gesagt, dass das obige Zitat als Folge einer Kutschenfahrt über das Land entstand. Er und sein Begleiter, J. W. Croker, spielten ein Ratespiel, bei dem jeder versuchte, vorherzusagen, was sich auf der anderen Seite eines jeden Hügels befinden würde. In jedem Fall stellte sich heraus, dass Wellesley Recht hatte und Croker im Unrecht war. Als Wellesley viele Jahre später zu diesem Spiel befragt wurde, erklärte er, dass „die ganze Kunst des Krieges darin besteht, vorherzusehen, was sich auf der anderen Seite des Hügels befindet“. In der Tat ist der Krieg in dieser Hinsicht nichts Besonderes. Das ganze Leben ist in der einen oder anderen Form ein Ratespiel, und um im Alltag zurechtzukommen, müssen wir gut raten. Lassen Sie uns also selbst ein Ratespiel spielen.

Nehmen wir an, Sie und ich beobachten den Wettbewerb zwischen Wellesley und Croker und müssen nach jeweils drei Hügeln vorhersagen, wer die nächste gewinnen wird, Wellesley oder Croker. Nehmen wir an, dass W auf einen Sieg von Wellesley und C auf einen Sieg von Croker hinweist. Nach drei Hügeln sieht unser Datensatz wie folgt aus:

WWW

Unser Gespräch verlief folgendermaßen:

Drei hintereinander bedeuten nicht viel. Ich nehme an, Wellesley könnte besser sein als Croker, aber vielleicht ist es auch nur Glück. Trotzdem, ich bin ein kleiner Spieler. Ich setze auf Wellesley. Ich stimme zu, dass drei hintereinander nicht aussagekräftig sind, und ich sehe keinen Grund, Wellesleys Vermutungen gegenüber denen von Croker zu bevorzugen. Zu diesem Zeitpunkt kann ich eine Wette nicht rechtfertigen. Tut mir leid. Keine Wette für mich.

Ihr Glücksspiel hat sich ausgezahlt: Drei weitere Hügel werden passiert und Wellesley gewinnt alle drei. In der nächsten Runde unseres Spiels steht es 1:0 für Sie und unser Datensatz sieht wie folgt aus:

WWW WWW

Ich habe die Daten in Dreierblöcken angeordnet, damit Sie sehen können, welcher Block den Beobachtungen entspricht, die wir bei jedem Schritt in unserem kleinen Spiel zur Verfügung hatten. Nachdem wir einen neuen Block gesehen haben, geht unser Gespräch weiter:

Sechs Siege in Folge für Duke Wellesley. Das kommt mir langsam etwas verdächtig vor. Ich bin mir immer noch nicht sicher, aber ich rechne damit, dass er auch die nächste Runde gewinnen wird. Ich glaube, das sehe ich nicht. Sicher, ich stimme zu, dass Wellesley sechsmal in Folge gewonnen hat, aber ich sehe keinen logischen Grund, warum das bedeutet, dass er auch das siebte Mal gewinnen wird. Keine Wette. Glauben Sie das wirklich? Na gut, aber meine Wette hat beim letzten Mal funktioniert und ich bin mit meiner Entscheidung zufrieden.

Zum zweiten Mal hatten Sie Recht, und zum zweiten Mal lag ich falsch. Wellesley gewinnt auch die nächsten drei Hügel und baut seine Siegesserie gegen Croker auf 9:0 aus. Der Datensatz, der uns zur Verfügung steht, ist nun der folgende:

WWW WWW WWW

Und unser Gespräch setzt sich folgendermaßen fort:

Okay, jetzt ist es ziemlich offensichtlich: Wellesley ist viel besser in diesem Spiel. Wir sind uns beide einig, dass er den nächsten Hügel gewinnen wird, oder? Gibt es dafür wirklich einen logischen Beweis? Bevor wir mit dem Spiel begannen, gab es viele Möglichkeiten für die ersten 10 Ergebnisse, und ich hatte keine Ahnung, was zu erwarten war. WWW WWW WWW W war eine Möglichkeit, aber auch WCC CWC WWC C und WWW WWW WWW C oder sogar CCC CCC CCC C. Weil ich keine Ahnung hatte, was passieren würde, hätte ich gesagt, dass sie alle gleich wahrscheinlich sind. Ich nehme an, du hättest das auch getan, oder? Ich meine, das ist es doch, was es bedeutet zu sagen, dass man „keine Ahnung“ hat, oder? Ich nehme an, ja. Nun denn, die Beobachtungen, die wir gemacht haben, schließen logischerweise alle Möglichkeiten aus, außer zwei: WWW WWW WWW C oder WWW WWW WWW W. Beides stimmt mit den bisher gefundenen Belegen überein, nicht wahr? Ja, natürlich sind sie das. Worauf wollen Sie hinaus? Was hat sich denn geändert? Zu Beginn unseres Spiels hätten Sie mir zugestimmt, dass beide Möglichkeiten gleichermaßen plausibel sind und keine der Belege, auf die wir gestoßen sind, einen Unterschied zwischen diesen beiden Möglichkeiten gemacht hat. Daher sind beide Möglichkeiten gleich plausibel, und ich sehe keinen logischen Grund, die eine der anderen vorzuziehen. Ja, ich stimme Ihnen zwar zu, dass Wellesleys Serie von 9 Siegen in Folge bemerkenswert ist, aber mir fällt kein Grund ein, warum er den 10 nicht gewinnen sollte. Keine Wette. Ich verstehe, was Sie meinen, aber ich bin trotzdem bereit, es zu riskieren. Ich setze auf Wellesley.

Wellesleys Siegesserie hält für die nächsten drei Hügel an. Der Spielstand im Spiel Wellesley-Croker ist jetzt 12:0, und der Spielstand in unserem Spiel ist jetzt 3:0. Wir nähern uns der vierten Runde unseres Spiels und unser Datensatz ist der folgende:

WWW WWW WWW WWW

und das Gespräch geht weiter:

Oh ja! Drei weitere Siege für Wellesley und ein weiterer Sieg für mich. Gib zu, ich hatte Recht mit ihm! Diesmal setzen wir wohl beide auf Wellesley, oder? Ich weiß nicht, was ich denken soll. Ich habe das Gefühl, dass wir uns in der gleichen Situation befinden wie in der letzten Runde, und dass sich nicht viel geändert hat. Es gibt nur zwei legitime Möglichkeiten für eine Folge von 13 Hügeln, die nicht bereits ausgeschlossen wurden: WWW WWW WWW WWW C und WWW WWW WWW WWW W. Es ist genau so, wie ich beim letzten Mal gesagt habe. Wenn alle möglichen Ergebnisse vor Beginn des Spiels gleich vernünftig waren, sollten diese beiden dann nicht auch jetzt gleich vernünftig sein, da unsere Beobachtungen keines von beiden ausschließen? Ich stimme zu, dass es sich so anfühlt, als ob Wellesley eine erstaunliche Siegesserie hat, aber wo ist der logische Beweis, dass die Serie anhalten wird? Ich denke, Sie sind unvernünftig. Warum werfen Sie nicht einen Blick auf unsere Gewinne, wenn Sie Beweise brauchen? Sie sind der Statistik-Experte und haben diese ausgeklügelte logische Analyse verwendet, aber Tatsache ist, dass Sie verlieren. Ich verlasse mich einfach auf meinen gesunden Menschenverstand und gewinne. Vielleicht solltest du doch deine Strategie ändern. Hmm, das ist ein gutes Argument, und ich möchte das Spiel nicht verlieren, aber ich fürchte, ich sehe keinen logischen Beweis dafür, dass deine Strategie besser ist als meine. Ich habe den Eindruck, dass jemand, der unser Spiel beobachtet hat, eine Serie von drei Siegen für Sie beobachtet hätte. Ihre Daten würden wie folgt aussehen: YYY. Logischerweise sehe ich hier keinen Unterschied zu unserer ersten Runde, in der wir Wellesley und Croker beobachtet haben. Drei Siege scheinen Ihnen nicht viel zu bedeuten, und ich sehe keinen Grund zu der Annahme, dass Ihre Strategie besser funktioniert als meine. Wenn ich damals nicht dachte, dass WWW ein guter Beweis dafür war, dass Wellesley bei ihrem Spiel besser war als Croker, habe ich jetzt keinen Grund zu glauben, dass YYY ein guter Beweis dafür ist, dass Sie besser sind in * Ihrem*? Okay, jetzt halte ich dich für einen Idioten. Ich sehe keinen logischen Beweis dafür.

Lernen, ohne Annahmen zu treffen, ist ein Mythos

Es gibt viele verschiedene Möglichkeiten, diesen Dialog zu analysieren, aber da dies ein Statistikbuch ist, das sich an Psychologen richtet, und keine Einführung in die Philosophie und Psychologie des Denkens, werde ich mich kurzfassen. Was ich oben beschrieben habe, wird manchmal als das Rätsel der Induktion bezeichnet. Es scheint völlig vernünftig zu sein, zu glauben, dass eine 12:0-Siegesserie von Wellesley ein ziemlich starker Beleg dafür ist, dass er das 13. Spiel gewinnen wird, aber es ist nicht einfach, eine angemessene logische Begründung für diesen Glauben zu liefern. Im Gegenteil, trotz der Offensichtlichkeit der Antwort ist es nicht möglich, eine Wette auf Wellesley zu rechtfertigen, ohne sich auf eine Annahme zu stützen, für die man keine logische Begründung hat.

Das Rätsel der Induktion wird vor allem mit der philosophischen Arbeit von David Hume und in jüngerer Zeit von Nelson Goodman in Verbindung gebracht. Man findet aber auch Beispiele für das Problem in so unterschiedlichen Bereichen wie der Literatur (Lewis Carroll) und dem maschinellen Lernen (das „No free lunch“-Theorem). Der Versuch, „von dem, was wir wissen, auf das zu schließen, was wir nicht wissen“, hat wirklich etwas Seltsames an sich. Der entscheidende Punkt ist, dass Annahmen und Vorurteile unvermeidlich sind, wenn man etwas über die Welt lernen will. Daran führt kein Weg vorbei, und das gilt für statistische Schlussfolgerungen ebenso wie für das menschliche Denken. In dem Dialog zielte ich auf Ihre durchaus vernünftigen Schlussfolgerungen als Mensch ab, aber der gesunde Menschenverstand, auf den Sie sich stützten, unterscheidet sich nicht von dem, was ein Statistiker getan hätte. Ihr „gesunder Menschenverstand“ stützte sich in der Hälfte des Dialogs auf die implizite Annahme, dass zwischen Wellesley und Croker ein gewisser Unterschied in den Fähigkeiten besteht, und Sie versuchten herauszufinden, wie hoch dieser Unterschied in den Fähigkeiten sein könnte. Meine „logische Analyse“ verwirft diese Annahme völlig. Ich war lediglich bereit zu akzeptieren, dass es eine Abfolge von Siegen und Niederlagen gibt und dass ich nicht weiß, welche Abfolgen zu beobachten sind. Während des gesamten Dialogs beharrte ich darauf, dass alle logisch möglichen Datensätze zu Beginn des Wellesely-Croker-Spiels gleichermaßen plausibel waren, und dass die einzige Möglichkeit, meine Überzeugungen zu revidieren, darin besteht, diejenigen Möglichkeiten zu eliminieren, die mit den Beobachtungen faktisch unvereinbar sind.

Das klingt für sich genommen völlig vernünftig. Tatsächlich klingt es sogar wie das Markenzeichen einer guten deduktiven Argumentation. Wie Sherlock Holmes wollte ich das Unmögliche ausschließen, in der Hoffnung, dass das, was übrig bleibt, die Wahrheit ist. Doch wie wir gesehen haben, hat mich das Ausschließen des Unmöglichen niemals zu einer Vorhersage geführt. An sich war alles, was ich in meiner Hälfte des Dialogs gesagt habe, völlig richtig. Die Unfähigkeit, Vorhersagen zu treffen, ist die logische Folge davon, „keine Annahmen“ zu treffen. Am Ende habe ich unser Spiel verloren, weil Sie einige Annahmen getroffen haben und diese sich als richtig erwiesen haben. Geschicklichkeit ist eine reale Sache, und weil Sie an die Existenz von Geschicklichkeit glaubten, konnten Sie erfahren, dass Wellesley mehr davon hatte als Croker. Hätten Sie sich auf eine weniger sinnvolle Annahme gestützt, hätten Sie das Spiel vielleicht nicht gewonnen.

Letztendlich gibt es zwei Dinge, die Sie aus diesen Überlegungen mitnehmen sollten. Erstens: Wie ich schon sagte, kommt man nicht umhin, Annahmen zu treffen, wenn man etwas aus seinen Daten lernen will. Und zweitens: Sobald Sie erkennen, dass Annahmen notwendig sind, wird es wichtig, sicherzustellen, dass Sie die richtigen Annahmen treffen! Eine Datenanalyse, die sich auf wenige Annahmen stützt, ist nicht notwendigerweise besser als eine, die viele Annahmen macht. Es hängt alles davon ab, ob diese Annahmen gut zu Ihren Daten passen. Im weiteren Verlauf dieses Buches werde ich oft auf die Annahmen hinweisen, die einer bestimmten statistischen Technik zugrunde liegen, und darauf, wie Sie überprüfen können, ob diese Annahmen sinnvoll sind.