Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Die Grundlagen lernen, und zwar in jamovi

Okay, das war eine wirklich lange Liste. Und selbst diese Liste ist noch äußerst unvollständig. Es gibt wirklich eine Menge wichtiger Ideen in der Statistik, die ich in diesem Buch nicht behandelt habe. Es kann ziemlich deprimierend sein, ein fast 500-seitiges Lehrbuch zu beenden, nur um zu erfahren, dass dies erst der Anfang ist. Das gilt vor allem dann, wenn man anfängt zu vermuten, dass die Hälfte der Dinge, die man gelernt hat, falsch ist. So gibt es zum Beispiel viele Fachleute, die sich gegen die Verwendung der klassischen Varianzanalyse aussprechen, doch ich habe ihm zwei ganze Kapitel gewidmet! Die Standard-Varianzanalyse kann aus einer Bayesschen Perspektive oder aus einer Perspektive der robusten Statistik angegriffen werden, oder sogar aus einer Perspektive, die besagt, dass sie schlichtweg falsch ist (die Leute verwenden sehr häufig Varianzanalyse, obwohl sie eigentlich gemischte Modelle verwenden sollten). Warum sollte man sie also überhaupt lernen?

Meines Erachtens gibt es zwei Hauptargumente. Erstens ist da das reine Pragmatismus-Argument. Ob zu Recht oder zu Unrecht, die Varianzanalyse ist weit verbreitet. Wenn man die wissenschaftliche Literatur verstehen will, muss man die Varianzanalyse verstehen. Und zweitens gibt es das Argument des „inkrementellen Wissens“: Genauso wie es nützlich war, die Varianzanalyse mit einem Faktor zu kennen, bevor man die (mehr-)faktorielle Varianzanalyse erlernt, ist das Verständnis der Varianzanalyse hilfreich, um fortgeschrittenere Methoden zu verstehen: Viele dieser Methoden bauen auf die Varianzanalyse auf, sie verändern oder erweitern sie aber in irgendeiner Weise. Obwohl beispielsweise gemischte Modelle viel nützlicher sind als Varianzanalyse und Regression, habe ich noch nie von jemandem gehört, der gelernt hat, wie gemischte Modelle funktionieren, ohne zuvor Varianzanalyse und Regression durchgenommen zu haben. Man muss erst krabbeln lernen, bevor man einen Berg besteigen kann.

Ich möchte diesen Punkt sogar noch ein wenig weiter ausführen. Eine Sache, die ich in diesem Buch sehr oft behandelt habe, sind die Grundlagen. Ich habe viel Zeit auf die Wahrscheinlichkeitstheorie verwendet. Ich habe die Theorie der Schätzung und der Hypothesentests ausführlicher behandelt, als es nötig gewesen wäre. Warum habe ich das alles getan? Im Nachhinein könnte man sich fragen, ob ich wirklich so viel Zeit damit verbringen musste, darüber zu sprechen, was eine Wahrscheinlichkeitsverteilung ist, oder warum es überhaupt einen Abschnitt über die Wahrscheinlichkeitsdichte gab. Wenn das Ziel des Buches darin bestand, Ihnen beizubringen, wie man einen t-Test oder eine Varianzanalyse durchführt, war das alles wirklich notwendig? War das alles nur eine riesige Zeitverschwendung für alle?

Die Antwort ist, wie Sie hoffentlich zustimmen werden, nein. Das Ziel eines einführenden Statistikkurses ist nicht, die Varianzanalyse zu lehren. Es geht nicht darum, t-Tests, Regressionen, Histogramme oder p-Werte zu lehren. Das Ziel ist es, Ihnen zu helfen, ein qualifizierter Daten-Analytiker zu werden, und hierfür müssen Sie mehr können als die Varianzanalyse, t-Tests, Regressionen und Histogramme. Sie müssen in der Lage sein, richtig über Daten zu denken. Sie müssen in der Lage sein, die fortgeschrittenen statistischen Modelle zu erlernen, über die ich im letzten Abschnitt gesprochen habe, und die Theorie zu verstehen, auf der sie beruhen. Und Sie müssen Zugang zu Software haben, mit der Sie diese fortgeschrittenen Werkzeuge nutzen können. Und hier zahlt sich, zumindest meiner Meinung nach, all die zusätzliche Zeit aus, die ich in die Grundlagen investiert habe. Wenn Sie die Wahrscheinlichkeitstheorie verstehen, wird es Ihnen viel leichter fallen, von frequentistischen Analysen zu Bayesschen Analysen zu wechseln.

Kurz gesagt, ich denke, dass der große Vorteil für das Erlernen von Statistik auf diese Weise Erweiterbarkeit ist. Für ein Buch, das nur die Grundlagen der Datenanalyse abdeckt, hat dieses Buch einen enormen Overhead in Bezug auf das Erlernen der Wahrscheinlichkeitstheorie und so weiter. Neben den spezifischen Analysen, die das Buch abdeckt, gibt es noch eine ganze Menge anderer Dinge, die Sie lernen müssen. Wenn Ihr Ziel darin bestand, in möglichst kurzer Zeit zu lernen, wie man eine Varianzanalyse durchführt, dann war dieses Buch keine gute Wahl. Aber wie gesagt, ich glaube nicht, dass das Ihr Ziel ist. Ich glaube, Sie wollen lernen, wie man Daten analysiert. Und wenn das wirklich Ihr Ziel ist, dann wollen Sie sicherstellen, dass die Fähigkeiten, die Sie in Ihrem einführenden Statistik-Kurs erlernen, natürlich und sauber auf die komplizierteren Modelle erweiterbar sind, die Sie in der realen Welt der Datenanalyse benötigen. Sie wollen sicherstellen, dass Sie lernen, die gleichen Werkzeuge zu benutzen, die echte Datenanalysten benutzen, damit Sie lernen können, das zu tun, was sie tun. Und ja, okay, Sie sind jetzt ein Anfänger (oder Sie waren es, als Sie mit diesem Buch begannen), aber das bedeutet nicht, dass Sie eine stumpfsinnige Geschichte bekommen sollten, eine Geschichte, in der ich Ihnen nichts über Wahrscheinlichkeitsdichte erzähle, oder eine Geschichte, in der ich Ihnen nichts über den Albtraum der faktoriellen Varianzanalyse mit unbalancierten Designs erzähle. Und es bedeutet auch nicht, dass man Ihnen Babyspielzeug anstelle von geeigneten Datenanalysewerkzeugen geben sollte. Anfänger sind nicht dumm, es fehlt ihnen nur an Wissen. Was Sie brauchen, ist nicht, die Komplexität der Datenanalyse in der realen Welt vor Ihnen zu verbergen. Was Sie brauchen, sind Fähigkeiten und Werkzeuge, mit denen Sie diese Komplexität bewältigen können. Und sie wird Ihnen in der realen Welt unweigerlich auflauern.

Und ich hoffe, dass dieses Buch, oder das fertige Buch, das eines Tages erscheinen wird, Ihnen dabei helfen kann.