Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Weitere nützliche Verteilungen

Die Normalverteilung ist die Verteilung, die in der Statistik am häufigsten verwendet wird (aus Gründen, die in Kürze erläutert werden), und auch die Binomialverteilung ist für viele Zwecke sehr nützlich. Aber die Welt der Statistik ist voll von Wahrscheinlichkeitsverteilungen, von denen wir einige nur am Rande kennenlernen werden. Die drei, die in diesem Buch vorkommen werden, sind die t-Verteilung, die χ²-Verteilung und die F-Verteilung. Ich werde keine Formeln für diese Verteilungen angeben oder zu detailliert auf sie eingehen, aber ich werde Ihnen einige Bilder zeigen.

  • Die t-Verteilung ist eine kontinuierliche Verteilung, die einer Normalverteilung sehr ähnlich sieht, siehe Abb. 52. Beachten Sie, dass die „Ausläufer“ der t-Verteilung „schwerer“ sind (d.h. sie reichen weiter nach außen) als die Schwänze der Normalverteilung. Das ist der wichtigste Unterschied zwischen den beiden. Die t-Verteilung wird in der Regel in Situationen verwendet, in denen man denkt, dass die Daten tatsächlich einer Normalverteilung folgen, man aber weder den „wahren“ Mittelwert noch die Standardabweichung (in der Population) kennt. Wir werden dieser Verteilung in Kapitel Vergleich zweier Mittelwerte wieder begegnen.

*t*-Verteilung mit *df* = 3 im Vergleich zu einer Normalverteilung

Abb. 52 t-Verteilung mit 3 Freiheitsgraden (df; durchgezogene Linie). Sie sieht einer Normalverteilung sehr ähnlich, ist aber nicht ganz dasselbe. Zum Vergleich habe ich eine Standard-Normalverteilung als gestrichelte Linie eingezeichnet.

  • Die χ²-Verteilung ist eine weitere Verteilung, die oft verwendet wird. Die Situation, in der wir sie sehen werden, ist bei der Analyse kategorialer Daten, aber sie ist eines dieser Dinge, die eigentlich überall auftauchen. Wenn man sich in die Mathematik vertieft (und wer tut das nicht gerne?), stellt sich heraus, dass der Hauptgrund, warum die χ²-Verteilung überall auftaucht. Das liegt darin, dass, wenn die Werte einer Reihe normalverteilter Variablen quadriert und dann addiert werden (was als „Quadratsumme“ bezeichnet wird), diese Summe eine χ²-Verteilung hat. Sie werden erstaunt sein, wie oft sich diese Tatsache als nützlich erweist. Wie auch immer, Abb. 53 veranschaulicht, wie eine χ²-Verteilung aussieht.

χ²-Verteilung mit *df* = 3

Abb. 53 χ²-Verteilung mit 3 Freiheitsgraden. Die wichtigsten Merkmale einer χ²-Verteilung sind, dass die beobachteten Werte immer größer als Null sein müssen und dass die Verteilung ziemlich schief ist.

  • Die F-Verteilung sieht ein bisschen wie eine χ²-Verteilung aus. Sie wird immer dann verwendet, wenn man zwei χ²-Verteilungen miteinander vergleichen muss. Obwohl das nicht gerade nach etwas klingt, das ein vernünftiger Mensch tun möchte, ist es in der realen Welt der Datenanalyse äußerst wichtig. Erinnern Sie sich, als ich sagte, dass χ² die Schlüsselverteilung ist, wenn wir eine „Quadratsumme“ berechnen? Wenn Sie zwei verschiedene „Quadratsummen“ vergleichen wollen, bedeutet das, dass Sie, wahrscheinlich über etwas sprechen, das eine F-Verteilung hat. Natürlich habe ich Ihnen noch kein Beispiel für etwas gegeben, das eine Quadratsumme beinhaltet, aber das werde ich in Kapitel Vergleich mehrerer Mittelwerte (einfaktorielle ANOVA) machen. Und da werden wir auch wieder auf die F-Verteilung stoßen. Oh, und es gibt ein Bild in Abb. 54.

*F*-Verteilung mit *df* = 3 und *df* = 5

Abb. 54 F-Verteilung mit 3 und 5 Freiheitsgraden. Obwohl sie einer χ²-Verteilung ziemlich ähnlich sieht, sie sind die beiden Verteilungen aber nicht dasselbe.

Es ist Zeit, diesen Abschnitt abzuschließen. Wir haben drei weitere Verteilungen kennengelernt: t, χ² und F. Es handelt sich bei allen dreien um kontinuierliche Verteilungen, die eng mit der Normalverteilung verwandt sind. Die Hauptsache für unsere Zwecke ist, dass Sie die Grundidee begreifen, dass diese Verteilungen alle eng miteinander und mit der Normalverteilung verwandt sind. Später in diesem Buch werden wir auf Daten stoßen, die normalverteilt sind (oder von denen zumindest angenommen wird, dass sie normalverteilt sind). Wenn Sie davon ausgehen, dass Ihre Daten normalverteilt sind, sollten Sie sich nicht wundern, wenn die Verteilungen t-, χ²- und F-überall auftauchen, wenn Sie versuchen, Ihre Daten zu analysieren.