Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Schiefe und Kurtosis

Es gibt noch zwei weitere deskriptivstatistische Kenngrößen, die in der psychologischen Literatur gelegentlich genannt werden: Schiefe und Kurtosis. In der Praxis werden beide nicht annähernd so häufig verwendet wie die Maße der zentralen Tendenz und der Variabilität, über die wir gerade gesprochen haben. Die Schiefe ist ziemlich wichtig und wird daher häufig erwähnt, aber ich habe noch nie gesehen, dass die Kurtosis in einem wissenschaftlichen Artikel erwähnt wurde.

Illustration der Schiefe

Abb. 15 Veranschaulichung der Schiefe. Auf der linken Seite haben wir einen negativ schiefen (oder linksschiefen) Datensatz (Schiefe = -,93), in der Mitte einen Datensatz ohne Schiefe (naja, fast ohne: Schiefe = -,006) und auf der rechten Seite einen positiv schiefen (rechtsschiefen) Datensatz (Schiefe = 0,93).

Da sie die interessantere von beiden ist, wollen wir zunächst über die Schiefe sprechen. Die Schiefe ist im Grunde ein Maß für die Asymmetrie und lässt sich am einfachsten durch ein paar Bilder erklären. Wie Abb. 15 veranschaulicht, sagen wir, wenn die Daten dazu neigen, viele extrem kleine Werte zu haben (d.h. der untere Schwanz ist „länger“, als der obere Schwanz) und nicht so viele extrem große Werte (linke Seite), dann sind die Daten negativ schief (linksschief). Gibt es dagegen mehr extrem große Werte als extrem kleine (rechte Seite), dann sind die Daten positiv schief (rechtsschief). Das ist die qualitative Idee hinter der Schiefe. Wenn es relativ viele Werte gibt, die weit über dem Mittelwert liegen, ist die Verteilung positiv schief oder rechtsschief, mit einem sich nach rechts erstreckenden Schwanz. Negativ oder linksschief ist das Gegenteil davon. Eine symmetrische Verteilung hat eine Schiefe von 0. Der Wert der Schiefe für eine positiv schiefe Verteilung ist positiv, und ein negativer Wert für eine negativ schiefe Verteilung.

Eine Formel für die Schiefe eines Datensatzes lautet wie folgt

\[\mbox{skewness}(X) = \frac{1}{N \hat{\sigma}^3} \sum_{i=1}^N (X_i - \bar{X})^3\]

wobei N die Anzahl der Beobachtungen, der Stichprobenmittelwert und \(\hat{\sigma}\) die (Populations-)Standardabweichung ist (d.h. die Version „dividiert durch N - 1“).

Vielleicht noch hilfreicher ist, dass Sie jamovi zur Berechnung der Schiefe verwenden können: Setzen Sie die Checkbox Skewness in den Statistics-Optionen von ExplorationDescriptives. Für die Variable afl.margins beträgt der Wert für die Schiefe 0,780. Wenn Sie die Schiefe-Schätzung durch den Std.-Fehler für die Schiefe teilen, erhalten Sie einen Hinweis darauf, wie schief die Daten sind. Eine Faustregel besagt, dass insbesondere bei kleinen Stichproben (N < 50) ein Wert von 2 oder weniger bedeuten kann, dass die Daten nicht sehr schief sind, und dass ein Wert von über 2 bedeutet, dass die Daten so schief sind, dass ihre Verwendung in einigen statistischen Analysen möglicherweise eingeschränkt ist. Es besteht jedoch keine eindeutige Einigkeit über diese Interpretation. Dennoch zeigt dies, dass die Daten in der afl.margins-Variable etwas verzerrt sind (0,780 / 0,183 = 4,262).

Das letzte Maß, auf das manchmal verwiesen wird, obwohl es in der Praxis sehr selten vorkommt, ist die Kurtosis eines Datensatzes. Einfach ausgedrückt ist die Kurtosis ein Maß dafür, wie dünn oder dick die Ausläufer (Schwänze) einer Verteilung sind, wie in Abb. 16 dargestellt. Vereinbarungsgemäß sagt man, dass die „Normalkurve“ (schwarze Linien) eine Kurtosis von Null aufweist, und der Grad der Kurtosis wird relativ zu dieser Kurve bewertet.

Illustration der Kurtosis

Abb. 16 Eine Illustration der Kurtosis. Auf der linken Seite haben wir eine „platykurtische“ Verteilung (Kurtosis = -0,95), was bedeutet, dass die Verteilung „dünne“ oder flache Ausläufer (oder Schwänze) hat. In der Mitte haben wir eine „mesokurtische“ Verteilung (Kurtosis ist fast genau 0), was bedeutet, dass die Ausläufer weder dünn noch dick sind. Auf der rechten Seite schließlich haben wir eine „leptokurtische“ Verteilung (Kurtosis = 2,12), die anzeigt, dass die Verteilung „dicke“ Enden hat. Beachten Sie, dass die Kurtosis in Bezug auf eine Normalverteilung (schwarze Linie) gemessen wird.

Die Daten im linken Feld von Abb. 16 haben eine ziemlich flache Verteilung mit dünnen Ausläufern, daher ist die Kurtosis negativ und wir nennen die Daten platykurtisch. Die Daten im rechten Feld haben eine Verteilung mit dicken Ausläufern, so dass die Kurtosis positiv ist und wir sagen, dass die Daten leptokurtisch sind. Nur die Daten im mittleren Feld haben weder dünne noch dicke Ausläufer, so dass wir sagen, dass sie mesokurtisch sind und eine Wölbung von Null haben. Dies wird in der nachstehenden Tabelle zusammengefasst:

informeller Begriff

Bezeichnung

Kurtosis-Wert

„Ausläufer zu dünn“

platykurtisch

negativ

„Ausläufer weder dünn noch dick“

mesokurtisch

Null

„Ausläufer zu dick“

leptokurtisch

positiv

Die Gleichung für die Kurtosis ist den Formeln, die wir bereits für die Varianz und die Schiefe gesehen haben, sehr ähnlich. Nur dass es sich bei der Varianz um quadratische Abweichungen und bei der Schiefe um kubische Abweichungen handelt, während bei der Kurtosis die Abweichungen auf die vierte Potenz angehoben werden müssen:[1]

\[\mbox{kurtosis}(X) = \frac{1}{N \hat\sigma^4} \sum_{i=1}^N \left( X_i - \bar{X} \right)^4 - 3\]

Ich weiß, für mich ist das auch nicht sonderlich interessant.

jamovi hat eine Checkbox für Kurtosis direkt unter der Checkbox für die Schiefe (Skewness), und dies ergibt einen Wert von 0,101 für die Kurtosis mit einem Standardfehler von 0,364. Dies bedeutet, dass die afl.margins-Variable nur eine geringe Kurtosis aufweist, was in Ordnung ist.