Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Zusammenfassung

Die Berechnung einiger grundlegender deskriptiver Statistiken gehört zu den allerersten Dingen, die man bei der Analyse realer Daten macht, und deskriptivstatistische Maße sind viel einfacher zu verstehen als inferentielle Statistik. Daher habe ich wie jedes andere Statistiklehrbuch mit deskriptivstatistischen Maßen begonnen. In diesem Kapitel haben wir über die folgenden Themen gesprochen:

  • Maße der zentralen Tendenz: Im Großen und Ganzen geben die Maße der zentralen Tendenz Auskunft darüber, wo die Daten liegen. In der Literatur werden in der Regel drei Maße angegeben: der Mittelwert, der Median und der Modus.

  • Maße der Variabilität: Im Gegensatz dazu geben Variabilitätsmaße Auskunft darüber, wie „gestreut“ die Daten sind. Die wichtigsten Maße sind: Spannweite, Standardabweichung und Interquartilsabstand.

  • Schiefe und Kurtosis: Wir haben auch die Asymmetrie in der Verteilung einer Variablen (Schiefe) und die Kurtosis untersucht.

  • Nach Gruppen unterteilte deskriptivstatistische Analysen: Da sich dieses Buch auf die Datenanalyse in jamovi konzentriert, haben wir ein wenig Zeit damit verbracht, darüber zu sprechen, wie deskriptivstatistische Maße für verschiedene Untergruppen berechnet werden können.

  • Standardwerte: Der z-Wert ist ein etwas ungewöhnliches Biest. Er ist weder ein richtiges deskriptivstatistisches Maß noch eine Inferenzstatistik. Vergewissern Sie sich, dass Sie diesen Abschnitt verstehen. Er wird später wieder auftauchen.

Im nächsten Kapitel werden wir uns damit beschäftigen, wie man Diagramme erstellt! Jeder liebt doch ein schönes Bild, oder? Doch bevor wir das tun, möchte ich auf einen wichtigen Punkt eingehen. In einem herkömmlichen Grundkurs in Statistik wird nur ein kleiner Teil der Unterrichtszeit für deskriptive Statistik verwendet, vielleicht ein oder zwei Vorlesungen. Die überwiegende Mehrheit der Zeit des Dozenten wird auf die Inferenzstatistik verwendet, weil dort der ganze schwierige Stoff liegt. Das macht Sinn, aber es verdeckt die praktische, alltägliche Bedeutung der Auswahl guter deskriptivstatischer Maße. In diesem Sinne…

Epilog: Gute deskriptivstatistische Maße sind anschaulich!

Der Tod eines Menschen ist eine Tragödie.
Der Tod von Millionen von Menschen ist eine statistische Größe.

—Josef Stalin, Potsdam 1945

950.000 - 1.200.000

—Schätzung der Todesfälle durch sowjetische Repressionen, 1937-1938 (Ellman, 2002)

Stalins berühmt-berüchtigtes Zitat über den statistischen Charakter des Todes von Millionen von Menschen ist eine Überlegung wert. Seine Aussage zielt eindeutig darauf ab, dass der Tod eines Einzelnen uns persönlich berührt und seine Wucht nicht geleugnet werden kann, dass aber der Tod einer Vielzahl von Menschen schwer fassbar ist und folglich oft einen mehr statistischen Charakter hat und leichter zu ignorieren ist. Ich würde sagen, dass Stalin zur Hälfte Recht hatte. Eine Statistik ist eine Abstraktion, eine Beschreibung von Ereignissen, die jenseits unserer persönlichen Erfahrung liegen, und daher schwer zu veranschaulichen. Nur wenige von uns können sich vorstellen, wie der Tod von Millionen von Menschen „wirklich“ ist, aber wir können uns einen einzelnen Tod vorstellen, und das gibt dem einzelnen Tod das Gefühl einer unmittelbaren Tragödie, ein Gefühl, das in Ellmans kalter statistischer Beschreibung fehlt.

Doch so einfach ist es nicht. Ohne Zahlen, ohne Zählungen, ohne eine Beschreibung dessen, was geschehen ist, haben wir keine Chance zu verstehen, was wirklich geschehen ist, keine Möglichkeit, auch nur zu versuchen, das fehlende Gefühl aufzurufen. Und in der Tat, während ich dies schreibe, sitze ich an einem Samstagmorgen bequem und ungestört, eine halbe Welt und ein ganzes Leben von den Gulags entfernt. Wenn ich die Ellman-Schätzung neben das Stalin-Zitat stelle, macht sich ein dumpfes Grauen in meinem Magen breit und ein Schauer überläuft mich. Die stalinistische Unterdrückung ist etwas, das wirklich jenseits meiner Erfahrung liegt, aber mit einer Kombination aus statistischen Daten und den uns überlieferten persönlichen Geschichten ist sie nicht völlig jenseits meines Verständnisses. Denn Ellmans Zahlen sagen uns Folgendes: In einem Zeitraum von zwei Jahren hat die stalinistische Repression das Äquivalent eines jeden Mannes, einer jeden Frau und eines jeden Kindes ausgelöscht, die derzeit in der Stadt, in der ich lebe, leben. Jeder dieser Todesfälle hatte seine eigene Geschichte, war seine eigene Tragödie, und nur einige davon sind uns heute bekannt. Doch mit einigen sorgfältig ausgewählten Statistiken wird das Ausmaß der Gräueltaten deutlich.

Daher ist es keine Kleinigkeit zu sagen, dass die erste Aufgabe des Statistikers und des Wissenschaftlers darin besteht, die Daten zusammenzufassen, und Zahlen und Maße auszuwählen, die einem Publikum ein Gefühl dafür vermitteln, was geschehen ist. Das ist die Aufgabe der deskriptiven Statistik, aber es ist keine Aufgabe, die sich allein anhand von Zahlen erzählen lässt. Sie sind ein Datenanalytiker und kein statistisches Softwarepaket. Ein Teil Ihrer Aufgabe besteht darin, diese Statistiken in eine Beschreibung umzuwandeln. Wenn Sie Daten analysieren, reicht es nicht aus, eine Sammlung von Zahlen aufzulisten. Denken Sie immer daran, dass Sie eigentlich versuchen, mit einem menschlichen Publikum zu kommunizieren. Die Zahlen sind wichtig, aber sie müssen zu einer aussagekräftigen Geschichte zusammengefügt werden, die Ihr Publikum interpretieren kann. Das bedeutet, dass Sie sich Gedanken über den Rahmen machen müssen. Sie müssen über den Kontext nachdenken. Und Sie müssen sich Gedanken über die einzelnen Ereignisse machen, die Ihre Statistiken zusammenfassen.