Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Deskriptive Statistik

Jedes Mal, wenn Sie einen neuen Datensatz zur Untersuchung erhalten, besteht eine der ersten Aufgaben darin, Wege zu finden, die Daten in einer kompakten, leicht verständlichen Weise zusammenzufassen. Darum geht es bei deskriptiver Statistik (im Gegensatz zu inferentieller Statistik). Für viele Menschen ist der Begriff „Statistik“ ein Synonym für deskriptive Statistik. Mit diesem Thema werden wir uns in diesem Kapitel beschäftigen. Aber bevor wir ins Detail gehen, sollten wir uns einen Moment Zeit nehmen, um zu verstehen, warum wir deskriptive Statistiken brauchen. Dazu öffnen wir den Datensatz aflsmall_margins und sehen nach, welche Variablen in der Datei (Abb. 19) gespeichert sind.

Variablen, die in ``aflsmall margins`` gespeichert sind

Abb. 19 jamovi-Screenshot mit den Variablen aus dem Datensatz aflsmall_margins

In der Tat gibt es hier nur eine Variable, afl.margins. Wir werden uns in diesem Kapitel auf diese Variable konzentrieren. Im Gegensatz zu den meisten Datensätzen in diesem Buch handelt es sich hier um echte Daten aus der Australian Football League (AFL).[1] Die Variable afl.margins enthält die Gewinnspanne (Anzahl der Punkte) für alle 176 Heim- und Auswärtsspiele der Saison 2010.

Diese Ausgabe macht es eher schwer, ein Gefühl dafür zu bekommen, was die Daten tatsächlich aussagen. Das bloße „Anschauen der Daten“ ist keine besonders effektive Methode, um Daten zu verstehen. Um eine Vorstellung davon zu bekommen, was die Daten tatsächlich aussagen, müssen wir einige deskriptive Statistiken berechnen (dieses Kapitel) und einige Grafiken erstellen (Kapitel Diagramme erstellen). Da die deskriptive Statistik das einfachere der beiden Themen ist, fange ich mit ihr an, aber ich zeige Ihnen trotzdem ein Histogramm der Variable afl.margins, da es Ihnen helfen soll, ein Gefühl dafür zu bekommen, wie die Daten, die wir zu beschreiben versuchen, tatsächlich aussehen, siehe Abb. 20. Wir werden noch viel mehr darüber reden, wie man Histogramme zeichnet. Im Moment reicht es aus, sich das Histogramm anzusehen und festzustellen, dass es eine ziemlich interpretierbare Darstellung der Variablen afl.margins liefert.

Histogramm der Gewinnspanne der AFL 2010 (die Variable ``afl.margins``)

Abb. 20 Histogramm der Gewinnspanne in der AFL 2010 (die Variable afl.margins). Wie zu erwarten, sind höhere Gewinnspannen seltener zu sehen.