Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Prolog

Dieses Buch wurde durch den Buchstaben R und das Wort jamovi zu Ihnen gebracht.

Übersicht

learning statistics with jamovi deckt den Inhalt einer einführenden Statistikvorlesung ab, wie sie typischerweise für Psychologiestudenten im Grundstudium angeboten wird. Es ist auch als Lehrbuch erhältlich. Es behandelt den Einstieg in jamovi und gibt eine Einführung in die Datenmanipulation. Als statistische Werkzeuge behandelt das Buch zunächst deskriptive Statistik und Grafik, gefolgt von Kapiteln über Wahrscheinlichkeitstheorie, Stichprobenziehung und Schätzung sowie Nullhypothesen-Tests. Nach einer Einführung in die Theorie behandelt das Buch die Analyse von Kreuztabellen, Korrelation, t-Tests, Regression, ANOVA und die Faktorenanalyse. Am Ende des Buches gibt ein kurzes Kapitel eine Einführung in die Bayessche Statistik.

Referenz

Navarro, D. J., & Foxcroft, D. R. (2022). learning statistics with jamovi: a tutorial for psychology students and other beginners. (Version 0.75). https://doi.org/10.24384/hgc3-7p15

Dieses Buch wird unter einer Creative Commons BY-SA-Lizenz veröffentlicht (CC BY-SA Version 4.0). Das bedeutet, dass dieses Buch wiederverwendet, überarbeitet und weiterverteilt werden kann (auch kommerziell), solange die Autoren erwähnt werden. Wenn Sie die Originalversion dieses Lehrbuchs verändern, müssen Sie Ihre Versionen unter derselben Lizenz weitergeben.

Vorwort

Vorwort zu Version 0.75

In dieser Version haben wir Abbildungen, Zahlen und Texte aktualisiert, um die Kompatibilität mit den neuesten Versionen von jamovi zu gewährleisten. Vielen Dank an Peter Fisk für seine Hilfe dabei. Außerdem wurden einige Abschnitte, die von Lesern vorgeschlagen wurden, überarbeitet und korrigiert. Dazu gehörte vor allem die Korrektur von Tippfehlern, aber auch die Korrektur von konzeptionellen Details, z.B. haben wir die Informationen über Kurtosis aktualisiert, um zu verdeutlichen, dass es bei Kurtosis nicht wirklich um die „Spitzheit“ der Verteilung geht, sondern darum, ob Datenverteilungen dünne oder dicke Ausläufer haben. Vielen Dank an alle Leser, die Vorschläge gemacht haben, indem sie mich entweder per E-Mail kontaktiert oder ein Problem auf Github gemeldet haben.

David Foxcroft
9. Februar 2022

Vorwort zu Version 0.70

Diese Aktualisierung von Version 0.65 führt einige neue Analysen ein. In den ANOVA-Kapiteln wurden die Abschnitte zur ANOVA mit wiederholten Messungen und zur Kovarianzanalyse (ANCOVA) hinzugefügt. In einem neuen Kapitel wird die Faktorenanalyse und verwandte Techniken eingeführt. Ich hoffe, dass der Stil dieser neuen Materialien mit dem Rest des Buches übereinstimmt, auch wenn aufmerksame Leser vielleicht eine etwas stärkere Betonung der konzeptionellen und praktischen Erklärungen und etwas weniger Algebra feststellen werden. Ich bin mir nicht sicher, ob das eine gute Sache ist, und werde die Algebra vielleicht zu einem späteren Zeitpunkt einfügen. Aber es spiegelt sowohl meine Herangehensweise an das Verstehen und Lehren von Statistik wider als auch einige Rückmeldungen, die ich von Studenten in meinen Kursen erhalten habe. Dementsprechend bin ich auch den Rest des Buches durchgegangen und habe versucht, einen Teil der Algebra herauszulösen, indem ich sie in einen Kasten oder Rahmen gestellt habe. Es ist nicht so, dass dieser Stoff nicht wichtig oder nützlich wäre, aber einige Studierende möchten ihn vielleicht überspringen, und deshalb sollte die Abtrennung dieser Teile einigen Lesern helfen.

Ich bin sehr dankbar für die Kommentare und Rückmeldungen, die ich von meinen Studenten und Kollegen erhalten habe, insbesondere von Wakefield Morys-Carter, und auch für die vielen Menschen auf der ganzen Welt, die mir kleine Vorschläge und Korrekturen geschickt haben - vielen Dank dafür, und machen Sie weiter so! Eine ziemlich tolle neue Funktion ist, dass die Beispieldateien für das Buch jetzt als Zusatzmodul in jamovi geladen werden können - vielen Dank an Jonathon Love für seine Hilfe dabei.

David Foxcroft
1. Februar 2019

Vorwort zu Version 0.65

In dieser Anpassung des hervorragenden Buches „Learning statistics with R“ von Danielle Navarro haben wir die für die Analysen und Beispiele verwendete Statistiksoftware durch jamovi ersetzt. Obwohl R eine leistungsstarke statistische Programmiersprache ist, ist sie nicht die erste Wahl für jeden Dozenten und Studenten zu Beginn des Statistikunterrichts. Einige Dozenten und Studenten bevorzugen eine grafische Benutzeroberfläche, und hier kommt jamovi ins Spiel. jamovi ist eine Software, die zwei Aspekte der Verwendung von R vereinfachen soll. Sie bietet eine grafische Benutzeroberfläche (GUI) zum Anklicken und stellt außerdem Funktionen zur Verfügung, die die Fähigkeiten vieler anderer Sprachen kombinieren, sodass R eine SPSS- oder SAS-ähnliche Programmiermethode erhält. Wichtig ist, dass jamovi immer frei und offen sein wird – das ist einer seiner Grundwerte – denn jamovi wird von der wissenschaftlichen Gemeinschaft für die wissenschaftliche Gemeinschaft entwickelt.

Bei dieser Version bin ich sehr dankbar für die Hilfe anderer, die Entwürfe durchgelesen und ausgezeichnete Vorschläge und Korrekturen geliefert haben, insbesondere Dr. David Emery und Kirsty Walter.

David Foxcroft
1. Juli 2018

Vorwort zu Version 0.6

Das Buch hat sich seit 2015, als ich Version 0.5 veröffentlicht habe, nicht sehr verändert – man kann wohl sagen, dass ich mich mehr verändert habe als das Buch. Ich bin 2016 von Adelaide nach Sydney gezogen und meine Lehrverpflichtungen an der UNSW sind anders als in Adelaide. Ich hatte seit meiner Ankunft hier nicht wirklich die Gelegenheit, daran zu arbeiten! Es ist schon ein wenig seltsam, darauf zurückzublicken. Ein paar kurze Anmerkungen…

  • Seltsamerweise verwechselt das Buch ständig meine Geschlechtszugehörigkeit, aber das habe ich mir wohl selbst zuzuschreiben :-) Auf Seite 12 gibt es jetzt eine kurze Fußnote, in der dieses Problem erwähnt wird; im wirklichen Leben habe ich in den letzten zwei Jahren einen Prozess der Geschlechtsangleichung durchlaufen und benutze meistens das Pronomen „sie“. Ich bin jedoch genauso faul wie eh und je, also habe ich mir nicht die Mühe gemacht, den Text im Buch zu aktualisieren.

  • Für die Version 0.6 habe ich nicht viel geändert. Ich habe ein paar kleinere Änderungen vorgenommen, wenn Leute mich auf Tipp- oder andere Fehler hingewiesen haben. Besonders erwähnenswert ist das Problem im Zusammenhang mit der Funktion etaSquared im Paket lsr (das nicht mehr wirklich gepflegt wird) in Abschnitt 14.4. Die Funktion funktioniert gut für die einfachen Beispiele im Buch, aber es gibt definitiv Fehler darin, die ich noch nicht überprüfen konnte! Seien Sie also bitte vorsichtig damit.

  • Die größte Änderung ist eigentlich die Lizenzierung! Ich habe es unter einer Creative-Commons-Lizenz (CC BY-SA 4.0) veröffentlicht und alle Quelldateien in das zugehörige GitHub-Repository gestellt, falls jemand es anpassen möchte.

Vielleicht möchte jemand eine Version schreiben, die tidyverse nutzt… Ich habe gehört, dass das heutzutage ziemlich wichtig für R geworden ist :-)

Viele Grüße,

Danielle Navarro

Vorwort zu Version 0.5

Ein neues Jahr, ein weiteres Update. Dieses Mal konzentrierte sich die Aktualisierung fast ausschließlich auf die Theorieabschnitte des Buches. Die Kapitel 9, 10 und 11 wurden umgeschrieben, hoffentlich zum Besseren. Ebenso ist Kapitel 17 völlig neu und konzentriert sich auf die Bayessche Statistik. Ich denke, die Änderungen haben das Buch sehr verbessert. Ich habe mich immer eher unwohl dabei gefühlt, dass alle inferentstatistischen Verfahren in diesem Buch aus einer orthodoxen Perspektive dargestellt werden, obwohl ich in meiner eigenen Arbeit fast immer Bayessche Datenanalysen präsentiere. Jetzt, da ich es geschafft habe, Bayessche Methoden irgendwo in das Buch zu quetschen, fühle ich mich mit dem Buch insgesamt wohler. Ich wollte in diesem Update noch ein paar andere Dinge erledigen, aber wie üblich bin ich mit Terminen für Lehrveranstaltungen konfrontiert, also muss das Update so erscheinen, wie es ist!

Danielle Navarro
16. Februar 2015

Vorwort zu Version 0.4

Ein Jahr ist vergangen, seit ich das letzte Vorwort geschrieben habe. Das Buch hat sich in einigen wichtigen Punkten geändert: In den Kapiteln 3 und 4 werden einige der zeitsparenden Funktionen von RStudio besser dokumentiert, in den Kapiteln 12 und 13 werden jetzt die neuen Funktionen des lsr-Pakets verwendet, um χ²-Tests und t-Tests durchzuführen, und die Diskussion von Korrelationen wurde angepasst, um auf die neuen Funktionen des lsr-Pakets zu verweisen. Die Softcopy von 0.4 hat nun eine bessere interne Referenzierung (d.h. tatsächliche Hyperlinks zwischen den Abschnitten), obwohl diese bereits in 0.3.1 eingeführt wurde. Es gibt hier und da ein paar Anpassungen und viele Tippfehler-Korrekturen (vielen Dank an alle, die auf Tippfehler hingewiesen haben!), aber insgesamt unterscheidet sich 0.4 nicht wesentlich von 0.3.

Ich wünschte, ich hätte in den letzten 12 Monaten mehr Zeit gehabt, um mehr Inhalt hinzuzufügen. Das Fehlen jeglicher Diskussion über die ANOVA mit wiederholten Messungen und Modelle mit gemischtem Design ärgert mich wirklich. Meine Entschuldigung für diesen Mangel an Fortschritt ist, dass mein zweites Kind Anfang 2013 geboren wurde und ich daher den größten Teil des letzten Jahres damit verbracht habe, mich über Wasser zu halten. Das hatte zur Folge, dass unbezahlte Nebenprojekte wie dieses Buch zugunsten von Dingen zurückgestellt wurden, mit denen ich tatsächlich mein Gehalt verdiene! Jetzt ist es etwas ruhiger geworden, und mit etwas Glück wird Version 0.5 ein größerer Schritt nach vorn sein.

Eine Sache, die mich überrascht hat, ist die Anzahl der Downloads des Buchs. Vor ein paar Monaten habe ich endlich einige grundlegende Informationen von der Website erhalten, und (nachdem ich offensichtliche Roboter ausgeschlossen habe) wurde das Buch im Durchschnitt etwa 90 Mal pro Tag heruntergeladen. Das ist ermutigend: Es gibt zumindest ein paar Leute, die das Buch nützlich finden!

Danielle Navarro
4. Februar 2014

Vorwort zu Version 0.3

Es gibt einen Teil von mir, der dieses Buch nicht veröffentlichen will. Es ist noch nicht fertig.

Und wenn ich das sage, dann meine ich das auch so. Die Verweise sind bestenfalls lückenhaft, die Kapitelzusammenfassungen sind nur Listen von Abschnittsüberschriften, es gibt keinen Index, es gibt keine Übungen für den Leser, die Organisation ist suboptimal, und die Abdeckung der Themen ist für meinen Geschmack einfach nicht umfassend genug. Außerdem gibt es Abschnitte, mit deren Inhalt ich nicht zufrieden bin, Diagramme, die wirklich neu erstellt werden müssen, und ich hatte fast keine Zeit, nach Unstimmigkeiten, Tippfehlern oder Fehlern zu suchen. Mit anderen Worten: Dieses Buch ist nicht fertig. Wenn ich nicht einen drohenden Abgabetermin für eine Lehrtätigkeit hätte und in ein paar Wochen ein Baby erwarten würde, würde ich dieses Buch wirklich nicht zur Verfügung stellen.

Das bedeutet, dass Sie als Akademiker auf der Suche nach Lehrmaterial, als Doktorand, der R erlernen möchte, oder als ein an Statistik interessierter Bürger Vorsicht walten lassen sollten. Was Sie hier sehen, ist ein erster Entwurf, der Ihren Zwecken möglicherweise nicht gerecht wird. Wenn wir in einer Zeit leben würden, in der das Publizieren noch teuer war und es noch kein Internet gab, würde ich niemals in Betracht ziehen, ein Buch in dieser Form zu veröffentlichen. Der Gedanke, dass jemand 80 Dollar dafür ausgeben würde (was mir ein kommerzieller Verlag sagte, als er mir anbot, es zu vertreiben), ist mir mehr als unangenehm. Aber wir leben im 21. Jahrhundert, und ich kann die PDF-Datei kostenlos auf meine Website stellen und gedruckte Exemplare über einen Print-on-Demand-Service für weniger als die Hälfte dessen vertreiben, was ein Lehrbuchverlag verlangen würde. Damit ist mein schlechtes Gewissen beruhigt, und ich bin bereit, zu teilen! In diesem Sinne können Sie eine kostenlose elektronische Version von https://learningstatisticswithr.com herunterladen.

(Die früher verfügbaren gedruckten Exemplare sind nicht mehr erhältlich und der entsprechende Link wurde entfernt).

Die Warnung bleibt bestehen: Was Sie hier sehen, ist die Version 0.3 eines in Arbeit befindlichen Werks. Wenn und sobald die Version 1.0 erreicht ist, wäre ich bereit, hinter der Arbeit zu stehen und zu sagen: Ja, das ist ein Lehrbuch, das ich anderen Leuten ans Herz legen würde. Zu diesem Zeitpunkt werde ich wahrscheinlich damit beginnen, das Buch schamlos im Internet zu vermarkten. Aber bis es soweit ist, möchte ich klarstellen, dass ich dem Werk in seiner jetzigen Form sehr ambivalent gegenüberstehe.

Nach alledem gibt es eine Gruppe von Menschen, denen ich dieses Buch mit Begeisterung empfehlen kann: die Psychologiestudenten, die 2013 an unseren Grundkursen zu Forschungsmethoden (DRIP und DRIP:A) teilnehmen. Für Sie ist dieses Buch ideal, denn es wurde geschrieben, um Ihre Statistikvorlesungen zu begleiten. Wenn ein Problem aufgrund einer Unzulänglichkeit dieser Notizen auftritt, kann und werde ich den Inhalt spontan anpassen, um das Problem zu lösen. Sie haben also ein Lehrbuch, das speziell für Ihren Unterricht geschrieben wurde und das Sie kostenlos (elektronische Kopie) oder zum Selbstkostenpreis (gedruckte Kopie) erhalten. Und noch besser: Die Notizen wurden getestet: Die Version 0.1 dieser Notizen wurde in der Klasse 2011 verwendet, die Version 0.2 wurde in der Klasse 2012 verwendet, und jetzt haben Sie die neue und verbesserte Version 0.3 vor sich. Ich behaupte nicht, dass diese Notizen ein titanbeschichtetes Wunderwerk auf einem Stock sind – aber wenn Sie das in der Kursevaluation sagen wollen, dann können Sie das gerne tun – denn das sind sie nicht. Aber ich sage, dass sie in den vergangenen Jahren ausprobiert wurden und anscheinend gut funktionieren. Außerdem gibt es eine Gruppe von uns, die bei Problemen helfen kann, und Sie können sicher sein, dass mindestens einer Ihrer Dozenten das gesamte Dokument von vorne bis hinten gelesen hat!

Okay, nachdem das nun geklärt ist, sollte ich etwas dazu sagen, was das Buch sein soll. Im Kern handelt es sich um ein einführendes Statistik-Lehrbuch, das sich in erster Linie an Psychologiestudenten richtet. Als solches deckt es die Standardthemen ab, die man von einem solchen Buch erwarten würde: Studiendesign, deskriptive Statistik, Theorie von Hypothesentests, t-Tests, χ²-Tests, ANOVA und Regression. Es gibt jedoch auch mehrere Kapitel, die dem Statistikpaket R gewidmet sind, darunter ein Kapitel über Datenmanipulation und ein weiteres über Skripte und Programmierung. Wenn Sie sich den Inhalt des Buches ansehen, werden Sie außerdem feststellen, dass viele Themen, die bei der Vermittlung von Statistik an Psychologiestudenten traditionell unter den Teppich gekehrt werden, nicht behandelt werden. Der Unterschied zwischen Bayes und frequentistischer Statistik wird im Kapitel über die Wahrscheinlichkeitsrechnung diskutiert, und auch die Meinungsverschiedenheiten zwischen Neyman und Fisher über Hypothesentests kommen zur Sprache. Der Unterschied zwischen Wahrscheinlichkeit und Dichte wird erörtert. Eine ausführliche Behandlung der Quadratsummen vom Typ I, II und III für faktorielle ANOVA mit ungleichen Zellgewichten wird geboten. Und wenn Sie einen Blick in das Nachwort werfen, sollte klar sein, dass ich beabsichtige, noch viel mehr fortgeschrittene Inhalte hinzuzufügen.

Die Gründe, warum ich diesen Ansatz verfolge, sind recht einfach: Die Studierenden können damit umgehen, und es scheint ihnen sogar Spaß zu machen. In den letzten Jahren war ich angenehm überrascht, wie wenig Schwierigkeiten ich hatte, Psychologiestudenten dazu zu bringen, R zu lernen. Es ist sicherlich nicht einfach für sie, und ich habe festgestellt, dass ich bei der Festlegung von Bewertungsmaßstäben ein wenig nachsichtig sein muss, aber sie schaffen es schließlich. Ebenso scheinen sie keine großen Probleme damit zu haben, Mehrdeutigkeit und Komplexität bei der Darstellung statistischer Ideen zu tolerieren, solange sie sicher sein können, dass die Bewertungsmaßstäbe so gesetzt werden, dass sie für sie geeignet sind. Wenn die Schüler also damit umgehen können, warum sollte man es nicht unterrichten? Die potenziellen Vorteile sind ziemlich verlockend. Wenn sie R lernen, erhalten die SchülerInnen Zugang zu CRAN, der vielleicht größten und umfangreichsten Bibliothek mit statistischen Werkzeugen, die es gibt. Und wenn sie die Wahrscheinlichkeitstheorie im Detail kennenlernen, ist es für sie einfacher, von orthodoxen Nullhypothesen-Tests zu Bayesschen Methoden zu wechseln, wenn sie das möchten. Besser noch, sie lernen Datenanalysefähigkeiten, die sie zu einem Arbeitgeber mitnehmen können, ohne auf teure und proprietäre Software angewiesen zu sein.

Leider ist dieses Buch nicht die Wunderwaffe, die all dies möglich macht. Es ist immer noch in Arbeit, und wenn es fertig ist, wird es vielleicht ein nützliches Werkzeug sein. Eines unter Vielen, würde ich meinen. Es gibt eine Reihe anderer Bücher, die versuchen, eine grundlegende Einführung in die Statistik mit R zu geben, und ich bin nicht so arrogant zu glauben, dass mein Buch besser ist. Dennoch gefällt mir das Buch sehr gut, und vielleicht finden andere Leute es nützlich, auch wenn es unvollständig ist.

Danielle Navarro
13. Januar 2013