Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Pragmatische Fragen

Der Garten des Lebens scheint sich nie zu beschränken auf die Grundstücke, die Philosophen für ihre Bequemlichkeit angelegt haben. Vielleicht würden ein paar Traktoren einen Unterschied machen.

—Roger Zelazny (Home is the Hangman, 1975)

Dies ist, selbst für meine Verhältnisse, ein etwas spezielles Kapitel. Mein Ziel in diesem Kapitel ist es, etwas ehrlicher, als sonst in diesem Buch, über die Realität der Datenverarbeitung zu sprechen. Das Problem mit realen Datensätzen ist nämlich, dass sie messy sind. Sehr oft sind die Variablen in dem Datensatz, mit dem Sie beginnen, nicht in dem Format gespeichert, welches Sie für Ihre Analyse brauchen. Gelegentlich wird Ihr Datensatz viele fehlende Werte enthalten. Manchmal wollen Sie nur eine Teilmenge der Daten analysieren. Et cetera. Mit anderen Worten: Sie müssen viele Datenmanipulationen vornehmen, um die Variablen in Ihrem Datensatz in das von Ihnen benötigte Format zu bringen. Ziel des Kapitels ist es, eine grundlegende Einführung in dieses pragmatische Themenfeld zu geben. Obwohl das Kapitel durch die praktischen Probleme motiviert ist, die bei der Manipulation echter Daten auftreten, bleibe ich bei der Praxis, die ich auch für den größten Teil des Buches übernommen habe, und stütze mich auf sehr kleine Spielzeugdatensätze, die das zugrunde liegende Problem illustrieren. Da dieses Kapitel im Wesentlichen eine Sammlung von Techniken ist und keine zusammenhängende Geschichte erzählt, ist es nützlich zunächst mit einer Liste von Themen zu beginnen:

Wie Sie sehen können, ist die Liste der Themen, die das Kapitel abdeckt, ziemlich umfangreich, und es gibt eine große Menge an Inhalt. Obwohl dies eines der längsten und schwierigsten Kapitel des Buches ist, kratze ich wirklich nur an der Oberfläche einiger ziemlich unterschiedlicher und wichtiger Themen. Mein Rat ist, wie immer, das Kapitel einmal durchzulesen und zu versuchen, so viel wie möglich davon zu verstehen. Machen Sie sich nicht zu viele Gedanken, wenn Sie nicht alles auf einmal erfassen können, insbesondere die späteren Abschnitte. Der Rest des Buches stützt sich nur in geringem Maße auf dieses Kapitel, so dass Sie sich damit begnügen können, nur die Grundlagen zu verstehen. Sie werden jedoch wahrscheinlich feststellen, dass Sie später zu diesem Kapitel zurückblättern müssen, um einige der Konzepte zu verstehen, auf die ich hier Bezug nehme.