Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Stichproben, Grundgesamtheit und Stichprobenziehung

In der Einleitung zum Teil I habe ich das Rätsel der Induktion erörtert und die Tatsache hervorgehoben, dass alles Lernen bestimmte Annahmen benötigt. Wenn wir also davon ausgehen, dass dies stimmt, so besteht unsere erste Aufgabe darin, einige recht allgemeine Annahmen über Daten zu treffen, die Sinn ergeben. An diesem Punkt kommt die Stichprobentheorie ins Spiel. Wenn die Wahrscheinlichkeitstheorie das Fundament ist, auf dem die gesamte statistische Theorie aufbaut, dann ist die Stichprobentheorie der Rahmen, um den herum man den Rest des Hauses baut. Die Stichprobentheorie spielt eine wichtige Rolle bei der Festlegung der Annahmen, auf denen Ihre statistischen Schlussfolgerungen beruhen. Um über das „Schlussfolgerungen ziehen“ im Sinne der Statistiker zu sprechen, sollten wir noch etwas deutlicher machen, woraus wir unsere Schlussfolgerungen ziehen (die Stichprobe) und worüber wir unsere Schlussfolgerungen ziehen (die Population).

In fast jeder Situation, die uns interessiert, ist das, was wir als Forscher zur Verfügung haben, eine Stichprobe von Daten. Wir haben vielleicht ein Experiment mit einer bestimmten Anzahl von Teilnehmern durchgeführt, ein Meinungsforschungsinstitut hat vielleicht eine bestimmte Anzahl von Personen angerufen, um sie zu ihren Wahlabsichten zu befragen, und so weiter. Auf diese Weise ist der uns zur Verfügung stehende Datensatz endlich und unvollständig. Wir können unmöglich alle Menschen auf der Welt dazu bringen, an unserem Experiment teilzunehmen und ein Meinungsforschungsinstitut hat weder die Zeit noch das Geld, alle Wähler im Land anzurufen. In unserer früheren Diskussion über Deskriptive Statistik war diese Stichprobe das einzige, was uns interessierte. Unser einziges Ziel war es, Wege zu finden, diese Stichprobe zu beschreiben, zusammenzufassen und grafisch darzustellen. Das wird sich jetzt ändern.

Definieren einer Grundgesamtheit

Eine Stichprobe ist eine konkrete Sache. Sie können eine Datei öffnen, und darin befinden sich die Daten Ihrer Stichprobe. Eine Population hingegen ist ein abstrakterer Begriff. Sie bezieht sich auf die Menge aller möglichen Personen oder aller möglichen Beobachtungen, über die Sie Schlussfolgerungen ziehen wollen und sie ist im Allgemeinen viel größer als die Stichprobe. In einer idealen Welt würden Forscher die Studie mit einer klaren Vorstellung von der interessierenden Population beginnen, da der Prozess des Designens einer Studie sowie des Hypothesentestens abhängig davon ist, über was für eine Population Sie Aussagen treffen wollen.

Manchmal ist es einfach, die interessierende Population zu bestimmen. Im Beispiel des „Meinungsforschungsunternehmens“, mit dem das Kapitel eingeleitet wurde, bestand die Grundgesamtheit aus allen Wählern, die zum Zeitpunkt der Studie wahlberechtigt waren, also aus Millionen von Menschen. Die Stichprobe bestand aus einer Gruppe von 1000 Personen, die alle zu dieser Population gehörten. Bei den meisten Studien ist die Situation weit weniger einfach. Bei einem typischen psychologischen Experiment ist die Bestimmung der interessierenden Population etwas komplizierter. Nehmen wir an, ich würde ein Experiment mit 100 Studierenden als Teilnehmende durchführen. Mein Ziel als Kognitionswissenschaftler ist es, etwas darüber zu erfahren, wie das Denken funktioniert. Welche der folgenden Personen könnten also als „die Population“ gelten:

  • Alle Psychologiestudenten an der University of Adelaide?

  • Psychologiestudierende im Allgemeinen, überall auf der Welt?

  • Australier, die derzeit leben?

  • Australier im ähnlichen Alter wie meine Stichprobe?

  • Alle, die derzeit leben?

  • Jedes menschliche Wesen, der Vergangenheit, Gegenwart und Zukunft?

  • Jeder biologische Organismus mit einem ausreichenden Maß an Intelligenz, der in einer irdischen Umgebung lebt?

  • Jedes intelligente Lebewesen?

Alle die genannten definieren eine reale Gruppe von Wesen, die über einen Verstand verfügen, der für mich als Kognitionswissenschaftler von Interesse sein könnte und es ist überhaupt nicht klar, welche dieser Populationen nun die eine Population von Interesse sein sollte. Betrachten wir als weiteres Beispiel das Wellesley-Croker-Spiel, das wir in der Einleitung besprochen haben. Die Stichprobe ist hier eine bestimmte Folge von 12 Gewinnen und 0 Niederlagen für Wellesley. Was ist hier die Population?

  • Alle Ergebnisse bis zur Ankunft von Wellesley und Croker an ihrem Ziel?

  • Alle Ergebnisse, wenn Wellesley und Crocker das Spiel für den Rest ihres Lebens spielen würden?

  • Alle Ergebnisse, wenn Wellesley und Croker ewig leben würden bis es keine Hügel auf der Erde mehr gäbe?

  • Alle Ergebnisse, wenn wir eine unendliche Anzahl von Paralleluniversen schaffen würden und das Paar Wellesely/Croker würde Schätzungen über dieselben 12 Hügel in jedem der Universen machen?

Auch hier ist nicht klar, was die Population ist.

Einfache Zufallsstichproben

Unabhängig davon, wie ich die Grundgesamtheit definiere, ist der entscheidende Punkt, dass die Stichprobe eine Teilmenge der Grundgesamtheit ist und das Ziel darin besteht, unser Wissen über die Stichprobe zu nutzen, um Rückschlüsse auf die Eigenschaften der Grundgesamtheit zu ziehen. Die Beziehung zwischen den beiden hängt von dem Verfahren ab, mit dem die Stichprobe ausgewählt wurde. Dieses Verfahren wird als Stichprobenverfahren bezeichnet, und es ist wichtig zu verstehen, warum es wichtig ist.

Stellen wir uns der Einfachheit halber vor, wir hätten eine Tüte mit 10 Chips. Auf jedem Chip ist ein einzigartiger Buchstabe aufgedruckt, damit wir die 10 Chips voneinander unterscheiden können. Die Chips gibt es in zwei Farben, schwarz und weiß. Dieser Satz von Chips ist die interessierende Population, die auf der linken Seite von Abb. 55 grafisch dargestellt ist. Wie Sie aus dem Bild erkennen können, gibt es 4 schwarze Chips und 6 weiße Chips, aber natürlich könnten wir das im echten Leben nicht wissen, wenn wir nicht in die Tüte schauen würden. Stellen Sie sich nun folgendes „Experiment“ vor: Sie schütteln die Tüte, schließen die Augen und ziehen 4 Chips heraus, ohne einen davon wieder in die zurückzulegen. Zuerst kommt der a-Chip (schwarz), dann der c-Chip (weiß), dann j (weiß) und schließlich b (schwarz). Wenn Sie wollen, können Sie alle Chips wieder in die Tüte legen und das Experiment wiederholen, wie auf der rechten Seite von Abb. 55 dargestellt. Jedes Mal erhält man andere Ergebnisse, aber das Verfahren ist in jedem Fall identisch. Die Tatsache, dass dasselbe Verfahren jedes Mal zu unterschiedlichen Ergebnissen führen kann, bezeichnen wir als Zufall.[1] Da wir die Tüte geschüttelt haben, bevor wir die Chips herausgezogen haben, liegt die Vermutung nahe, dass jeder Chip die gleiche Chance hat, ausgewählt zu werden. Ein Verfahren, bei dem jedes Mitglied der Grundgesamtheit die gleiche Chance hat, ausgewählt zu werden, nennt man eine einfache Zufallsstichprobe. Die Tatsache, dass wir die Chips nicht in die Tüte zurückgelegt haben, nachdem wir sie herausgezogen haben, bedeutet, dass man dasselbe nicht zweimal beobachten kann, in solchen Fällen sagt man, dass die Stichprobe ohne Zurücklegen gezogen wurde.

Einfache Zufallsstichprobenziehung aus einer endlichen Grundgesamtheit OHNE Zurücklegen

Abb. 55 Einfache Zufallsstichprobenziehung aus einer endlichen Grundgesamtheit OHNE Zurücklegen

Um sicherzugehen, dass Sie die Bedeutung der Auswahl einer Stichprobe verstehen, überlegen Sie sich, wie das Experiment alternativ hätte durchgeführt werden können. Nehmen wir an, mein 5-jähriger Sohn hätte die Tüte geöffnet und beschlossen, vier schwarze Chips herauszuziehen, ohne einen davon in die Tüte zurückzulegen. Dieses voreingenommene Stichprobenverfahren ist in Abb. 56 dargestellt. Betrachten wir nun den Beweiswert, wenn wir 4 schwarze Chips und 0 weiße Chips sehen. Er hängt eindeutig vom Stichprobenplan ab, nicht wahr? Wenn Sie wissen, dass die Stichprobenauswahl so voreingenommen ist, dass nur schwarze Chips ausgewählt werden, dann sagt eine Stichprobe, die nur aus schwarzen Chips besteht, nicht viel über die Grundgesamtheit aus! Aus diesem Grund mögen es Statistiker sehr, wenn ein Datensatz als einfache Zufallsstichprobe betrachtet werden kann, denn das macht die Datenanalyse viel einfacher.

Verzerrte (*biased*) Stichprobenziehung aus einer endlichen Grundgesamtheit OHNE Zurücklegen

Abb. 56 Verzerrte (biased) Stichprobenziehung aus einer endlichen Grundgesamtheit OHNE Zurücklegen

Ein drittes Verfahren ist erwähnenswert. Diesmal schließen wir die Augen, schütteln den Beutel und ziehen einen Chip heraus. Danach notieren wir die Beobachtung und stecken den Chip wieder in die Tüte. Wir verschließen erneut die Augen, schütteln die Tüte und ziehen einen weiteren Chip heraus (und notieren das Ergebnis). Wir wiederholen diesen Vorgang, bis wir 4 Chips haben. Bei den auf diese Weise erzeugten Datensätzen handelt es sich immer noch um eine einfache Zufallsstichprobe, aber da wir die Chips sofort nach dem Ziehen wieder in die Tüte stecken, spricht man von einer Stichprobe mit Zurücklegen. Der Unterschied zwischen dieser Situation und der ersten ist, dass es möglich ist, dasselbe Mitglied der Population mehrfach zu beobachten, wie in numref:fig-srs2 dargestellt.

Einfache Zufallsstichprobenziehung aus einer endlichen Grundgesamtheit MIT Zurücklegen

Abb. 57 Einfache Zufallsstichprobenziehung aus einer endlichen Grundgesamtheit MIT Zurücklegen

Meiner Erfahrung nach handelt es sich bei den meisten psychologischen Experimenten um Stichproben ohne Zurücklegen, da dieselbe Person nicht zweimal an einem Experiment teilnehmen darf. Die meisten statistischen Theorien basieren jedoch auf der Annahme, dass die Daten aus einer einfachen Zufallsstichprobe mit Zurücklegen stammen. Im wirklichen Leben ist dies nur sehr selten der Fall. Wenn die interessierende Grundgesamtheit groß ist (z. B. mehr als 10 Einheiten umfasst!), ist der Unterschied zwischen Stichproben mit und ohne Ersetzung relativ gering, und man muss sich daher darüber keine Gedanken machen. Der Unterschied zwischen einfachen Zufallsstichproben und verzerrten Stichproben sollte dagegen nicht vernachlässigt werden.

Die meisten Stichproben sind keine einfachen Zufallsstichproben

Wie Sie aus der Liste der möglichen Populationen, die ich oben gezeigt habe, ersehen können, ist es fast unmöglich, aus den meisten Populationen von Interesse eine einfache Zufallsstichprobe zu erhalten. Wenn ich Experimente durchführe, würde ich es für ein kleines Wunder halten, wenn sich herausstellen würde, dass meine Teilnehmer eine Zufallsstichprobe der Psychologiestudenten an der Universität von Adelaide sind, auch wenn dies bei weitem die kleinste Population ist, auf die ich verallgemeinern möchte. Eine ausführliche Erörterung von Verfahren zum Ziehen von Stichproben würde den Rahmen dieses Buches sprengen, aber um Ihnen einen Eindruck davon zu vermitteln, was es alles gibt, werde ich einige der wichtigsten auflisten.

  • Stratifizierte (geschichtete) Stichprobe. Angenommen, Ihre Population ist (oder kann) in mehrere verschiedene Teilpopulationen oder Schichten unterteilt werden. Vielleicht führen Sie beispielsweise eine Studie an mehreren verschiedenen Standorten durch. Anstatt zu versuchen, zufällig aus der Grundgesamtheit Stichproben zu ziehen, versuchen Sie stattdessen, eine separate Zufallsstichprobe aus jeder einzelnen Schicht zu sammeln. Stratifizierte Stichproben sind manchmal einfacher durchzuführen als einfache Zufallsstichproben, insbesondere wenn die Grundgesamtheit bereits in verschiedene Schichten unterteilt ist. Es kann auch effizienter sein als einfache Zufallsstichproben, insbesondere wenn einige der Teilpopulationen selten vorkommen. Zum Beispiel wäre es bei der Untersuchung der Schizophrenie viel besser, die Grundgesamtheit in zwei[2] Schichten (schizophren und nicht-schizophren) einzuteilen und dann Daten von der gleichen Anzahl von Versuchteilnehmern in jeder Gruppe zu erfassen. Wenn Sie zufällig Personen auswählen würden, würden Sie so wenige schizophrene Menschen in die Stichprobe bekommen, dass Ihre Studie nutzlos wäre. Diese spezielle Art der geschichteten Stichprobe wird als Oversampling bezeichnet, weil sie bewusst versucht, seltene Gruppen zu überrepräsentieren.

  • Das Schneeballsystem ist eine Technik, die besonders nützlich ist, wenn man Stichproben aus einer „versteckten“ oder schwer zugänglichen Population nehmen will. Sie ist vor allem in den Sozialwissenschaften üblich. Nehmen wir zum Beispiel an, Forscher wollen eine Meinungsumfrage unter Transgender-Personen durchführen. Das Forschungsteam verfügt möglicherweise nur über die Kontaktdaten einiger weniger Transmenschen, so dass die Umfrage damit beginnt, dass diese zur Teilnahme aufgefordert werden (Phase 1). Am Ende der Umfrage werden die Teilnehmer gebeten, die Kontaktdaten anderer Personen, die möglicherweise teilnehmen möchten, anzugeben. In Phase 2 werden diese neuen Kontakte befragt. Dieser Prozess wird so lange fortgesetzt, bis die Forscher über genügend Daten verfügen. Der große Vorteil des Schneeballsystems besteht darin, dass man Daten in Situationen oder von Populationen erhält, bei denen es sonst schwer möglich ist, solche Daten zu bekommen. Statistisch gesehen besteht der Hauptnachteil darin, dass die Stichprobe in hohem Maße nicht zufällig ist, und zwar auf eine Art und Weise, die schwer zu beheben ist. Praktisch besteht ein Nachteil darin, dass das Verfahren unethisch sein kann, wenn es nicht richtig gehandhabt wird, da versteckte Bevölkerungsgruppen oft aus einem bestimmten Grund versteckt sind. Ich habe hier Transgender-Personen als Beispiel gewählt, um dieses Problem zu verdeutlichen. Wenn man nicht aufpasst, könnte man Leute outen, die nicht geoutet werden wollen. Und selbst wenn man diesen Fehler nicht macht, kann es immer noch aufdringlich sein, die sozialen Netzwerke von Menschen zu nutzen, um sie zur Teilnahme an einer Studie zu bewegen. Es ist sicherlich schwierig, die Einwilligung von Menschen einzuholen, bevor man sie kontaktiert. In vielen Fällen kann schon die bloße Kontaktaufnahme und die Aussage „Hey, wir wollen dich untersuchen“ verletzend wirken. Soziale Netzwerke sind komplexe Gebilde, und nur weil man sie nutzen kann, um Daten zu erhalten, heißt das nicht immer, dass man das auch tun sollte.

  • Willkürliche Stichproben (convenience sampling) sind mehr oder weniger das, wonach sie sich anhören. Die Stichproben werden so ausgewählt, wie es für den Forscher am günstigsten ist, und nicht nach dem Zufallsprinzip aus der interessierenden Population ausgewählt. Schneeballsysteme sind eine Art von willkürlichen Stichproben, aber es gibt noch viele andere. Das wahrscheinlich häufigste Beispiel in der Psychologie sind Studien, die sich auf Psychologiestudenten stützen (oft weil diese zu einer bestimmten Anzahl von Versuchsteilnahmen verpflichtet sind). Diese Stichproben sind im Allgemeinen in zweierlei Hinsicht nicht zufällig. Erstens bedeutet der Rückgriff auf Psychologiestudenten automatisch, dass Ihre Daten auf eine einzige Teilpopulation beschränkt sind. Zweitens können sich die Studenten in der Regel aussuchen, an welchen Studien sie teilnehmen, so dass es sich bei der Stichprobe um eine selbst ausgewählte Teilmenge von Psychologiestudenten handelt und nicht um eine zufällig ausgewählte Teilmenge. Im wirklichen Leben handelt es sich bei den meisten Studien um Zufallsstichproben in der einen oder anderen Form. Dies stellt manchmal eine große Einschränkung dar, aber nicht immer.

Wie viel macht es aus, wenn man keine einfache Zufallsstichprobe hat?

Die Datenerhebung in der realen Welt besteht in der Regel nicht aus perfekten einfachen Zufallsstichproben. Ist das von Bedeutung? Ein wenig Nachdenken sollte Ihnen klarmachen, dass es eine Rolle spielen kann, wenn Ihre Daten keine einfache Zufallsstichprobe sind. Denken Sie nur an den Unterschied zwischen Abb. 55 und Abb. 56. Es ist jedoch nicht ganz so schlimm, wie es klingt. Einige Arten von verzerrten Stichproben sind völlig unproblematisch. Wenn Sie zum Beispiel eine geschichtete Stichprobentechnik verwenden, wissen Sie tatsächlich, was die Verzerrung ist, weil Sie sie absichtlich erzeugt haben, oft um die Effektivität Ihrer Studie zu erhöhen. Außerdem gibt es weitere statistische Techniken, die Sie verwenden können, um die von Ihnen eingeführten Verzerrungen auszugleichen (selbst wenn diese in diesem Buch nicht behandelt werden). In diesen Fällen ist es also kein Problem.

Generell ist es jedoch wichtig, sich daran zu erinnern, dass eine Zufallsstichprobe ein Mittel zum Zweck ist und nicht das Ziel an sich. Nehmen wir an, Sie haben sich auf eine Zufallsstichprobe verlassen und können daher davon ausgehen, dass diese verzerrt ist. Eine Verzerrung in Ihrer Stichprobenmethode ist nur dann ein Problem, wenn sie zu falschen Schlussfolgerungen führt. Aus diesem Blickwinkel betrachtet, würde ich argumentieren, dass die Stichprobe nicht in jeder Hinsicht zufällig sein muss, sondern nur in Bezug auf das psychologisch relevante Phänomen von Interesse. Nehmen wir an, ich führe eine Studie über die Kapazität des Arbeitsgedächtnisses durch. In Studie 1 habe ich die Möglichkeit, eine Zufallsstichprobe aus allen derzeit lebenden Menschen zu ziehen, mit einer Ausnahme: Ich kann nur Menschen auswählen, die an einem Montag geboren sind. In Studie 2 kann ich eine Zufallsstichprobe aus der australischen Bevölkerung ziehen. Ich möchte meine Ergebnisse auf die Population aller lebenden Menschen verallgemeinern. Welche Studie ist besser? Die Antwort lautet natürlich: Studie 1. Und warum? Weil wir keinen Grund zu der Annahme haben, dass die Tatsache, an einem Montag geboren zu sein, einen relevanten Zusammenhang mit der Kapazität des Arbeitsgedächtnisses hat. Im Gegensatz dazu fallen mir mehrere Gründe ein, warum es eine Rolle spielen könnte, Australier zu sein. Australien ist ein wohlhabendes, industrialisiertes Land mit einem sehr gut entwickelten Bildungssystem. Menschen, die in diesem System aufgewachsen sind, werden Lebenserfahrungen gemacht haben, die den Erfahrungen der Personen, welche die Tests für die Arbeitsgedächtniskapazität entwickelt haben, sehr ähnlich sind. Diese gemeinsamen Erfahrungen könnten sich leicht in ähnlichen Vorstellungen darüber niederschlagen, wie man „einen Test macht“, in einer gemeinsamen Annahme darüber, wie psychologische Experimente funktionieren, und so weiter. Diese Dinge könnten tatsächlich von Bedeutung sein. So könnten die australischen Teilnehmer durch den Stil des „Testmachens“ gelernt haben, ihre Aufmerksamkeit ausschließlich auf ziemlich abstraktes Testmaterial zu richten, viel mehr als Menschen, die nicht in einem ähnlichen Umfeld aufgewachsen sind. Dies könnte daher zu einem irreführenden Bild von der Kapazität des Arbeitsgedächtnisses führen.

In dieser Diskussion sind zwei Punkte versteckt. Erstens ist es wichtig, sich bei der Konzeption eigener Studien Gedanken darüber zu machen, um welche Population es geht, und sich zu bemühen, die Stichprobe so zu wählen, dass sie dieser Population angemessen ist. In der Praxis ist man in der Regel gezwungen, sich mit einer „willkürlichen Stichprobe“ abzufinden (sample of convenience; z. B. nehmen Psychologiedozenten Stichproben von Psychologiestudenten, weil das die kostengünstigste Art der Datenerhebung ist und unsere Kassen nicht gerade vor Geld strotzen). In diesem Fall sollte man zumindest einige Zeit damit verbringen, über die Gefahren dieser Praxis nachzudenken. Zweitens: Wenn Sie schon die Studie eines anderen kritisieren, weil dieser eine willkürliche Stichprobe verwendet hat, anstatt mühsam eine Zufallsstichprobe aus der gesamten menschlichen Population zu ziehen, dann seien Sie wenigstens so höflich, eine konkrete Theorie anzubieten, wie dies die Ergebnisse verzerrt haben könnte.

Populationsparameter und Stichprobenstatistiken

Lassen wir die heiklen methodischen Fragen im Zusammenhang mit der Gewinnung einer Zufallsstichprobe beiseite und betrachten wir ein etwas anderes Thema. Bis zu diesem Punkt haben wir über Populationen gesprochen, wie es ein Wissenschaftler tun würde. Für einen Psychologen könnte eine Population eine Gruppe von Menschen sein. Für einen Biologen könnte eine Population eine Gruppe von Bären sein. In den meisten Fällen handelt es sich bei den Populationen, für die sich Wissenschaftler interessieren, um konkrete Dinge, die tatsächlich in der realen Welt existieren. Statistiker sind jedoch ein seltsamer Haufen. Einerseits sind sie an realen Daten und realer Wissenschaft interessiert, wie es auch die Wissenschaftler sind. Andererseits bewegen sie sich im Bereich der reinen Abstraktion, wie es auch Mathematiker tun. Infolgedessen ist die statistische Theorie in Bezug auf die Definition einer Population tendenziell eher abstrakt. Genauso wie Psychologen unsere abstrakten theoretischen Ideen in Form von konkreten Messungen operationalisieren (Abschnitt Einführung in das psychologische Messen), operationalisieren Statistiker das Konzept einer „Population“ in Form von mathematischen Objekten, mit denen sie zu arbeiten wissen. Sie haben diese Objekte bereits in Kapitel Einführung in die Wahrscheinlichkeitsrechnung kennengelernt. Man nennt sie Wahrscheinlichkeitsverteilungen.

Die Idee ist ganz einfach. Nehmen wir an, es geht um IQ-Werte. Für einen Psychologen ist die interessierende Population eine Gruppe von Menschen, die IQ-Werte haben. Ein Statistiker „vereinfacht“ dies, indem er die Grundgesamtheit operativ als die Wahrscheinlichkeitsverteilung definiert, die im linken Feld von Abb. 58 dargestellt ist. IQ-Tests sind so konzipiert, dass der durchschnittliche IQ bei 100 liegt, die Standardabweichung der IQ-Werte 15 beträgt und die Verteilung der IQ-Werte normal ist. Diese Werte werden als Populationsparameter bezeichnet, weil sie Merkmale der gesamten Population sind. Das heißt, der Mittelwert der Population µ ist 100 und die Standardabweichung der Population σ ist 15.

Populationsverteilung des IQ und zwei Stichproben mit N=100 und N=10.000

Abb. 58 Die Verteilung der IQ-Werte in der Grundgesamtheit (links) und zwei daraus zufällig gezogene Stichproben: Eine Stichprobe mit 100 Beobachtungen (Mitte) und eine Stichprobe mit 10.000 Beobachtungen (rechts).

Nehmen wir nun an, ich führe ein Experiment durch. Ich wähle 100 Personen nach dem Zufallsprinzip aus und führe einen IQ-Test durch, so dass ich eine einfache Zufallsstichprobe aus der Population erhalte. Meine Stichprobe würde aus einer Sammlung von Zahlen wie dieser bestehen:

106 101 98 80 74 … 107 72 100

Jeder dieser IQ-Werte ist eine Stichprobe aus einer Normalverteilung mit Mittelwert 100 und Standardabweichung 15. Wenn ich also ein Histogramm der Stichprobe aufzeichne, erhalte ich etwas wie das im mittleren Feld von Abb. 58 gezeigte. Wie Sie sehen können, ist das Histogramm ungefähr die richtige Form, aber es ist eine sehr grobe Annäherung an die wahre Populationsverteilung, die im linken Feld von Abb. 58 dargestellt ist. Wenn ich den Mittelwert meiner Stichprobe berechne, erhalte ich eine Zahl, die dem Mittelwert der Grundgesamtheit 100 recht nahe kommt, aber nicht identisch ist. In diesem Fall ergibt sich, dass die Personen in meiner Stichprobe einen mittleren IQ von 98,5 haben, und die Standardabweichung ihrer IQ-Werte beträgt 15,9. Diese Stichprobenstatistiken sind Eigenschaften meines Datensatzes, und obwohl sie den wahren Werten der Grundgesamtheit recht ähnlich sind, so sind sie trotzdem nicht identisch. Im Allgemeinen sind Stichprobenstatistiken die Dinge, die Sie aus Ihrem Datensatz berechnen können, und die Populationsparameter sind die Dinge, über die Sie etwas lernen wollen. Später in diesem Kapitel werde ich darüber sprechen, wie Sie die Parameter der Grundgesamtheit anhand Ihrer Stichprobenstatistiken schätzen können (Schätzen von Populationsparametern) und wie Sie herausfinden können, wie sicher Sie in Ihren Schätzungen sind (Schätzen eines Konfidenzintervalls), aber bevor wir dazu kommen, gibt es noch ein paar weitere Ideen aus der Stichprobentheorie, die Sie kennen sollten.