Autor des Abschnitts: Danielle J. Navarro and David R. Foxcroft

Skalenniveaus und Variablentypen

Wie im vorangegangenen Abschnitt beschrieben, wird das Ergebnis einer psychologischen Messung als Variable bezeichnet. Jedoch sind nicht alle Variablen vom gleichen qualitativen Typ, weshalb es sinnvoll ist zu verstehen, welche Typen es gibt. Ein sehr nützliches Konzept zur Unterscheidung zwischen den verschiedenen Arten von Variablen sind die sogenannten Skalenniveaus.

Nominalskala

Eine nominalskalierte Variable (auch als kategoriale Variable bezeichnet) ist eine Variable, bei der es keine besondere Beziehung zwischen ihren verschiedenen Ausprägungen gibt. Bei dieser Art von Variablen macht es keinen Sinn zu sagen, dass eine Ausprägung „größer“ oder „besser“ ist als eine andere, und es macht absolut keinen Sinn, einen Durchschnitt zu bilden. Klassisches Beispiel hierfür ist die Augenfarbe. Augen können unter anderem blau, grün oder braun sein, aber keine dieser Ausprägungen ist „größer“ als eine andere. Folglich wäre es sehr seltsam, von einer „durchschnittlichen Augenfarbe“ zu sprechen. Auch die Variable Geschlecht ist nominal: Die Ausprägung männlich ist nicht besser oder schlechter als die Ausprägung weiblich. Ebenso wenig Sinn macht es, von einem „durchschnittlichen Geschlecht„ zu sprechen. Kurz gesagt sind nominalskalierte Variablen dadurch charakterisiert, dass das Einzige, was man über die verschiedenen Ausprägungen sagen kann, ist, dass sie unterschiedlich sind. Das war’s.

Schauen wir uns das einmal etwas genauer an. Nehmen wir an, ich würde untersuchen, wie Personen zur Arbeit pendeln. Eine Variable, die ich messen müsste, wäre die Art des Verkehrsmittels, das die Personen für ihren Arbeitsweg nutzen. Diese „Verkehrsmittelvariable“ könnte eine ganze Reihe möglicher Werte annehmen, darunter: „Zug“, „Bus“, „Auto“, „Fahrrad“. Für den Moment nehmen wir einmal an, dass es nur diese vier Möglichkeiten gibt. Stellen Sie sich nun vor, ich fragte 100 Personen, wie sie heute zur Arbeit gekommen sind und würde dieses Ergebnis erhalten:

Verkehrsmittel

Anzahl der Personen

Zug

12

Bus

30

Auto

48

Fahrrad

10

Nun, was ist also das durchschnittliche Verkehrsmittel? Offensichtlich ist die richtige Antwort hier, dass es keines gibt. Allein eine solche Frage zu stellen macht kaum Sinn. Man kann zwar sagen, dass das Auto das beliebteste und die Bahn das unbeliebteste Verkehrsmittel ist, das war’s aber auch schon. Auch fällt auf, dass die Rangfolge, in der ich die möglichen Verkehrsmittel aufliste, ist nicht besonders interessant ist. Ich hätte die Daten auch so darstellen können…

Verkehrsmittel

Anzahl der Personen

Auto

48

Zug

12

Fahrrad

10

Bus

30

…und es würde sich nicht wirklich etwas ändern.

Ordinalskala

Ordinalskalierte Variablen haben etwas mehr Struktur als nominalskalierte Variablen, allerdings nicht viel mehr. Eine ordinalskalierte Variable ist eine Variable, bei der es einen natürlichen, sinnvollen Weg gibt, die verschiedenen Ausprägungen der Variable zu ordnen. Mehr kann man jedoch nicht tun. Gängiges Beispiel für eine ordinalskalierte Variable ist die „Platzierung in einem Wettrennen“. Man kann zwar durchaus sagen, dass die Person, die als Erstes ins Ziel kam, schneller war als die Person, die als Zweites ins Ziel kam, man weiß jedoch nicht, wie viel schneller. Folglich wissen wir, dass der 1. Platz > dem 2. Platz ist, und wir wissen, dass der 2. Platz > dem 3. Platz ist, allerdings könnte der Unterschied zwischen dem ersten und zweiten Platz viel größer sein als der Unterschied zwischen dem Zweiten und Dritten.

An dieser Stelle soll ein psychologisch interssantes Beispiel dargestellt werden. Nehmen Sie an, Ich wäre an den Einstellungen der Menschen zum Klimawandel interessiert. Dafür würde ich dann einige Leute bitten, aus vier aufgelisteten Aussagen diejenige auszuwählen, die ihren Überzeugungen am ehesten entspricht:

(1) Die Temperaturen steigen aufgrund menschlicher Aktivitäten
(2) Die Temperaturen steigen, aber wir wissen nicht warum
(3) Die Temperaturen steigen, aber nicht aufgrund menschlicher Einflussnahme
(4) Die Temperaturen steigen nicht

Beachten Sie, dass diese vier Aussagen tatsächlich eine natürliche Reihenfolge aufweisen, und zwar in Bezug auf „das Ausmaß, in dem sie mit der aktuellen Wissenschaft übereinstimmen“. Aussage 1 stimmt fast überein, Aussage 2 stimmt einigermaßen überein, Aussage 3 stimmt nicht sehr gut überein und Aussage 4 steht in starkem Gegensatz zum aktuellen Wissensstand. In Bezug auf das, was mich interessiert (das Ausmaß, in dem die Menschen die Wissenschaft unterstützen), kann ich die Punkte also wie folgt anordnen: 1 > 2 > 3 > 4. Da diese Reihenfolge existiert, wäre es sehr abwegig, die Optionen in dieser Weise ufzulisten…

(3) Die Temperaturen steigen, aber nicht aufgrund menschlicher Einflussnahme
(1) Die Temperaturen steigen aufgrund menschlicher Aktivitäten
(4) Die Temperaturen steigen nicht
(2) Die Temperaturen steigen, aber wir wissen nicht warum

…weil so die natürliche „Struktur“ der Frage verletzt scheint.

Nehmen wir also an, ich hätte 100 Personen diese Fragen gestellt und folgende Antworten erhalten:

Antwort

Anzahl

Die Temperaturen steigen aufgrund menschlicher Aktivitäten (1)

51

Die Temperaturen steigen, aber wir wissen nicht, warum (2)

20

Die Temperaturen steigen, aber nicht wegen des Menschen (3)

10

Temperaturen steigen nicht (4)

19

Bei der Analyse dieser Daten scheint es vernünftig, die Aussagen (1), (2) und (3) zusammenzufassen und zu sagen, dass 81 von 100 Personen bereit waren, der Wissenschaft zumindest teilweise zu zustimmen. Ebenso vernünftig wäre es, die Aussagen (2), (3) und (4) zusammenzufassen und zu sagen, dass 49 von 100 Personen angaben, mit der vorherrschenden wissenschaftlichen Ansicht wenigstens teilweise nicht einverstanden zu sein. Es wäre jedoch völlig bizarr, die Aussagen (1), (2) und (4) zusammenzufassen und zu sagen, dass 90 von 100 Personen… was eigentlich? Es gibt keinen vernünftigen Grund, der es erlauben würde, diese Antworten zusammenzufassen.

Darüber hinaus ist zu beachten, dass wir zwar die natürliche Reihenfolge dieser Items verwenden können, um sinnvolle Gruppierungen zu bilden, wir jedoch keinen Durchschnitt bilden können. In meinem einfachen Beispiel hier wäre die „durchschnittliche“ Antwort auf die Frage 1,97. Wenn Sie mir sagen können, was das bedeutet, würde ich es gerne wissen, denn mir kommt es wie Kauderwelsch vor!

Intervallskala

Im Gegensatz zu Nominal- und Ordinalskalen handelt es sich bei Intervallskalen und Verhältnisskalen um Variablen, bei denen der numerische Wert tatsächlich aussagekräftig ist. Bei der Intervallskala sind die Unterschiede zwischen den Zahlen interpretierbar, aber die Variable hat keinen „natürlichen“ Nullpunkt. Ein gutes Beispiel für eine intervallskalierte Variable ist die Messung der Temperatur in Grad Celsius. Wenn es zum Beispiel gestern 15° und heute 18° waren, dann sind die 3° Unterschied zwischen den beiden Werten tatsächlich aussagekräftig. Außerdem ist dieser Unterschied von 3° exakt derselbe wie der Unterschied von 3° zwischen 7° und 10°. Kurz gesagt, Addition und Subtraktion sind für intervallskalierte Variablen sinnvoll.[1]

Jedoch ist zu beachten, dass 0° nicht „überhaupt keine Temperatur“ bedeutet. 0° bedeutet vielmehr „die Temperatur, bei der Wasser gefriert“, was ziemlich willkürlich ist. Folglich wäre es sinnlos, zu versuchen, Temperaturen zu multiplizieren und zu dividieren. Es ist falsch zu sagen, dass 20° zweimal so heiß ist wie 10°, genauso wie es seltsam und sinnlos ist zu behaupten, 20° sei minus zweimal so heiß wie -10°.

Betrachten wir noch einmal ein etwas psychologischeres Beispiel. Angenommen, ich möchte untersuchen, wie sich die Einstellungen von Studienanfängern im Laufe der Zeit verändert haben. Natürlich möchte ich das Jahr erfassen, in dem jeder Student sein Studium begonnen hat. Dies ist eine intervallskalierte Variable. Ein Student, der 2003 angefangen hat zu studieren, hat 5 Jahre früher angefangen als ein Student, der sein Studium 2008 begonnen hat. Allerdings wäre es ziemlich töricht, wenn ich 2008 durch 2003 teilen und sagen würde, dass der zweite Student „1,0024 mal später“ als der erste Student angefangen hat. Dies wäre völlig sinnlos.

Verhältnisskala

Die vierte und letzte Variablenart, die zu beachten ist, sind verhältnisskalierte Variablen, bei denen Null tatsächlich Null bedeutet und es okay ist, Werte zu multiplizieren und zu dividieren. Ein gutes psychologisches Beispiel für eine verhältnisskalierte Variable ist die Reaktionszeit (RT). Bei vielen Aufgaben ist es üblich, die Zeit zu messen, die jemand braucht, um ein Problem zu lösen oder eine Frage zu beantworten, da dies ein Indikator für die Schwierigkeit einer Aufgabe ist. Nehmen wir an, Alan braucht 2,3 Sekunden, um eine Frage zu beantworten, während Ben 3,1 Sekunden braucht. Wie bei intervallskalierten Variablen, sind hier sowohl Addition als auch Subtraktion sinnvoll. Ben hat tatsächlich 3,1 - 2,3 = 0,8 Sekunden länger gebraucht als Alan. Allerdings machen hier auch die Operationen Multiplikation und Division Sinn: Ben brauchte für die Beantwortung der Frage 3,1 / 2,3 = 1,35 mal so lange wie Alan. Dies ist möglich, da bei verhältnisskalierten Variablen wie RT „null Sekunden“ tatsächlich „überhaupt keine Zeit“ bedeutet.

Kontinuierliche versus diskrete Variablen

Es gibt noch eine zweite Unterscheidung, die Sie kennen sollten, bezüglich der Arten von Variablen, auf die Sie stoßen könnten. Dabei handelt es sich um die Unterscheidung zwischen kontinuierlichen und diskreten Variablen. Diese lautet wie folgt:

  • Eine kontinuierliche Variable ist eine, bei der es zwischen zwei beliebigen Werten immer noch einen logisch sinnvollen Wert gibt.

  • Eine diskrete Variable ist im Grunde eine Variable, die nicht kontinuierlich ist. Bei einer diskreten Variablen kann es vorkommen, dass es nichts dazwischen gibt.

Diese Definitionen scheinen zunächst vielleicht etwas abstrakt, aber sie sind ziemlich einfach, wenn man erst einmal ein paar Beispiele sieht. Zum Beispiel ist die Reaktionszeit (RT) kontinuierlich. Wenn Alan 3,1 Sekunden braucht und Ben 2,3 Sekunden, um eine Frage zu beantworten, dann liegt Camerons Antwortzeit dazwischen, wenn er 3,0 Sekunden braucht. Natürlich wäre es auch möglich, dass David 3,031 Sekunden für seine Antwort benötigt, was bedeutet, dass seine RT zwischen der von Cameron und der von Alan liegen würde. Auch, wenn es in der Praxis vielleicht nicht immer möglich ist, Reaktionszeiten so genau zu messen, so wäre es doch im Prinzip möglich. Da wir immer einen weiteren Wert zwischen zwei beliebigen Reaktionszeiten finden können, betrachten wir die RT als ein kontinuierliches Maß.

Diskrete Variablen liegen vor, wenn diese Regel verletzt wird. Beispielsweise sind nominalskalierte Variablen immer diskret. Es gibt kein Verkehrsmittel, das „zwischen“ Zügen und Fahrrädern liegt, jedenfalls nicht in einer strengen mathematischen Weise, wie 2,3 zwischen 2 und 3 liegt. Die Art des Verkehrsmittels ist also diskret. Ebenso sind ordinalskalierte Variablen immer diskret. Obwohl der „Platz 2“ zwischen „Platz 1“ und „Platz 3“ liegt, gibt es nichts, was in einer logisch sinnvollen Weise zwischen „Platz 1“ und „Platz 2“ liegen könnte. Intervall- und verhältnisskalierte Variablen können beides sein. Wie wir oben gesehen haben, ist die Reaktionszeit (eine verhältnisskalierte Variable) kontinuierlich. Die Temperatur in Grad Celsius (eine intervallskalierte Variable) ist ebenfalls kontinuierlich. Jedoch ist das Jahr, in dem Sie Ihr Studium begonnen haben (eine intervallskalierte Variable) diskret. Es gibt kein Jahr zwischen 2002 und 2003. Die Anzahl der Fragen, die Sie in einem Richtig-oder-Falsch-Test, als richtig ankreuzen (eine verhältnisskalierte Variable) ist ebenfalls diskret. Da man bei einer Richtig-oder-Falsch-Frage nicht „teilweise richtig“ liegen kann, gibt es nichts zwischen 5/10 und 6/10. Die Beziehung zwischen den Skalenniveaus und der Unterscheidung zwischen diskret und kontinuierlich ist in Tab. 1 zusammengefasst. Zellen mit einem Häkchen entsprechen Kombinationen, die möglich sind. Ich versuche, diesen Punkt hervorzuheben, weil (a) einige Lehrbücher dies falsch verstehen und (b) Leute sehr oft Dinge wie „diskrete Variable“ sagen, wenn sie eigentlich „nominalskalierte Variable“ meinen, was ziemlich unglücklich ist.

Tab. 1 Die Beziehung zwischen den Skalenniveaus und der Unterscheidung zwischen diskret und kontinuierlich. Zellen mit einem Häkchen entsprechen Kombinationen, die möglich sind.

continuous

Diskret

Nominal

Ordinal

Intervall

Verhältnis

Ein paar komplexere Sachverhalte

Okay, ich weiß, es wird Sie schockieren: aber die reale Welt ist viel chaotischer, als dieses kleine Klassifizierungsschema vermuten lässt. Im wirklichen Leben fallen nur sehr wenige Variablen tatsächlich in diese hübsch sauberen Kategorien, also muss man ein wenig aufpassen, dass man die Skalenniveaus nicht so behandelt, als seien es harte und schnelle Regeln. Denn so funktioniert das leider nicht. Es handelt sich eher um Leitlinien, die Ihnen helfen sollen, über Situationen nachzudenken, in denen Sie die verschiedene Variablen unterschiedlich behandeln sollten. Mehr nicht.

Nehmen wir also ein klassisches Beispiel, vielleicht das klassische Beispiel für ein psychologisches Messinstrument: die Likert-Skala. Die bescheidene Likert-Skala ist das A und O aller Umfragen. Auch Sie haben schon Hunderte, vielleicht Tausende von diesen Likert-Skalen ausgefüllt, und wahrscheinlich haben Sie selbst sogar schon eine verwendet. Nehmen wir an, wir haben eine Umfrage, die wie folgt aussieht:

Welche der folgenden Aussagen beschreibt am besten Ihre Meinung zu der Behauptung, dass „alle Piraten verdammt cool sind“?

und dann werden den Teilnehmern folgende Optionen angeboten:

(1) Stimme überhaupt nicht zu
(2) Stimme nicht zu
(3) Stimme weder zu noch nicht zu
(4) Stimme zu
(5) Stimme voll und ganz zu

Diese Reihe von Items ist ein Beispiel für eine 5-Punkte-Likert-Skala, bei der Personen gebeten werden, zwischen mehreren (in diesem Fall 5) klar geordneten Möglichkeiten zu wählen, wobei in der Regel jeweils eine verbale Beschreibung (Deskriptor) angegeben wird. Es ist jedoch nicht notwendig, dass alle Items explizit beschrieben werden. Auch dies ist ein sehr gutes Beispiel für eine 5-Punkte-Likert-Skala:

(1) Stimme überhaupt nicht zu
(2)
(3)
(4)
(5) Stimme voll und ganz zu

Likert-Skalen sind sehr praktische, wenn auch etwas begrenzte Instrumente. Die Frage ist, um welche Art von Variablen es sich handelt. Offensichtlich sind sie diskret, da man keine Antwort von 2,5 geben kann. Sie sind offensichtlich nicht nominalskaliert, da die Items geordnet sind; und sie sind auch nicht verhältnisskaliert, da es keinen natürliche Nullpunkt gibt.

Aber handelt es sich dabei um ordinalskalierte oder intervallskalierte Variablen? Ein Argument besagt, dass wir nicht wirklich beweisen können, dass der Unterschied zwischen „stimme voll und ganz zu“ und „stimme zu“ genau so groß ist, wie der Unterschied zwischen „stimme zu“ und „stimme weder zu noch nicht zu“. In der Tat ist es im täglichen Leben doch ziemlich offensichtlich, dass sie überhaupt nicht gleich sind. Dies legt nahe, dass wir Likert-Skalen als ordinalskalierte Variablen behandeln sollten. Andererseits scheinen in der Praxis die meisten Teilnehmer den Teil „auf einer Skala von 1 bis 5“ ziemlich ernst zu nehmen, und dazu zu neigen, so zu tun, als seien die Unterschiede zwischen den fünf Antwortmöglichkeiten recht ähnlich. Infolgedessen behandeln viele Forscher die Daten der Likert-Skala als intervallskaliert.[2] Es handelt sich zwar nicht um eine Intervallskala, aber in der Praxis ist sie einer solchen so ähnlich, dass wir sie gewöhnlich als Quasi-Intervallskala betrachten.