Einführung in SPSS für Windows - uni-kassel.de · Einführung in SPSS für Windows Stand:...

Einführung in SPSS für Windows

Stand: 2005-07-21

SPSS ist eines der bekanntesten Statistikpakete. Es verfügt über eine

besonders leicht zu bedienende Steuerung, die in der vorliegenden Schrift

behandelt wird. Auch die Realisierung beschreibender (tabellarischer und

grafischer) Statistik und einiger der häufigsten Prüfstatistikverfahren wird

dargestellt.

Einleitung

Ziel der vorliegenden Schrift ist es, eine kurze Einführung in die am häufigst benötigten

Aspekte des Umgangs mit der deutschsprachigen Version des Programms SPSS unter

Windows und weitestgehend auch unter Macintosh-Systeme ab OS 9 zu geben.

Ausführliche Anleitungen zur gesamten Funktionalität des Programms finden Sie in der

Originaldokumentation der Firma SPSS, die als zusätzliche CD zu unserer Lizenz

mitgeliefert wird.

Das Programm SPSS für Windows enthält eine Fülle von Möglichkeiten, die in einer

Schrift dieser Größe nicht angesprochen werden können.

Die vorliegende Schrift setzt gute Kenntnisse der Oberfläche von Windows voraus.

Datenbestände für die Übungen und Beispiele

Alle Übungen und Beispiele dieser Schrift benutzen Datenbestände, die Sie entweder auf

CD vom Benutzersekretariat des Leibniz-Rechenzentrums (LRZ) (Raum-Nr. S0502, Tel.

(089) 289-28761) erhalten, oder aber über das Internet holen können:

Unter dem Begriff Datenbestände für die Übungen und Beispiele befinden sich alle in

dieser Einführung angesprochenen Dateien: Klicken Sie mit der rechten Maustaste den

gewünschten Dateinamen an, wählen Sie die Option Verknüpfung speichern unter ... und

speichern Sie die gewählte Übungsdatei lokal ab.

data.dat

data.sav

data.xls

data1.sav

data2.sav

data3.sav

demog.sav

scores.sav

LRZ: Einführung in SPSS für Windows http://www.lrz-muenchen.de/services/schulung/unterlagen/spss_13/

1 von 73 08.06.2009 15:59

leben.sav

kg1.sav

alcohol.sav

Teil 1: Handhabung der Bedienungsoberfläche

Starten des Programms

SPSS kann durch Doppelklicken (mit der linken Maustaste) auf dem SPSS-Ikon gestartet

werden. Beim Starten des Programms erscheint folgendes Fenster, das verschiedene

Möglichkeiten vor allem bezüglich Zugriff auf Daten anbietet:

Durch Anklicken des Feldes Dieses Dialogfeld nicht mehr anzeigen können Sie das

künftige Erscheinen dieses Fensters permanent unterdrücken.

Der Dateneditor

Unmittelbar nach dem Starten des Programms öffnet sich ein (leeres) Dateneditorfenster.

Die oberste Zeile dieses Fensters beschreibt dessen Funktion (SPSS Daten-Editor) und

enthält den Namen des Fensters: Hier Unbenannt, ein Hinweis darauf, dass das Fenster in

Form einer Datei noch nicht gespeichert wurde:

Die zweite Zeile („Datei...Bearbeiten...Ansicht“ usw.) enthält die Hauptmenüleiste. Diese


2 von 73 08.06.2009 15:59

erlaubt es, wie bei anderen Windows-Anwendungen auch, verschiedene Funktionen des

Programms zu aktivieren.

Die dritte Zeile enthält den fensterspezifischen Werkzeugkasten, der die schnelle

Aktivierung häufig benötigter Dienste der Hauptmenüleiste im Kontext des Dateneditors

realisieren lässt.

Der „Körper“ des Fensters enthält nummerierte Zeilen und mit der Überschrift var

versehene Spalten. Jede Zeile entspricht einem Fall (Patient, befragte Person, …), jede

Zeile einer Variablen (systolischer Blutdruck, Alter in Jahren, Geschlecht…)

Die leeren Zellen deuten an, dass noch keine Daten zur Verfügung stehen. (Wie SPSS

Daten erhält, sehen wir später.)

Unten links im Datenfenster findet man zwei Reiter:

Diese erlauben es, entweder die eingetragenen Daten — hier noch keine, also das leere

Datenfenster — oder die Variablendefinitionen, die wir später kennen lernen, zu

besichtigen.

Das letzte allgemein gültige Element ist die Informationsszeile, die Sie ganz unten im

aktiven Fenster sehen:

Im Laufe dieser Einleitung lernen Sie weitere Felder dieser Zeile kennen.

Übung

Klicken Sie den Menüpunkt Datei: an! Es erscheint ein Fenster, das Ihnen verschiedene

Möglichkeiten im Bereich der SPSS-Dateiverwaltung anbietet. Wie in Windows üblich,

werden die aktuell benutzbaren Elemente durch eine dunklere Färbung gekennzeichnet:

Ganz unten in diesem Fenster steht Ihnen z.B. die Möglichkeit zur Verfügung, SPSS zu

verlassen (Beenden). Darüber steht eine Liste weiterer Funktionen, die man durch

Anklicken sofort aktivieren kann:


3 von 73 08.06.2009 15:59

Klicken Sie Öffnen + Daten... an, so erscheint das übliche Windows-Datei-Manager-

Fenster, das Ihnen erlaubt, eine Datei zu öffnen. Dieselbe Funktionalität ist über das

übliche Öffnen-Werkzeug im Werkzeugkasten verfügbar.

Übung

Öffnen Sie die Datei data.sav!

Das Dateneditorfenster enthält die zu untersuchenden Daten und dient zur allgemeinen

Datenverwaltung – Einlesen, Transformieren, Berechnung neuer Variablen und vieles

andere mehr:

Unterhalb des schon besprochenen Werkzeugkastens befindet sich eine zweigeteilte Zeile,

die Information zu dem aktiven Datenfeld gibt: Das Zelleneditorfeld enthält den Wert 57.

Im Feld links davon steht 1:Bogen: Dieser Wert gehört zu dem 1. Fall des Datensatzes und

zur Variablen Bogen. Im Datenteil des Fensters ist das entsprechende Feld markiert

(schwarz umrandet).

Dateneingabe


4 von 73 08.06.2009 15:59

Unternimmt man eine Studie, so beobachtet man pro Fall (Patient, Schüler usw.)

verschiedene Variablen wie z.B. im obigen Datenfenster Geschlecht, Alter in Jahren,

Englischnote usw. Jeder Fall liefert bestimmte Werte (Daten) zu diesen Variablen: Der

erste Fall in diesem Beispiel lieferte den Fragebogen Nummer 57, besucht den Schultyp 1,

ist 14 Jahre alt, männlich, ist in der 9. Klasse, ... Die beobachteten Werte variieren (daher

die Bezeichnung „Variable“): Zum Beispiel ist der erste Schüler in diesem Datensatz 14

Jahre alt, der zweite ebenfalls, der dritte 10 und so weiter. Die Werte dieser Spalte

variieren, der Begriff „Alter“ bleibt jedoch konstant: Diese gesamte Spalte zur Variablen

Alter enthält ausschließlich die Altersangaben der Kinder.

Es ist von außerordentlicher Wichtigkeit für die gesamte Statistik (insbesondere für die

Prüfstatistik), dass folgende Konventionen eingehalten werden!

· Jede Zeile (Reihe) des Datenfensters enthält Daten zu einem einzigen Fall;

· kein Fall erscheint in mehr als einer Reihe;

· jede Spalte des Datensatzes enthält Werte zu einer einzigen Variablen.

Anmerkung

Es ist selbstverständlich möglich, Datensätze mit mehr als einer Zeile pro Fall in SPSS

einzulesen und zu verwalten. Solche Datensätze müssen jedoch vor der Anwendung

statistischer Prozeduren so umgestaltet werden, dass sämtliche zu analysierenden Variablen

eines jeden Falles in einer einzigen Zeile erscheinen. Das Programm SPSS enthält

Kommandos für dieser Umgestaltung.

Variablendefinition

SPSSbenötigt eine Zuordnung von Daten zu Variablen, die auch zur Kommunikation

zwischen dem Benutzer und dem Programm dient, z.B. um bestimmte Variablen zu

korrelieren oder um Grafiken zu erzeugen. Diese Zuordnung geschieht über die Vergabe

von Variablennamen: Jede Spalte muss mit einem eindeutigen Namen versehen werden.

Oberhalb der Spalten in der Dateiansicht des Daten-Editor-Fensters befindet sich eine

Leiste mit diesen Variablennamen:

Die Variablen in der aktiven Datei heißen also Bogen, Schultyp usw. – insgesamt zehn

Variablen.

Aber auch weitere Informationen zu Ihren Variablen können bzw. müssen definiert

werden. Über den Reiter Variablenansicht (links unten im SPSS Daten-Editor-Fenster)

gelangen Sie zu folgender Darstellung der Variablen, die solche Definitionen ermöglicht:


5 von 73 08.06.2009 15:59

Dieses Fenster enthält Einzelheiten zu diesen Definitionen:

· Name

Hier können Sie die Namen Ihrer Variablen eingeben. Variablennamen dürfen bis zu 64

Zeichen lang sein, wovon das Erste ein Buchstabe sein muss. Sonst darf das

Unterstreichenzeichen (_) zwar verwendet werden, jedoch lieber nicht als letztes Zeichen

eines Variablennamens. Sonderzeichen (vor allem das Leerzeichen) sollten bzw. müssen

auch vermieden werden. Trotz dieser maximalen Länge von 64 Zeichen, sollte in der Praxis

diese Länge 18 Zeichen nicht überschreiten, denn SPSS hackt einfach rechts ab, falls nicht

genug Platz in der Tabelle oder Diagramm zur Verfügung steht.

!Tipp

Sie machen sich das Leben einfacher, wenn Sie inhaltlich sinnvolle Namen zur Kennung

der Variablen benutzen: Alter ist ein wesentlich besserer Variablenname als etwa x3 oder

Gandalf oder Ähnliches.

· Typ

Klicken Sie im Typ-Feld neben der Variablen Bogen die Option „Numerisch“ und

anschließend auf dem Symbol in diesem nun schwarz umrandeten Feld! Es öffnet

sich folgendes Fenster:

Es befinden sich hier unter anderem die häufigsten Daten Typen Numerisch (das Feld ist

für numerische Werte – Zahlen – vorgesehen, die mathematisch verarbeitet werden


6 von 73 08.06.2009 15:59

können) und String (das Feld enthält beliebige Zeichen, typischerweise Buchstaben).

String-Variablen haben keine numerische Bedeutung und können natürlich auch nicht

numerisch verarbeitet werden. Die Breite des Feldes (das heißt: Anzahl Stellen insgesamt)

und gegebenenfalls auch davon die Anzahl Dezimalstellen könnten an dieser Stelle gesetzt

oder geändert werden (siehe den folgenden Punkt „Spaltenformat und Dezimalstellen“).

!Tipp

Meiden Sie (zum Beispiel bei Variablen wie Geschlecht) String-Variablen – Variablen

deren Daten, die Zeichen- oder Zeichenfolgen enthalten, wie etwa „m“ und „w“ für die

Ausprägungen einer Variablen Geschlecht; denn die gesamten nicht-parametrischen

Statistiken von SPSS verstehen diese nicht.

· Spaltenformat

Die Breite des Feldes und die Anzahl Dezimalstellen können auch hier gesetzt bzw.geändert werden. Beide Angaben können die Gestaltung der statistischen Ergebnistabellenund -grafiken von SPSS beeinflussen. Hiervon ein kleines Beispiel: Beide der folgendenTabellen enthalten den Mittelwert der Variablen Alter. Die erste Tabelle basiert auf derDefinition „Dezimalstellen = 1“:

Die zweite Tabelle basiert auf der Definition „Dezimalstellen = 2“:

!TippEs ist daher zu empfehlen, bei allen metrischen Variablen, bei denen Sie zum Beispiel

Mittelwerte berechnen möchten, die SPSS Formatierungsvoreinstellung (Feldbreit: 8;

davon Dezimalstellen: 2) unverändert zu akzeptieren. Bei Gruppierungsvariablen wie etwa

Geschlecht könnte man, wie hier, die Anzahl Dezimalstellen auf 0 setzen: Dieser Schritt ist

aber nicht notwendig.

· Variablenlabel

Das Variablenetikett (Variablenlabel) erlaubt die Definition einer längeren Beschreibung

(formal bis zu 256 Zeichen lang), die alle Zeichen der Tastatur enthalten darf


7 von 73 08.06.2009 15:59

(Sonderzeichen, Groß- und Kleinschreibung u.s.w.): Empfehlenswert ist trotzdem eine

Länge von ca. 18 Zeichen, denn ist ein Etikett zu lang für bestimmte Ausgaben (Tabellen

oder Grafiken), so hackt SPSS das nicht-passende Ende des Etiketts einfach ab.

!Tipp

Diese längeren Variablenlabels erscheinen in fast allen Ausgabetabellen und -grafiken von

SPSS, die Sie mühelos in Ihre Word-Datei importieren können. Nehmen Sie sich die Zeit,

schon bei der Dateneingabe diese Etikette so festzulegen, wie sie in Ihrer Arbeit erscheinen

sollen. Sie sparen sich dadurch viel spätere Mühe.

· Wertelabels

Bei Variablen mit wenigen Ausprägungen empfiehlt es sich, diese einzeln zu etikettieren.

Geschlecht beispielsweise hat gewöhnlich zwei Ausprägungen: männlich und weiblich.

Klicken Sie im Feld Wertelabels der Variablen Geschlecht und dann auf dem

Symbol in diesem nun schwarz umrandeten Feld! Es erscheint folgendes Fenster:

Neben dem Feld Wert geben Sie 0 ein – den Wert, der im Datenfenster die Ausprägung

„männlich“ kennzeichet: Darunter im Feld Wertelabel geben Sie männlich ein! Drücken

des Knopfes Hinzufügen überträgt diese Angabe in das untere Teilfenster. Verfahren Sie

ähnlich mit 1 und weiblich; sodass das Fenster nun so aussieht:

Mit OK werden diese Definitionen übernommen.

· Fehlende Werte


8 von 73 08.06.2009 15:59

Es kommt oft vor, dass Daten einfach fehlen – der Patient ist entlassen worden; der

Befragte gab keine Antwort; die Frage des Bogens wurde einfach nicht ausgefüllt.

Üblicherweise lässt man die Datenfelder zu solch fehlenden Werten einfach leer. Das Feld

sähe dann so aus:

Manchmal jedoch fehlen Variablen aus unterschiedlichen Gründen, die man getrennt

kodieren und untersuchen möchte. Beispiel: Bei einer Umfrage bei Passanten auf der

Straße zu politischen Ansichten ist eine Verweigerung aus Gewissensgründen (etwa: „Das

geht niemanden was an“) eine ganz andere, als Langeweile (etwa: „Ich will nicht mehr, hab'

was Wichtigeres zu tun“). Will man zwischen unterschiedlich motivierte Lücken im

Datensatz unterschieden, so kann man an dieser Stelle Sonderkodierungen vereinbaren, die

als fehlend gelten, die man jedoch nach Bedarf gezielt untersuchen könnte:

Klicken Sie im Feld Fehlende Werte neben der Variablen IQ und dann auf dem

Symbol um folgendes Fenster zu erhalten:

Die Voreinstellung (das, was SPSS macht, falls Sie keine Angaben machen) ist die, dass

fehlende Werte lediglich durch leere Felder (keine Eingabe) im Eingabefenster

gekennzeichnet sind. Die zweite Möglichkeit (Einzelne fehlende Werte) erlaubt die Angabe

von bis zu drei verschiedenen Kodierungen; die letze die Angabe sowohl von einem

Bereich (vom kleinsten bis zum größten Wert, die als fehlend zu behandeln sind) und

nach Bedarf von einem einzigen, speziellen Wert.

!Tipp

Nehmen Sie als Kodierung für fehlende Werte solche, die auf keinen Fall als normale

Antworten vorkommen können! Bei einer Angabe zum Alter von Schulkindern wäre zum

Beispiel ein Wert wie -999 eine sinnvolle Angabe, die Sie in doppelter Weise vor

Eingabefehlern schützt – das Alter kann weder negativ noch so groß wie 999 werden.

· Spalten

Diese Angabe spezifiert, wie breit die Spalte im Dateneditorfenster sein soll. Sie hat keinen

Einfluss auf die Gestaltung von Tabellen oder Grafiken. Es empfiehlt sich, diese Breite bei

der Voreinstellung zu lassen, damit man den Variablennamen in voller Länge sieht.


9 von 73 08.06.2009 15:59

(Versuchen Sie aus Spaß, diesen Wert bei einer beliebigen Variablen auf 1 zu setzen und

beobachten Sie die Ergebnisse!)

· Ausrichtung

Auch diese Angabe berührt lediglich das Erscheinungsbild des Dateneditorfensters und

gibt an, ob die Daten links- oder rechtsbündig im Datenfeld angezeigt werden sollten. Auch

hier besteht kein Grund, die SPSS-Voreinstellung (rechtsbündig) zu ändern.

· Messniveau

SPSS unterscheidet drei Messlevels (mehr zu diesem Thema finden Sie in der LRZ-Schrift

SPSS for Windows – Special Topics: Einige Grundbegriffe der Statistik: Siehe Anhang B:

Dokumentation):

1. Nominal: Nominalskalierte Variablen mit einigen, wenigen Ausprägungen (wie zum

Beispiel Geschlecht mit den Ausprägungen 0 für männlich und 1 für weiblich) besitzen

keine numerisch/mathematische Bedeutung: Sie dienen lediglich zur Klassifizierung oder

Gruppierung der Fälle. Solche Variablen dürfen Zeichenketten („m“ und „w“, etwa) oder

aber auch Zahlen beinhalten, aber: Auch wenn zum Beispiel „männlich“ als „1“ und

„weiblich“ als „2“ kodiert wären, besäßen diese Werte trotzdem keine numerische

Bedeutung, sondern fungieren nach wie vor lediglich als Etikett. Man könnte ja die

Etikettierung genau anders herum vornehmen (1 = weiblich, 2 = männlich), oder (99 =

männlich, 999 = weiblich) oder... . Die rein etikettierende Funktion solcher „Zahlen“ (die

im rechnerischen Sinne gar keine Zahlen sind, sondern lediglich beliebige Zeichen) bleibt

unverändert.

2. Ordinal: Die eingetragenen Werte geben bei ordinalen Variablen eine Reihenfolge

an. Kodiere man zum Beispiel Alter in drei Gruppen (jung, mittel, alt), so wüsste man

zwar, dass eine Person der Gruppe „jung“ jünger ist als Personen der beiden anderen

Gruppen, wüsste aber nicht, wie viel jünger. Würde man die Variablen mit „1“ (jung) „2“

(mittel) und „3“ (alt), so wüsste man also, dass zwar Personen der Gruppe 1 jünger sind als

die der Gruppe 2 und Personen beider Gruppen jünger sind als Personen der Gruppe 3:

Man könnte aber nicht behaupten, Personen der Gruppe 2 wären doppelt so alt wie die der

Gruppe 1.

3. Metrisch: Variablen, deren Werte numerische Bedeutung haben. Beispiel: Alter in

Jahren – ein zehnjäriges Kind ist (innerhalb der Messpräzision) doppelt so alt wie ein

fünfjähriges. Der Altersunterschied zwischen einer 16- und einer 18-jährigen Person ist

genauso groß wie der zwischen einer 75- und einer 77-jährigen Person.

!Tipp

Noch einmal (da es so wichtig ist): Es lohnt sich, sich bei der Datendefinition Mühe zu

machen, denn die dort festgelegten Etikette werden auch, soweit möglich, von den

Statistik- und Graphikprozeduren zur Gestaltung der Ausgabe benutzt, sodass diese sofort


10 von 73 08.06.2009 15:59

ohne weiteres Editieren in druckfertigen Arbeiten übernommen werden kann.

Zugriff auf Dateien

Zu jeder Variablen müssen dem Programm die zu analysierenden Rohdaten bereitgestellt

werden. Hierzu gibt es einige Möglichkeiten:

Eingabe von Rohdaten im SPSS-Daten-Editor-Fenster

Über den Menüpunkt Datei + Neu + Daten öffnen Sie eine neues, leeres Daten-Editor-

Fenster. In diesem Fenster ist ein Datenfeld schwarz umrandet (unmittelbar nach dem

Öffnen eines neuen Fensters ist dies das erste Feld oben links). Tippen Sie als Beispiel nun

die Zahl 017 ein.

Zunächst erscheint diese Eingabe im Zelleneditorfeld oberhalb der Datenfelder: Hier

können Sie Änderungen vornehmen. Mit der Eingabe-Taste wird die Zahl (ohne führende

„0“) in das Datenfeld übertragen, und das Eingabefeld positioniert sich eine Zeile weiter

nach unten. Sie können die Eingabe auch mit der Pfeil-rechts- oder der Tabulator-Taste

quittieren und somit ein Feld weiter rechts weiterpositionieren.

!Tipp

Legen Sie zunächst im Variablensichtfenster sämtliche Variablendefinitionen fest. Erst

dann tragen Sie Ihre Daten ein!

Übung

Anhang A enthält zwei ausgefüllte Beispielfragebögen zu den Variablen Bogen, Schultyp,

Alter, Geschlecht, Klasse, Deutsch, Mathe, Englisch, IQ und Chancen. Öffnen Sie über

Datei + Neu + Daten ein leeres Dateneditorfenster, legen Sie die Variablendefinitionen

fest und tragen Sie die Daten der beiden Bögen ein! Sichern Sie diese Datei (über Datei +

Speichern) unter dem Namen meindat!

Anmerkung:

Die Deutsch-, Englisch- und Mathenoten sind zwar unter dem allgemeinen Begriff „Noten“

hier subsumiert, dieser übergeordnete Begriff ist aber mit keiner eigenen Eingabe

verbunden – und benötigt also keine Spalte für sich. Wir definieren lediglich die

Variablen für die wir einzelne Eingaben haben – hier also Deutsch, Englisch und Mathe.

Öffnen einer schon bestehenden SPSS-Systemdatei

Öffnen Sie einfach die Datei!

Einlesen von Text-Daten

Text-(ASCII-)Daten sind einfach Rohdaten, die zum Beispiel mit einem üblichen

Textverarbeitungsprogramm eingegeben wurden. Datei + Textdaten lesen öffnet ein

Fenster, das die Auswahl einer Text-Datei ermöglicht. Wählen Sie die Datei data.txt aus!

Es öffnet sich der Assistent für Textimport:


11 von 73 08.06.2009 15:59

Das untere Subfenster (Textdatei:) stellt die einzulesenden Daten dar, wobei die erste Zeile

(wie hier) Variablennamen enthalten darf, die restlichen Zeilen Daten enthalten müssen

(ein eventuell erscheinendes, kleines Quadrat entspricht einem Tabulator in der

ursprünglichen Datei).

Klicken sie nun auf Weiter >! Das Fenster zum zweiten Schritt der Definition öffnet sich.

Im oberen Teil des Fensters wird nach der Art der Formatierung der Daten gefragt. Mit

Trennzeichen bedeutet, dass die Daten zu den Variablen durch bestimmte Zeichen

(Leerzeichen, Kommata,..) getrennt sind:


12 von 73 08.06.2009 15:59

Feste Breite bedeutet, dass sämtliche Daten zu allen Variablen in bestimmten Spalten

erscheinen.

Der untere Teil des Fensters zeigt die ersten vier Zeilen der einzulesenden Datei an.

Nach Auswahl der passenden Option und anklicken von Weiter > öffnen sich weitere, sich

selbsterklärende Steuerungsfenster zum flexiblen Einlesen von fest- oder freiformatierten

Klartextdatensätze.

Einlesen von „fremden“ Dateiformaten

· Excel-Datenbestände

Das Einlesen von Daten aus Excel-Tabellen oder -Mappen geschieht einfach über die

übliche Funktion Datei öffnen und Auswahl des Dateityps Excel (*.xls):


13 von 73 08.06.2009 15:59

Markieren Sie nun die gewünschte Datei und klicken Sie auf Öffnen:

Klicken Sie Variablennamen einlesen, um SPSS mitzuteilen, dass die erste (und

ausschließlich die erste!) Zeile der angezeigten Excel-Tabelle SPSS-Variablennamen

enthält: Diese müssen die bekannten SPSS-Namenskonventionen einhalten – maximal 64

Zeichen lang, wovon das erste ein Buchstabe sein muss, die restlichen Buchstaben oder

Ziffern ('_', jedoch nicht als letztes Zeichen; keine Sonderzeichen!) sein dürfen. Handelt es

sich um eine Excel-Mappe, die ja mehrere Tabellen enthalten kann, so erscheint ein leicht

erweitertes Fenster, das Ihnen erlaubt, eine bestimmte Tabelle dieser Mappe zu selektieren

und einzulesen.

Wollen Sie lediglich einen Teil der Tabelle in SPSS einlesen, so definieren Sie im Feld

Bereich diesen gewünschten Teil – zum Beispiel B1:D26, um die zweite, dritte und vierte

Variablen, deren SPSS-Variablennamen und die ersten 25 Datenzeilen der Datei

einzulesen.

· Datenbankzugriffe

SPSS bietet über den Hauptmenüpunkt Datei + Datenbank öffnen... die Möglichkeit an,

Daten aus verschiedenen fremden Quellen wie zum Beispiel Oracle- oder DBase-

Datenbanken zur Verfügung zu stellen und über Datenbankabfragen, bestimmte

Datenmengen im SPSS-Dateneditorfenster zur Verfügung zu stellen. Die SPSS-Manuale

enthalten Einzelheiten dazu.

Gestaltung der Variablenlisten

Typisch für die Steuerung von SPSS-Prozeduren ist ein Steuerungsfenster, die eine Liste

der definierten Variablen beinhaltet:


14 von 73 08.06.2009 15:59

Die Gestaltung dieser Variablenliste kann über Bearbeiten + Optionen... unter dem Reiter

Allgemein und dort unter Variablenlisten gesteuert werden:

Die obere Hälfte dieses Subfensters steuert die Darstellung als Variablenetikett (Labels

anzeigen) oder aber (wie hier) Variablennamen (Namen anzeigen). Die untere Hälfte

steuert die Reihenfolge der Darstellung: (wie hier) Alphabetisch oder aber in der

Reihenfolge des Erscheinens im Datenfenster (Datei).

Wählen Sie die alphabetische Reihenfolge der Variablennamen (wie oben) aus!

Datenmanipulation

Falls nicht schon getan, öffnen Sie die Datei data.sav!

Es ist manchmal notwendig, bestehende Variablen zu verändern oder aus bestehenden

Variablen neue zu berechnen. Unter dem Menüpunkt Transformieren bietetSPSS hier

einige Möglichkeiten an:

Umkodieren

Umkodieren unterstützt das Verändern der Werte einer schon vorhandenen Variablen (In

dieselben Variablen...) – die alten Werte werden dabei überschrieben (vernichtet) – sowie

das Erzeugen einer neuen Variablen (In andere Variablen...).

!Tipp

Es ist ratsam, eine neue Variable zu kreieren, statt die alte zu vernichten, denn oft braucht

man die alten Werte doch noch.

Übung

Aktivieren Sie Transformieren + Umkodieren + In andere Variablen …! Übertragen Sie

nun die Variable Alter in das Fenster Eingabe Var.: -> Ausgabevar.: - (der Text Eingabe

Var. ändert sich autmatisch in Numerische Var.). Benennen Sie die neu zu kreierende

(Ausgabe) Variablen und sein längeres Etikett wie etwa in folgender Abbildung:


15 von 73 08.06.2009 15:59

Mit Ändern wird die Verbindung der neuen mit der ursprünglichen Variablen festgelegt.

Um nun die neuen Werte zu erzeugen gibt es zwei Möglichkeiten:

· Die Taste Falls... erlaubt die Auswahl bestimmter Fälle, für welche die

Datenänderung durchgeführt werden soll.

· Die Taste Alte und neue Werte... öffnet folgendes Fenster:

Unter der Rubrik Alter Wert definiert man den Wert, der zu ersetzen ist, unter Neuer Wert

gibt man die Ersatzwerte an. Wert erlaubt unter anderem die Angabe eines einzelnen

Wertes. Fehlende Werte können gesondert behandelt werden. Mit Bereich wird ein Bereich

von Werten festgelegt. Beispiele:

· erlaubt die Angabe eines Bereichs – hier für

Werte der Variablen alter von 13 bis 15.

· erlaubt die

Angabe eines

Bereichs vom

kleinsten im Datenbestand enthaltenen Wert bis zum angegebenen Wert (hier für Werte bis


16 von 73 08.06.2009 15:59

12 Jahren).

· erlaubt die Angabe eines Bereichs vom angegeben

Wert bis zum größten im Datenbestand enthaltenen Wert

(hier für Werte ab 16).

Unter Neuer Wert können Sie nun die gewünschte neue Kodierung eingeben und mittels

Hinzufügen festlegen.

Übung

Folgende Tabelle verbindet die Werte der ursprünglichen Variablen Alter mit denen der zu

erzeugenden Variablen Altersgruppierung:

Alter Altersgruppierung

bis 14 Jahren 1

14 bis 17 Jahren 2

17 Jahre und älter 3

Führen Sie die Umkodierung durch! Vergessen Sie nicht, von der Variablenansicht des

Datenfensters aus, die Wertelabels entsprechend zu definieren!

Anmerkung: Wie zu erwarten: Gruppe 1 enthält Jugendliche bis 13,999... Jahren; Gruppe 2

von 14 bis 16,999... Jahren; Gruppe 3, 17 Jahre und älter.

Berechnen

Transformieren + Berechnen... öffnet folgendes Fenster:

Im Zielvariablen-Feld wird der Name der zu kreierenden Variablen eingegeben. Das Feld

Numerischer Ausdruck erhält eine Beschreibung, wie diese Zielvariable zu berechnen ist.


17 von 73 08.06.2009 15:59

Unter Funktionsgruppe wählen Sie Statistisch und im Fenster „Funktionen und

Sondervariablen“ Mean aus (dabei ignorieren Sie diese hässliche Mischung aus Englisch

und Deutsch)! Im Subfenster links davon erscheint eine Erklärung des Angeklickten.

Übung

Berechnen Sie die neue Variable Schnitt, die den Mittelwert pro Schüler der Schulnoten

(Variablen: Deutsch, Englisch, Mathe) enthält. Die Funktion

MEAN(numAusdr,numAusdr,...) aus der Funktionsliste kann hierzu benutzt werden: Diese

kurze Beschreibung der Funktion deutet an, dass die verschiedenen Ausdrücke (hier

einfach: Variablen), deren Mittelwert berechnet werden soll, durch Kommata zu trennen

sind. Benutzen Sie den nach obenhinweisenden, dreieckigen Pfeil, um die Funktion und

die Variablennamen ins Subfenster Numerischer Ausdruck zu übertragen!

Ihr ausgefülltes Steuerfenster sollte nun so aussehen:

Führen Sie (mit OK) den Vorgang durch! Inspizieren Sie das Dateneditorfenster: Die neu

berechnete Variable befindet sich am rechten Ende des Fensters.

!Tipp

Fehlt bei einem bestimmten Fall ein Wert bei einer (oder mehreren) Variablen (hier:

Deutsch, Englisch, Mathe) so erhält die Zielvariable (hier: Schnitt) den Mittelwert der

restlichen, nicht fehlenden Werte. Sollte bei irgendeinem Falle alle drei Werte fehlen, so

wird auch die Zielvariable als fehlend definiert.

Übung

· Definieren Sie passende Ausprägungs-Etiketten für die gerade erzeugte Variable!

Umkodieren in aufeinanderfolgende Zahlen

Mehrere Prozeduren in SPSS erkennen String- (Zeichenketten-)Variablen nicht, sodass

Einträge wie: „j“ für „jung“, „m“ für „mittel“, „a“ für „alt“ in Zahlen umkodiert werden


18 von 73 08.06.2009 15:59

müssten. Zudem verlangen mehrere Prozeduren eine Kodierung kategorialer Variablen als

aufeinanderfolgenden Zahlen (zum Beispiel: 1, 2, 3, statt 7, 19, 23), anderer laufen

merklich effizienter mit einer solchen Kodierung. Es mag also durchaus Sinn machen ,

Stationen eines Krankenhauses mit den Nummern der Station zu identifizieren, für die

Verarbeitung mit SPSS ist dies jedoch nicht zu empfehlen: Ein Umkodierung ist

angebracht. SPSS bietet ein bequemes Werkzeug hierfür. Über Transformieren …

automatisch umkodieren erhält man das Steuerungsfenster dazu. Übertragen Sie die

Variable Klasse ins Subfenster Variable -> Neuer Name und definieren Sie einen Namen

für die neue Variable. Die restlichen Möglichkeiten des Fensters sind selbsterklärend.

Datensicherung

Der Inhalt des Dateneditorfensters (das heißt natürlich auch: des Datenbestandes) kann

über das Werkzeugkastensymbol oder aber über Datei + Speichern gespeichert

(gesichert) werden. Mit Speichern unter. . . können Sie Ihre Daten auch unter einem

anderen Namen oder zum Beispiel als Excel-Datei speichern.

!Tipp

Falls Sie Ihre Daten ändern, so sichern Sie diese sofort, ohne auf das Ende der

Arbeitssitzung zu warten! So beugen Sie unnötige Datenverluste vor.

Mehr als ein Datensatz?

SPSS erlaubt lediglich ein einziges aktives Datenfenster. Man kann zwar mehrere

SPSS-Sitzungen parallel zueinander starten, das wären aber unabhängige Sitzungen: man

könnte z.B. die Variablen- und Wertelabels aus einer Datei (mittels Kopieren und

Einfügen) in einer zweiten übernehmen, aber die Analyse beider Datensätze ist nur dann

möglich, wenn diese Dateien zusammengefügt werden – d.h.: Daten können nur

zusammen untersucht werden, wenn sie in einem und demselben Datenfenster sind. Wie

fügt man also zwei Datensätze zusammen?


19 von 73 08.06.2009 15:59

Daten + Dateien zusammenfügen bietet zwei Möglichkeiten an:

Hinzufügen von zusätzlichen Fällen

Über Fälle hinzufügen... teilt man SPSS einfach den Namen der Datei mit, die die Daten

der zusätzlichen Fälle enthält. Diese werden ans untere Ende Ihres Datensatzes hinzugefügt.

Gewöhnlich enthalten beide Dateien Daten zu denselben Variablen. Kommen aber

Variablen in der einen Datei vor, die in der anderen nicht definiert sind, so erzeugt SPSS

automatisch eine Variable, deren Werte im entsprechenden Teil der neuen Datei einfach

fehlen (das heißt: Sie werden als „fehlend“ gespeichert).

Hinzufügen von zusätzlichen Variablen

Um zusätzliche Variablen (über Fälle hinzufügen...) hinzuzufügen muss man etwas

präziser vorgehen: Damit die Dateien korrekt gemischt werden können, müssen beide nach

einer gemeinsamen Variablen sortiert sein.

!Tipp

Alle Datendateien sollten ausnahmslos eine spezielle Variable enthalten, die zur

eindeutigen Identifikation der Fälle dient (Schlüsselvariablen)! Eine solche Variable ist

unter anderem schon bei der Datenkorrektur oder beispielsweise bei der Suche nach

„Ausreißern“ eine große, bei dem Mischen von Dateien eine schier unumgängliche Hilfe.

Bevor Sie den Mischvorgang starten, sortieren Sie beide Dateien aufsteigend nach diesem

gemeinsamen Schlüsselvariablen! Da lediglich eine Datei im Datenfenster zur Verfügung

stehen kann, müssen Sie diese sortieren und schließen, um dann die zweite Datei zu öffnen

und ebenfalls nach dem gemeinsamen Schlüssel zu sortieren. Dies geschieht über Daten +

Fälle sortieren. . .

Übung

Öffnen Sie die Datei demog.sav, die die demographischen Variablen Schultyp, Alter,

Geschlecht, Klasse und die Schlüsselvariablen Bogen enthält. Übertragen Sie letztere ins

Sortieren Nach:-Fenster und sortieren Sie den Datenbestand aufsteigend nach dieser

Schlüsselvariablen! Speichern Sie diese Datei unter dem Namen demog_sortiert.sav und

öffnen Sie die Datei scores.sav, die die Variablen Deutsch, Englisch, Mathe, Chancen und

selbstverständlich auch die Schlüsselvariablen Bogen enthält. Sortieren Sie auch diese

Datei aufsteigend nach der gemeinsamen Schlüsselvariablen und speichern Sie sie unter

dem Namen scores_sortiert.sav!


20 von 73 08.06.2009 15:59

Nach Daten + Dateien zusammenfügen + Variablen hinzufügen... wählen Sie die Datei

demog.sav aus. Folgendes Fenster öffnet sich:

Das Fenster Ausgeschlossene Variablen listet die Variablen auf, die nicht in der

gemischten Datei erscheinen werden – hier die Variable Bogen aus der Datei demog.sav (+

kennzeichnet Variablen der hinzuzufügenden Datei, * die der aktuellen Arbeitsdatei). Diese

Variable Bogen ist ja schon im Fenster Neue Arbeitsdatei enthalten, das die Variablen der

gemischten Datei anzeigt. Wir können und sollten jedoch diese Variablen als

Schlüsselvariablen zur Verknüpfung beider Dateien benutzen: D.h. Fälle beider Dateien

werden anhand dieser gemeinsamen Variablen verglichen und erst dann zusammengefügt,

falls die Werte der Schlüsselvariablen in beiden Dateien übereinstimmen – ein zusätzlicher

Schutzmechanismus, der für die Abstimmung beider Dateien sorgt. Übertragen Sie nun

Bogen in das Fenster Schlüsselvariablen und führen Sie die Mischung aus!

!Tipp – und eine Warnung!

Da man das Programm SPSS mehrmals starten kann, könnte man es einmal mit dem einen,

einmal mit dem anderen Teildatensatz starten, die Variablen/Fälle im dem einen Teil

markieren, mit Bearbeiten + Kopieren in die Zwischenablage kopieren, zur anderen

Instanz von SPSS wechseln, um dort über Bearbeiten + Einfügen die Daten zuzumischen.

Dieser Vorgang ist zwar schnell und beim Hinzufügen von zusätzlichen Fällen sogar zu

empfehlen: Beim Hinzumischen von zusätzlichen Variablen fehlt jedoch der wichtige

Schutzmechanismus der Schlüsselvariablen.

Auswahl gezielter Untermengen der Fälle

Falls nicht schon getan, öffnen Sie die Datei data.sav!

Untersuchungen anhand einer kategorialen (Gruppierungs-)Variablen

Es ist oft notwendig, eine bestimmte Analyse mit unterschiedlichen Datenmengen zu

wiederholen: Pro Krankenhaus oder -station, Schultyp, Bundesland usw. – d.h. nach den

Ausprägungen einer oder mehrerer kategorialen Variablen.


21 von 73 08.06.2009 15:59

Daten + Datei aufteilen... öffnet folgendes Fenster:

Per Voreinstellung werden alle Fälle – ohne Gruppierung – untersucht (Alle Fälle

analysieren, keine Gruppen bilden).

Die Auswahl Gruppen vergleichen erzeugt – abhängig von der aufgerufenen Prozedur –

einen Vergleich zwischen den Gruppen, produziert z.B. eine Tabelle mit nach Gruppen

geordneten Einträgen.

Die Auswahl Ausgabe nach Gruppen aufteilen erzeugt z.B. getrennte Tabellen, eine pro

Gruppe.

Die Definition solcher Gruppen geschieht über die Auswahl einer kategorialen

(Gruppierungs-) Variablen (wie etwa Schultyp), die ins Subfenster Gruppen basierend auf

übertragen wird.

!Tipp

Die Informationszeile ganz unten im SPSS Datenfenster zeigt im rechten Feld an, dass

Datei aufteilen aktiviert ist:

Vergessen Sie nicht, diese Funktion wieder zu deaktivieren, sobald der gesamte

Datenbestand wieder untersucht werden soll! Diese Deaktivierung geschieht über das

Fenster Datei aufteilen... und die Auswahl der Option Alle Fälle analysieren, keine

Gruppen bilden: Die Meldung (Datei aufteilen an) in der Informationszeile verschwindet.

Auswahl auch anhand von kontinuierlichen Variablen

SPSS bietet einige Möglichkeiten an, bestimmte Fälle anhand der Werte ihrer Variablen zur

Analyse auszuwählen – zum Beispiel: Alle Patienten der Neurochirurgie, die über 45 Jahre

alt, privat versichert sind und mindestens einmal schon operiert wurden. So lange die

Auswahl in Kraft bleibt, werden nur Daten der selektierten Fälle untersucht, die der

restlichen Fälle ignoriert.


22 von 73 08.06.2009 15:59

Beispiel

Man möchte die Werte lediglich der Kinder untersuchen, die a) weiblich und b) älter als 13

Jahre sind.

Daten + Fälle auswählen. . . öffnet folgendes Fenster:

Dieses Fenster bietet einige Varianten an, wir besprechen jedoch lediglich die Möglichkeit

Falls Bedingung zutrifft. Aktiviert man diese Option und klickt man auf Falls... so kann

man z.B. Folgendes definieren:

Das „&“ bedeutet, dass beide Bedingungen gleichzeitig erfüllt werden müssen, bevor ein

Fall selektiert wird. Mittels Weiter und OK bewirkt man, dass bis zur Deaktivierung des

Filters, nur Mädchen (Geschlecht = 1) über 13 Jahre (Alter > 13) untersucht werden.

!Tipp

Auch hier zeigt die Informationszeile an, dass ein Filter aktiviert ist:


23 von 73 08.06.2009 15:59

Zudem sind in der grauen, linken Spalte des Datenfensters in der Datenansicht alle nicht-

ausgewählten Fälle durchstrichen.

Nicht vergessen, auch diesen Filter wieder auszuschalten (mittels Daten + Fälle

auswählen und anklicken von „Alle Fälle“), sobald er nicht mehr benötigt wird.

Steuerung der Statistik-Prozeduren: Überblick

Übung zur Vorbereitung

Starten Sie SPSS und lesen Sie die Datei datal.sav ein!

!Tipp

Ist SPSS schon aktiviert, geht dies wie beschrieben über Datei + Öffnen. Sonst kann es

schneller sein, im Windows Explorer die Datei zu suchen und einfach auf deren Symbol

„doppelzuklicken“. SPSS wird dann automatisch mit dem ausgewählten Datensatz gestartet.

Bei von SPSS schon benutzten Dateien, kann man auch über Datei ... Zuletzt verwendete

Daten diese besonders schnell öffnen.

Über den Hauptmenüpunkt Analysieren + Deskriptive Statistiken + Kreuztabellen...

öffnen Sie als Beispiel für die typische SPSS-Prozedursteuerung das Steuerfenster für

Kreuztabellen: Aus der Variablenliste links klicken Sie die Variable Geschlecht an und

übertragen Sie diese durch Anklicken des Dreieck-nach-rechts-Taste in das Zeilen-

Subfenster. Übertragen Sie auf ähnliche Weise die Variable Schultyp in das Subfenster

Spalten:

Dieses Fenster weist einige Eigenschaften aus, die immer wieder bei der Steuerung der


24 von 73 08.06.2009 15:59

Statistik-Routinen auftreten:

· links erscheint eine Variablenliste;

· rechts davon erscheint ein (oder mehrere) Fenster für die zu analysierende(n)

Variable(n);

· dazwischen sind dreieckige Pfeilknöpfe, die die Übertragung markierter Variablen in

die eine oder andere Richtung ermöglichen.

Getrennt von diesen Variablenauswahldiensten befinden sich prozedurspezifische

Steuerungsmöglichkeiten – in diesem Fall zwei (durch Anklicken) ankreuzbare Schalter

und vier Knöpfe, die weitere Steuerungsfenster öffnen. Einige dieser Möglichkeiten

werden später näher beschrieben.

Das „Anklicken“ in einem Prozedurfenster generiert (zunächst unsichtbare) Steuerbefehle

für SPSS. Ganz rechts sind vier Knöpfe, die das Ausführen dieser Befehle betreffen:

· OK führt die Befehle aus

· Einfügen kopiert die (sonst unsichtbaren) Befehle in Klartext in ein Syntax-Fenster:

Dort können Sie „per Hand“ editiert (erweitert, geändert) werden. Syntax-Fenster werden

später besprochen.

· Zurücksetzen bringt das Fenster in den ursprünglichen Zustand wieder (d.h. alles,

was man definiert hat, wird „vergessen“ und die Voreinstellungen wieder in Kraft gesetzt).

· Abbrechen schließt das Fenster, ohne die Befehle auszuführen.

· Hilfe bietet Unterstützung und lnformationen mittels der Windows-typischen

Hypertext-Schnittstelle an.

Klicken Sie nun auf OK!

Das wissensbasierte Informationssystem von SPSS

Über die rechte Maustaste kann die wissensbasierte Datenbank des Programms konsultiert

werden.

Beispiel:

Über Analysieren + Mittelwerte vergleichen wählen Sie Mittelwerte... aus, um einfache

Statistiken zu Gruppenmittelwerten und -unterschieden zu erhalten. Die Abhängige

Variable soll das IQ, die Unabhängige Variable die Art der Schule sein:


25 von 73 08.06.2009 15:59

Über Optionen... gelangen Sie nun zu einem Fenster, das eine Fülle von Statistiken

anbietet. Angenommen, Sie möchten wissen, was die Option Anova Tabelle und Eta (im

Kästchen unten links) bedeutet, so klicken Sie mit der rechten Maustaste in dessen

Textfeld, um folgende Erklärung zu erhalten:

Wählen Sie nun Anova Tabelle und eta aus und lassen sie mittels Weiter und OK unter

anderem folgende Tabelle erzeugen:

Zusammenhangsmaße

Eta Eta-Quadrat

Intelligenzquotient

* Art der Schule,725 ,525

Aktivieren Sie durch Doppelklick diese Tabelle, klicken Sie mit der rechten Maustaste auf

der Überschrift Eta-Quadrat, danach auf Direkthilfe. Sie erhalten über das nun

erscheinende Steuerfenster, Auswahl Direkthilfe, detailliertere Auskunft:


26 von 73 08.06.2009 15:59

Ausgabefenster und der Viewer

Unmittelbar nach dem Starten von SPSS ist lediglich das Daten-Editor-Fenster offen. Falls

kein Ausgabefenster schon geöffnet wurde, so öffnet das Ausführen einer Prozedur

automatisch ein Ausgabefenster, das die Ergebnisse der SPSS-Vorgänge erhält. Nach

Aufruf der Datei-Informationen und der Prozedur Kreuztabelle sähe die Ausgabedatei

(eher: ein Teil davon) so aus:

Alle Meldungen von SPSS, vor allem auch statistische Ausgabe wie Tabellen und

Grafiken, erscheinen in einem solchen Viewer-Fenster. Dieser Viewer ermöglicht sowohl

die schnelle Positionierung innerhalb der unter Umständen umfangreichen Ergebnisse als

auch die flexible Gestaltung dieser Ergebnisse.

Das Viewer-Fenster teilt sich in ein Übersichtstfeld (links) und ein Inhaltsfeld (rechts). Die

Trennlinie zwischen beiden Feldern kann mit Hilfe der linken Maustaste verschoben

werden.

Das Übersichtsfeld ist ein hierarchisch geordnetes Inhaltsverzeichnis, das Ihre

Arbeitssitzung mit SPSS protokolliert. Im Beispiel zeigt es an, dass die Ausgabe zwei

„Absätze“ (eine Kreuztabelle und Ausgabe der Prozedur „Mittelwerte“) enthält. Den Inhalt

beispielsweise des Übersichtsabsatzes Kreuztabellen kann man durch einen Klick auf dem

Minuszeichen links von der Crosstabs-Überschrift verstecken. Das Minus- ändert sich

dann in ein Pluszeichen. Ein erneuter Klick darauf zeigt wiederum den gesamten Inhalt

wieder an.


27 von 73 08.06.2009 15:59

Dieser Absatz Kreuztabellen enthält vier Elemente: Klicken Sie auf Titel. Der rote Pfeil im

Übersichtsfeld bewegt sich zum Titel und auch im Inhaltsfeld erscheint ein roter Pfeil

neben dem Inhalt des Titels. Der Titel selbst ist mit einem verziehbaren Rahmen versehen.

Im Übersichtsfeld neben Titel ist ein kleines, offenes Buchsymbol: Ein Doppelklick darauf

„schließt“ das Buch; auch der Inhalt im Ausgabefenster wird unsichtbar. (Der Inhalt wird

dadurch nicht gelöscht: Das erreicht man erst mit Markierung des Elements bzw. der

Elemente und Betätigung der Löschtaste der Tastatur.) Ein zweiter Doppelklick öffnet das

Buch: Dessen Inhalt erscheint erneut im Ausgabefenster.

Übung

Über einen Doppelklick im Titelfeld ändern Sie „Kreuztabelle“ in „Crosstabs“. Versuchen

Sie auch, mehrere Zeilen einzutippen. Beenden Sie diese Verarbeitung durch Klicken

irgendwo außerhalb des Feldes.

Mehrere Viewer-Fenster

Für seine Ausgabe benötigt SPSS mindestens ein Viewer-Fenster. Es ist auch möglich,

mehrere solche Fenster zu öffnen. Das Öffnen eines neuen Fensters geschieht über Datei

+ Neu + Ausgabe. Nun muss zwischen

· aktiven und nicht-aktiven

und

· designierten und nicht-designierten Fenstern unterschieden werden:

Ein aktives Viewer-Fenster ist das aktuell angeklickte Fenster, wo sich der Cursor

üblicherweise befindet. Dieses Fenster ist durch eine unterschiedliche Färbung (mit der

Windows-Voreinstellung dunkelblau) der obersten Zeile gekennzeichnet. Klickt man in

einem zweiten Viewer-Fenster, so wird dieses aktiv, alle anderen bleiben/werden

deaktiviert.

Ein designiertes Fenster ist das Viewerfenster, in dem aktuell SPSS seine Ausgabe

(Grafiken, Tabellen, ...) schreibt. Das designierte Fenster wird durch ein rotes

Ausrufezeichen im Informationsbereich (links neben den Prozess-Mitteilungen) angezeigt:

Entsprechend gibt es im Werkzeugkasten eines nicht-designierten Viewerfensters ein rotes

Ausrufezeichen: Anklicken dieses Zeichens macht dessen Fenster zum designierten.

Übung

Öffnen Sie ein neues Viewer-Fenster und machen Sie dieses zum designierten Fenster!

Führen Sie das Kreuztabellen-Beispiel wieder aus!

Werkzeuge im Viewer


28 von 73 08.06.2009 15:59

Der Viewer bietet einige Werkzeuge zur bequemen Gestaltung Ihrer Ausgabe:

Drei Werkzeuge zum Einfügen von Textelementen erlauben das Einfügen

von einer Absatzüberschrift bzw. von Titelzeilen bzw. von beliebigem Text.

Übung

Fügen Sie eine neue Absatzüberschrift ein!

Zwei Werkzeuge zum Öffnen/Schließen von Absatzinhalten

Expandieren bzw. Kollabieren (Öffnen bzw. Schließen) von Absätzen. Diese

Werkzeuge haben dieselbe Wirkung wie das Anklicken der Plus- bzw. Minus-

Zeichen im Inhaltsübersicht des Viewers.

Werkeuge zum Verändern der Hierarchie:

Schiebt das markierte Element eine Stufe höher bzw. tiefer in der Hierarchie.

Werkzeuge zum Anzeigen und zum Verstecken von Ausgabeteilen:

Den sichtbaren Ausgabeteil unsichtbar bzw. den unsichtbaren sichtbar machen.

Übungen

1. Öffnen Sie die Anmerkungen (per Voreinstellung zunächst nicht sichtbar).

2. Wiederholen Sie den Kreuztabellen-Vorgang (um eine zweite Prozedurausgabe zu

erzeugen).

3. Machen Sie den Inhalt des 1. Kreuztabellen-Absatz unsichtbar! Verschieben Sie den

zweiten Kreuztabellen-Absatz vor den ersten (markieren und anschließend mit gedruckter

Maustaste verschieben)! Fügen Sie einen beliebigen Text unmittelbar nach dem Titel der

ersten Kreuztabelle ein!

4. Löschen Sie die Anmerkungen aus beiden Absätzen!

5. Löschen Sie den gesamten 2. Kreuztabellen-Absatz!

OLAP (OnLine Analytic Processing): Interaktive Datenanalyse

Öffnen Sie falls nötig die Datendatei data1.sav!

Vom Datenfenster aus mittels Analysieren + Berichte + OLAP-Würfel... (OLAP: OnLine

Analytic Processing = interaktive, analytische Verarbeitung) erhält man ein


29 von 73 08.06.2009 15:59

Steuerungsfenster, das das Erzeugen von interaktiv (um)gestaltbaren Tabellen mit

zusammenfassenden Statistiken ermöglicht:

Übertragen Sie die Variablen Deutsch, Englisch und Mathe (in der Reihenfolge) in das

Fenster Auswertungsvariablen, die Variable Geschlecht in das Fenster

Gruppenvariable(n)! Klicken Sie nun den Statistiken...-Knopf an und aktivieren Sie

lediglich Anzahl der Fälle, Mittelwert sowie Standardabweichung aus (d.h.: entfernen Sie

durch Markieren und Klicken des Dreiecks-nach-links die restlichen Statistiken)! Klicken

Sie Weiter an! Geben Sie über Titel... „Noten und Geschlecht“ als Titel und „LRZ-Kurs“

als Erklärung ein. Über Weiter und OK erhalten Sie folgende Ausgabetabelle:

Noten und Geschlecht

Geschlecht: Insgesamt

N Mittelwert Standardabweichung

Deutschnote 250 6,9920 2,60057

Englischnote 250 6,5800 3,70656

Mathematiknote 250 7,1040 2,54383

LRZ-Kurs

Die Überschrift „Geschlecht Insgesamt“ deutet an, dass die ausgegebenen Statistiken

für die gesamte Stichprobe (also: für beide Geschlechter zusammen) gelten. Solche

so genannte Pivot-Tabellen enthalten jedoch die gesamten angeforderten Informationen.

Aktivieren Sie durch Doppelklick die Tabelle! Sie wird durch eine schraffierte Umrandung

markiert und die Überschrift ergänzt sich um den Knopf . Klicken Sie diesen Knopf, um

die Statistiken für weibliche bzw. männliche Fälle zu inspizieren!


30 von 73 08.06.2009 15:59

Übung

Aktivieren Sie (falls nötig) mit Doppelklick die Tabelle und wählen Sie die Subtabelle zu

den männlichen Fällen aus! Klicken Sie mit der rechten Maustaste in der Überschrift

Mittelwert und wählen Sie im nun erscheinenden Fenster Auswählen und dort Datenzellen

und Beschriftungen! Anschließend wählen Sie (wieder über die rechte Maustaste)

Diagramm erstellen und Linie!

Sie erhalten folgende graphische Darstellung der markierten Spalte:

(Wie solche Grafiken editiert und weiter gestaltet werden können, lernen wir später.)

Pivot-Tabellen

Tabellen, wie zum Beispiel gerade mit OLAP kreiert, heißen im SPSS-Jargon Pivot-

Tabellen. Diese können auch über andere Prozeduren erzeugt werden und bieten eine sehr

bequeme Möglichkeit, Daten zu untersuchen und deren Darstellung zu gestalten.

Doppelklicken Sie nun diese gerade erzeugte OLAP-Tabelle an. Die Menüleiste ändert sich

in


31 von 73 08.06.2009 15:59

Wählen Sie unter dem Menüpunkt Pivot die Option Pivot-Leisten aus (unter Umständen

kann diese Option schon ausgewählt sein)! Das nun erscheinende Fenster

ist sowohl eine bildliche Darstellung als auch eine Steuerungsmöglichkeit der Tabelle.

Positionieren Sie den Kursor auf ein Pivot-Symbol , um zu sehen, welchen Teil der

Tabelle dieses symbolisiert. Das Pivot-Symbol der Spalten-Leiste entspricht zum Beispiel

den gewählten Statistiken: Häufigkeit (hier Anzahl genannt), Prozent innerhalb der Zeilen

und Prozent innerhalb der Spalten. Ziehen Sie dieses Symbol aus der Leiste Schicht nach

Zeile ...

...und inspizieren Sie die veränderte Tabelle! Ziehen Sie nun das Symbol für Variablen

(aktuell das linke Quadrat der Zeile) nach Spalte, das für Geschlecht nach Zeile und

beobachten Sie die Veränderung der tabellarischen Darstellung!

Durch Pivoting kann man also auf bequemer Weise Zeilen, Spalten und Schichten

tauschen.

!Tipp

Die Menüpunkte des Pivot-Fensters bieten einige einfache Aktionen automatisch an, unter

anderem:

· Zeilen und Spalten vertauschen

· Schichten in Zeilen verschieben


32 von 73 08.06.2009 15:59

· Schichten in Spalten verschieben

Dieses einfache Beispiel zeigt lediglich das Prinzip des Arbeitens mit Pivot-Tabellen.

Solche Tabellen können deutlich komplexer sein als die unseres kleinen Beispiels: Die

Steuerung auch komplexerer Tabellen bleibt aber prinzipiell unverändert.

Grafik

(Falls nicht getan: Öffnen Sie die Datei data.sav!)

Grafische Ausgabe kann als „Nebenprodukt“ einiger Prozeduren (wie zum Beispiel, wie

gesehen, OLAP-Würfel) erzeugt werden, wird aber meist über den Menüpunkt Grafiken

kreiert.

Über Analysieren + Deskriptive Statistik + Häufigkeiten öffnen Sie folgendes

Prozedurfenster, über das man beispielsweise ebenfalls Grafiken als Nebenprodukt

erzeugen kann:

Übertragen Sie die Variable Englisch in das Variable(n)-Fenster; schalten Sie

Häufigkeitstabellen anzeigen aus (die darauf erscheinende Warnung können Sie

ignorieren!) und betätigen Sie die Taste Statistik..., um ein Subfenster mit weiteren Steuer-

möglichkeiten zu öffnen. Wählen Sie Mittelwert und Standardabweichung (Std.

Abweichung) aus! Quittieren Sie mit Weiter... Ihre Auswahl! Öffnen Sie nun das

Diagramme...-Subfenster und aktivieren Sie Histogramme und Mit

Normalverteilungskurve:


33 von 73 08.06.2009 15:59

Quittieren Sie mit Weiter diese Auswahl und führen Sie über OK die Prozedur aus!

Es erscheint die übliche Titelzeile (hier: Häufigkeiten), eine zusammenfassende

Statistiktabelle mit den von Ihnen ausgewählten Statistiken, sowie die gewünschte

Graphik.

Statische Grafik

Über Grafiken + Gallerie erhält man einen Überblick über die verschiedenen von SPSS

unterstützten Grafiktypen.

Weitere Einzelheiten zur Steuerung bestimmter Grafiktypen erhält man durch Anklicken

des entsprechenden Symbols.

An dieser Stelle beschreiben wir die am häufigst anzutreffenden Grafikdarstellungen.

Balkendiagramme

Über Grafiken + Balken erhält man folgendes Steuerfenster:

Die Option Einfach erlaubt die Darstellung von Balken pro Ausprägung einer

Kontrollvariablen. Klicken Sie Definieren an:


34 von 73 08.06.2009 15:59

Das Feld Kategorienachse erhält den Namen der (Gruppierungs-)Variablen, deren

Ausprägungen zusammengefasst werden sollen (z.B. Schultyp). Per Voreinstellung stellen

die so entstehenden Balken die Anzahl der Fälle pro Ausprägung dar. Die Balken können

aber andere Funktionen der kategorialen Variablen darstellen: Kumulative Anzahl,

Prozent- und kumulative Prozentangaben. Auch mathematische und statistische

Funktionen einer zweiten Variablen können dargestellt werden – zum Beispiel die mittlere

Deutschnote pro Ausprägung der Variablen Schultyp. Diese Möglichkeiten sind über das

Feld Bedeutung der Balken steuerbar.

Über Titel... können Titelzeilen, eine Subtitelzeile sowie Fußnotenzeilen festgelegt werden.

Optionen... bietet einige Möglichkeiten zur Behandlung von fehlenden Werten an, unter

anderem auch, ob fehlende Angaben in Form eines zusätzlichen Balkens dargestellt werden

sollen. Felder anordnen nach erlaubt eine Unterteilung der Darstellung nach den

Ausprägungen einer zusätzlichen kategorialen Variablen.

Übung

Erzeugen Sie ein Balkendiagramm, das die kumulative Prozentanteile der Ausprägungen

der Schultypen darstellt! Übertragen Sie die Variable Geschlecht ins Subfenster Felder

anordnen nach und Zeilen!

Unter Bedeutung der Balken klicken Sie Andere Statistik und übertragen Sie die Variable

Mathe ins Subfenster Variable. Per Voreinstellung wird der Mittelwert berechnet. Unter

Optionen wählen Sie nun Fehlerbalken anzeigen, darunter Standardabweichung und als

Multiplikator tragen Sie die Zahl 1 ein.


35 von 73 08.06.2009 15:59

Übung

Erzeugen Sie ein Balkendiagramm, das die mittleren (mittels Andere Auswertungsfunktion)

geschätzten Berufschancen (Variable: Chancen) pro Schultyp darstellt!

Wählt man als Bartyp Gruppiert aus, so wird nach einer zweiten kategorialen Variablen

(Gruppen definieren durch) verlangt, deren Ausprägungen die Gruppierung festlegt:

Die Auswirkung dieser zweiten Variablen sieht man am einfachsten anhand eines Beispiels:

Übung

Erzeugen Sie ein gruppiertes Balkendiagramm der mittleren Englischnote pro Schultyp

(Kategorienachse), ergänzt durch die Gruppierungs-Variablen (Gruppen definieren durch)

Geschlecht!

Der Balkentyp Gestapelt ähnelt Gruppiert, die Gruppierungen werden jedoch nicht neben-

sondern übereinander dargestellt:

Übung

Erzeugen Sie ein gestapeltes Balkendiagramm der Häufigkeiten der Ausprägungen der

Variablen Schultyp (an der Kategorienachse, ergänzt durch die Stapel-Variablen (Stapel

definieren durch) Geschlecht!

Gruppen von Fällen (Auswertung über Kategorien einer Variablen), von einzelnen

Variablen (Auswertung über verschiedene Variablen) oder von Einzelfällen (Werte

einzelner Fälle) können über Grafiken + Balken... grafisch zusammengefasst werden.

Linien-, Flächen-, Kreisdiagramme und Boxplots

Die Steuerung von Linien-, Flächen- und Kreisdiagrammen (Linie..., Fläche... und

Kreis...) ähnelt der von Balkendiagrammen sehr und wird deswegen hier nicht näher

beschrieben. Boxplots werden später besprochen.


36 von 73 08.06.2009 15:59

Streudiagramme

Streudiagramme sind das grafische Pendant zu Korrelationen bzw. Regressionsanalysen.

Sie werden über Grafiken + Streu-/Punkt-Diagramm... erzeugt:

Übung

Generieren Sie ein einfaches Streudiagramm der Variablen IQ (X-Achse) und Chancen

(Y-Achse)!

Aktivieren Sie durch Doppelklick in der Grafik den Diagramm-Editor: Klicken Sie einen

der kleinen Kreise des Diagramms an, um alle zu markieren! Über das Werkzeug

fügen Sie eine lineare Anpassungslinie (die Regressionslinie) hinzu!

Übung

Über Streu-/Punkt-Diagramm erzeugen Sie ein einfaches Punktdiagramm, in dessen Zeilen

die Verteilung nach Schultypen dargestellt wird!

Gestaltung der graphischen Ausgabe

Oft ist das von SPSS gestaltete Diagramm nicht genau die, die man haben will. Um

Diagramme zu editieren, doppelklicke man in der Grafik um den Diagrammeditor zu

starten.

Das Prinzip des grafischen Editierens ist einfach: Anklicken und Ändern. Hier gibt es

mehrere Varianten:

1. einfaches Anklicken und das gewünschte Werkzeug aus dem Werkzeugkasten

benutzen;

oder

2. einfaches Klicken, dann noch einmal Klicken, um z.B. Text zu ändern;

oder

3. Doppelklicken und die darauf erscheinende Fenstersteuerung anwenden;

oder aber

4. einfaches Anklicken mit der rechten Maustaste, um an weitere Werkzeuge zu

gelangen.

Die einzige Möglichkeit, diese flexiblen und umfangreichen Gestaltungsmöglichkeiten

kennenzulernen, ist zu experimentieren. Daher einige Übungen:

Übung:

Erzeugen Sie ein Balkendiagramm der Häufigkeit der Schüler pro Schultyp! Aktivieren sie

durch Doppelklick in dieser Grafik den Diagrammeditor!


37 von 73 08.06.2009 15:59

Klicken Sie die Beschreibung der Y-Achse („Absolute Werte“) an und ändern Sie (ein

zweites Anklicken ist dazu nötig) diese in „Häufigkeit“! Klicken Sie in einem der Balken,

um alle zu markieren. Klicken Sie anschließend den Balken für die Hochbegabtenschule

und ändern Sie dessen Farbe (Werkzeug in der 2. Reihe)!

Über die rechte Maustaste fügen Sie eine Bezugslinie für die Y-Achse bei 55, eine zweite

bei 35! Färben Sie die Line bei 55 rot! Ändern Sie die Stärke beider Linien zu 3!

Das Ergebnis:

Schließen Sie den Diagrammeditor!

Übung:

Über Grafiken + Balken + Definieren und OK erzeugen Sie das Diagramm erneut!

Aktivieren Sie den Diagramm-Editor, markieren Sie die Balken und über den Menüpunkt

Transofrmieren ändern Sie den Grafik Typ in eine Liniendarstellung! Wählen Sie eine

gestrichelte Linienform mit der Stärke 5 aus!

Profildiagramme

Profildiagramme (siehe Diagramm unten) sind nur mit einigen Tricks zu erzeugen. Drei

Schritte sind notwendig:

1. Aggregieren der Datei so, dass die unabhängige (Gruppierungs-)Variable als

„Break“-Variable, die abhängigen als zu aggregierende Variablen fungieren. Die Funktion


38 von 73 08.06.2009 15:59

belassen wir bei Mittelwert (Mean).

Dies geschieht über Daten + Aggregieren ... und erzeugt eine neue Datei mit so vielen

Fällen wie Ausprägungen der „Break“-Variablen, jeweils mit den Mittelwerten pro

Ausprägung der aggregierten Variablen.

Mit der Data data.sav und dem Steuerfenster zum Aggregieren wie folgt ausgefüllt

enthält die neue Datei (hier: aggr.sav) zwei Fälle (den Ausprägungen der Variablen

Geschlecht entsprechend) mit den jeweiligen Mittelwerten der Noten:

2. Transponieren (über: Daten + Transponieren) dieser Datei, wobei die

„Namensvariable“ die unabhängige Variablen (hier: Geschlecht) , die „Variablen“ die

abhängigen Variablen (hier: die Noten) sind.

Nun sieht der aggregierte Datendatei so aus:

Über den Reiter „Variablenansicht“ ändern Sie die Variablenlabel-Definitionen, um

Folgendes zuerreichen:


39 von 73 08.06.2009 15:59

3. Nach der Definition der Variablenlabels erzeuge man mittels Grafiken + Linie ...

und die Auswahl von Mehrfach sowie Auswertung über verschiedene Variablen das

Diagramm: Die CASE_LBL (für das Diagramm in „Noten“ umbenannt) bildet die

Kategorienachse, die restlichen Variablen werden ins Feld Linien entsprechen übertragen.

Als Titel wähle man „Leistungsprofile der Geschlechter“.

Das Ergebnis nach etwas Überarbeiten mit dem Diagrammeditor (versuchen Sie, dies

selber zu realisieren!) ist ein Diagramm der Notenprofile beider Geschlechter:

Identifizierung einzelner Punkte (Fälle) einer Grafik

Übung

Erzeugen Sie ein einfaches Streudiagramm, das den Grad des Zusammenhangs zwischen

der Englischnote (Y-Achse) und dem IQ (X-Achse) darstellt. Aktiveren Sie durch

Doppelklick den Diagrammeditor, klicken Sie dort auf das Symbol und markieren

Sie mit dem daraus entstehenden neuen Cursor einige, beliebige Punkte des Diagramms,

um die Fälle zu identifizieren. Die ausgegebene Zahl ist die aktuelle Reihenfolge des


40 von 73 08.06.2009 15:59

markierten Falles im Datenfenster (entspricht also der grauen Spalte links neben den

Daten). Klicken Sei erneut, um diese Identifkationszahl wieder verschwinden zu lassen!

Ein zweites Anklicken des Werkzeugs ändert den Cursor in die übliche Pfeil-Variante

zurück.

Zur Identifikation der Fälle kann man bei einigen Grafiktypen eine Variablen zur

Fallbeschriftung angeben, deren Werte beim Anwenden dieses Werkzeugs angezeigt

werden. Erzeugen Sie erneut das Streudiagramm, übertragen Sie jedoch die Variable

Bogen ins Feld „Fallbeschriftung“! Wiederholen Sie obige Editiervorgänge!

Interaktive Grafik

(Falls nicht schon getan, starten Sie SPSS mit dem Datensatz data.sav!)

Gesteuert wird die interaktive Grafik über Grafiken + Interaktiv:

Anhand der Band-(Schleifen-)Grafik werden weitere Aspekte der Steuerung der

interaktiven Grafik vorgestellt: Wählen sie Band...! Es erscheint das zwar

Band-spezifische, aber in seinen Gestaltungsmöglichkeiten für die interaktive Grafik

typische Steuerungsfenster:


41 von 73 08.06.2009 15:59

Die Reiter (Variablen zuweisen, Bänder, Fehlerbalken, Titel und Optionen) beschreiben

steuerbare Aspekte der Grafik. Allgemein zu allen interaktiven Grafiken ist Variablen

zuweisen:

· links ist die übliche Variablenliste mit drei der Grafik zugrundegelegten

Variablentypen:

1. SPSS-interne Variablen wie Count (Anzahl, Häufigkeit):

2. Kategoriale Variablen mit einigen, wenigen Ausprägungen, üblicherweise ohne

numerische Bedeutung, wie hier Geschlecht:

3. Skalen-Variablen, die eine Quantifizierung implizieren, wie hier IQ:

· rechts oben ein Knopf zur dimensionalen Gestaltung (2D oder 3D) der Graphik:


42 von 73 08.06.2009 15:59

· Darunter befindet sich eine Darstellung der X-Achse

(waagrechter Pfeil), der Y-Achse (senkrechter Pfeil) und einer möglichen Z-Achse (nach

„hinten“ weisender Pfeil), jeweils mit (hier noch leeren) Felder für die darzustellenden

Variablen:

Per Voreinstellung wird bei der Band-Grafik die Anzahl Fälle in der Y-Richtung pro Wert

der X-Achsenvariablen dargestellt.

Übung

Übertragen Sie (bei der interaktiven Grafik heißt das: Packen und Ziehen) die Variablen

Deutsch in das X-Achsen- (horizontales) Variablenfeld.

Mit OK erzeugen Sie die Grafik. Aktivieren Sie mit einem Doppelklick die interaktive

Steuerung, unter anderem mit folgendem Steuerungsfenster (der so genannten 3-D

Palette):

Mit den Rändelrädern können Sie die Grafik in waag- bzw. senkrechter Richtung, mit dem

Rotationswerkzeug in beiden Richtungen gleichzeitig drehen; mit der Lampe die

Lichtquelle sowohl in der Stärke als auch in der Positionierung ändern. Experimentieren

Sie!

Das interaktive Werkzeugkasten

unterstützt weitere Steuerungsmöglichkeiten:


43 von 73 08.06.2009 15:59

· bietet die restlichen Steuerungsfelder des Fensters Variablen für Grafik

zuweisen interaktiv an:

So können Sie zum Beispiel statt der Deutschnote eine andere Variablen auf der

waagrechten Achse darstellen; oder weitere Variablen farblich darstellen; oder Variablen

zur Gestaltung der Linientypen bzw. Größe von Symbolen benutzen; oder die

3D-Darstellung in eine 2D-Darstellung mit 3D-Effekt aktivieren.

Übungen:

Ziehen Sie die Variablen Geschlecht in das Feld Farbe: unter Legendenvariablen und

inspizieren Sie das Ergebnis!

Ziehen Sie die Variablen Geschlecht in die Z-Achse (3. Dimension, nach „hinten“

weisend)!

Markieren Sie das Mädchen-darstellende Band und ändern Sie

Farbe und Schraffur !

Ziehen Sie nun das Geschlecht in das Feld Styles: unter Legendenvariablen und

inspizieren Sie das Ergebnis!

Übertragen Sie anschließend die Art der Schule in das Feld Feldvariablen und inspizieren

Sie das Ergebnis!

· erlaubt das Einfügen weiterer Elemente in der Grafik. Klicken Sie das

Werkzeug an und wählen Sie Balken aus!


44 von 73 08.06.2009 15:59

· bietet über ein Übersichtsbild (den Diagramm-Manager) die Steuerung

verschiedener Elemente der Grafik an:

Durch Markieren des gewünschten Bildaspektes und z.B. Auswahl von Bearbeiten...

können sie weitere Gestaltungsmöglichkeiten realisieren. Experimentieren Sie damit!

!Tipp

Ein Doppelklick auf den gewünschten Grafikteil aktiviert automatisch die Funktion des

Editierens.

· ordnet automatisch Elemente einer Grafik.

· Mit den Pfeilen bzw. können ausgeführte Befehle rückgängig

gemacht bzw. wieder aktiviert werden.

· Mittels kann die 3D-Gestaltung gesteuert werden:

Die 3D-Beleuchtung unterstützt die gleiche Funktionalität

wie die Lampe der 3D-Palette; und letztere kann mittels

des Feldes neben 3D-Palette aktiviert oder deaktivert

werden.

Über das 3D-Symbol kann die Grafik als 2D, 2D mit 3D-Wirkung oder aber mit

einem 3D-Koordinatensystem gestaltet werden.

Am linken Rande des interaktiven Diagrammeditors befinden sich weitere Werkzeuge, um


45 von 73 08.06.2009 15:59

· zwischen dem Zeiger , Texteingabe bzw. Rotierungswerkzeug

zu schalten.

· einfache Aspekte der Grafik zu gestalten: Farben, Schraffurmuster, Symbole und

Symbolgrößen, Linientypen und -stärke.

Die rechte Maustaste bietet auch viele kontextspezifische Gestaltungsmöglichkeiten an. Vor

allem verlangen einige Prozeduren bestimmte Datentypen: Versucht man zum Beispiel ein

Histogramm von Ordinal-Variablen zu erzeugen, so erscheint die Fehlermeldung

Nach dem Quittieren mit OK kann der Typ der Variablen über die rechte Maustaste

geändert werden.

Man verlässt den interaktiven Diagrammeditor durch Klicken im Ausgabefenster irgendwo

außerhalb des Diagramms.

!Tipp:

Die beste Möglichkeit, die Vielseitigkeit der Grafikfunktionalität kennen zu lernen, ist zu

experimentieren. Also: Spielen Sie!

Übungen:

Versuchen Sie, folgende Grafiken nachzubilden:

1. Balkendiagramm mit veränderter Balkenform und visueller Kennung ausgewählter

Balken:


46 von 73 08.06.2009 15:59

2. Verbundliniendiagramm:

!Tipp dazu:

Geschlecht ins Feld „Muster“ ziehen! Über den Reiter „Verbundlinien die Variante „Linie“

aktivieren!

3. Histogramm: 3D-Darstellung zweier Gruppen, Gitter-Linien, spezieller Färbungsstil.


47 von 73 08.06.2009 15:59

!Tipp – und ein ganz wichtiger dazu!

Viele dieser dreidimensionalen, buntgefärbten und beleuchteten Grafiken sehen zwar

imposant aus. Man muss sich aber über den Zweck solcher Grafiken Gedanken machen:

Im universitären Bereich geht es nicht darum, zu imponieren, sondern zu informieren –

Daten zusammenzufassen, Ergebnisse schnell und präzis zu vermitteln.

Vergleichen Sie folgende Grafiken:


48 von 73 08.06.2009 15:59

Informativer und vor allem deutlich leichter zu lesen ist die zweite, einfachere Variante, die

somit für wissenschaftliche Berichte besser geeignet ist. Beantworten Sie durch Inspizieren

dieser beiden Grafiken beispielsweise die Frage „Wie viele Kinder haben genau 11 Punkte

bei Ihrer Deutschprüfung erreicht?“.

(In diesem Falle allerdings täuscht die Darstellung als Line eine kontinuierliche Variable

vor. Angenommen, nur ganzzählige Note wären vergeben, so wäre ein Balkendiagramm

vorzuziehen.)

Übung:

Erzeugen Sie entweder mit der konventionellen oder mit der interaktiven Grafik in

Balkendiagramm: Y-Achse ist die Anzahl, X-Achse die Deutschnote.

Syntax-Fenster

SPSS wird durch Kommandos gesteuert. Eine Vielzahl dieser Steuerbefehle wird

automatisch durch Anklicken erzeugt und ausgeführt, ohne dass der Anwender etwas von

den Befehlen im Hintergrund merkt. Man kann solche Befehle aber explizit in einem

speziellen Syntax-Fenster schreiben lassen und dort editieren (ändern, ergänzen, ...). Diese

Syntax-Fenster spielen eine wichtige Rolle in der Handhabung des Programms, denn

mehrere Optionen und sogar ganze Prozeduren können nur über sie gestartet und gesteuert

werden.

Das SPSS Syntax Reference Guide enthält detaillierte Beschreibungen der Befehlssyntax

des Base Systems; Syntax zu den restlichen, fortgeschritteneren Teilen des Programms sind

in den Spezialhandbüchern enthalten (siehe Anhang B: Dokumentation).


49 von 73 08.06.2009 15:59

Syntax-Fenster haben weitere Vorteile:

zur Protokollierung Ihrer Analysen (zum Beispiel als Anhang in Ihrer Arbeit)

zur exakten Wiederholen von Vorgängen, etwa mit anderen Datensätzen

(sogenanntes „Batch-Processing“)

zum Wiederholen von Vorgängen nach Beseitigung von Datenfehlern. Es ist

erstaunlich, wie oft Datenfehler auch nach vielen Analysen entdeckt werden, und

mehr als lästig, nach der Korrektur, alle Analysen wiederholen zu müssen – es sei

denn, Sie haben diese in Form von Syntaxbefehlen gespeichert.

!Tipp

Viele Statistikprozeduren benötigen wesentlich komplexere Befehle als die dieses

einfachen Beispiels. Gerade in solchen Fällen kann es Zeit sparend sein, beim ersten

Aufruf einer Prozedur die Ausgabe so zu gestalten, wie man sie haben will und die Syntax

dazu zu generieren, um dann bei weiteren Aufrufen (zum Beispiel, um andere Variablen zu

untersuchen), das Syntaxfenster einfach zu editieren und auszuführen.

Und so wird’s gemacht:

Die meisten Fenster unterstützen einen Knopf Einfügen, mit welchem man die durch

Anklicken generierten Befehle in ein Syntax-Fenster schreiben lassen kann.

Wie bei Viewer-Fenstern kann man auch mehrere Syntax-Fenster öffnen. Auch hier gelten

die Begriffe aktiv und designiert; und die Schaltung zwischen den möglichen Zuständen

wird genauso wie bei Viewer-Fenstern realisiert.

Übung

Über Analysieren + Deskriptive Statistiken + Kreuztabellen übertragen Sie Geschlecht ins

Feld „Zeilen“, Schultyp ins Feld „Spalten“.

Betätigen Sie nun Einfügen (statt OK): Es öffnet sich automatisch ein Syntax-Fenster mit

den Befehlen zu Ihrem Kreuztabellen-Aufruf:

Positionieren Sie den Cursor irgendwo innerhalb des Befehls: Klicken Sie nun auf ,

um eine Zusammenfassung der Kreuztabellen-Syntax zu erhalten: Für die genaue

Steuerung braucht man wohl die (umfangreichen und unübersichtlichen) Syntax-


50 von 73 08.06.2009 15:59

Handbücher — die Befehle sind jedoch oft so verständlich, dass man ohne weitere

Kenntnisse sie sinnvoll ändern kann. So ist es im obigen Beispiel klar, dass eine

Kreuztabelle der Variablen Geschlecht und Schultyp erzeugt wird. Möchte man eine

Kreuztabelle von Geschlecht und Klasse, so könnte man die Syntaxbefehle selbst per Hand

ändern, ohne die Klickerei zu wiederholen – ändern Sie einfach per Hand „Schultyp“ in

„Klasse“.

Ausgeführt werden Befehle im Syntaxfenster durch Markieren der auszuführenden Befehle

und Klicken des Knopfes . Schließen Sie danach dieses Fenster!

Exportieren von SPSS-Ausgabe nach Word

Der bekannte Vorgang Kopieren + Einfügen (Copy + Paste) funktioniert zwischen SPSS

und Word wie bei anderen Programmen auch.

Beim Exportieren von Tabellen allerdings führt dieser Vorgang zu Erzeugen einer

Word-Tabelle, deren Formatierung oft unbefriedigend ist. Wendet man statt Einfügen die

Option Inhalte Einfügen und Grafik, so erscheint die Tabelle in der meist attraktiveren

Form, wie SPSS sie produziert. Das Editieren dieser Tabelle innerhalb von Word ist zwar

nicht mehr leicht möglich, denn Word versteht sie ja als Grafik, aber in den seltenen

Fällen, wo eine eine Veränderung notwendig ist, ist diese sowieso bequem und rapide in

SPSS zu realisieren.

Übungen zu Teil 1

Schließen Sie die SPSS-Sitzung!

Starten Sie SPSS!

Starten Sie SPSS mit der Datei data2.sav!

Inspizieren Sie die Definition der Variablen Geschlecht und stellen Sie sicher, dass

folgende Definitionen gelten:

· Variablenetikett: „Geschlecht“;

· Wertelabels: m = „männlich“, w = „weiblich“;

· Spaltenformat: 8, Dezimalstellen: 2.

Mit der interaktiven Grafik erzeugen Sie eine 2-dimensional Verbundlinie, die die Anzahl

($count) Personen pro Deutschnote für beide Geschlechter getrennt (Geschlecht ins Feld

„Muster“ übertragen) darstellt! Über den Reiter „Verbundlinien“ schalten Sie die Punkte

aus, die Linien ein! Klicken Sie OK!


51 von 73 08.06.2009 15:59

Im interaktiven Diagramm-Editor entfernen Sie (rechte Maustaste!) die Erläuterung

(„Punkte/Linie zeigen Häufigkeiten“)! Entfernen Sie ebenfalls mit der rechten Maustaste die

senkrechten Verbundlinien!

Ändern Sie bei beiden Achsen über den Reiter „Beschriftungen“ die Zahlendarstellung so,

dass keine Nachkommastellen angezeigt werden! Die X-Achse hat von 0 bis 15 in Schritten

von 5 zu laufen:

Öffnen Sie ein neues, leeres Datenfenster! (Die gerade benutzte Datei data2.sav müssen

Sie nicht sichern!)

Erfinden Sie und geben Sie Daten für vier Patienten einer Klinik für Gewichtskontrolle ein:

Patientennummer (3-stellig, keine Nachkommastellen, Werte größer 25); Geschlecht

(0=männlich, 1 = weiblich); und zwei experimentelle Messungen zwischen 1 und 25

(Variablennamen: id geschl exp_1 exp_2), wobei die 2. Messung größer/gleich die 1. sein

soll.

Sichern Sie diese Daten in der Datei kg2.sav!

Lesen Sie Datei kgl.sav ein, die Daten zu weiteren Patienten der Gewichtskontrollstudie

enthält! Mischen Sie die neuen Fälle aus kg2.sav hinzu!

Berechnen Sie pro Fall die Differenz zwischen den beiden experimentellen Variablen!

Sortieren Sie die Datei absteigend nach dem Wert dieser Differenz!

Bilden Sie ein neue Gruppierungsvariablen (gruppe): Ist die eben berechnete Differenz

kleiner 10, so erhält gruppe den Wert 1, sonst den Wert 2.

Erstellen Sie eine Kreuztabelle gruppe ´ geschl! Aktivieren Sie die durch Doppelklick in


52 von 73 08.06.2009 15:59

der Tabelle die OLAP-Funktionalität und tauschen Sie die Reihen und Spalten dieser

Tabelle! Ändern Sie die Überschrift in Therapierfolg und Geschlecht!

Erstellen Sie ein Histogramm der berechneten Differenz! Ändern Sie Farbe und Schraffur

der Grafik!

Sichern Sie die gesamte Datei unter dem Namen kg_gesamt.sav!

Beenden Sie die SPSS-Sitzung!

Teil 2: Anwendungsbeispiele

SPSS unterstützt eine sehr breite Palette von statistischen Prozeduren. Dieser Teil des

Kurses befasst sich mit einigen wenigen der häufigeren und einfacheren

Anwendungsgebieten.

Das Ziel hierbei ist ein zweifaches: 1. Das bisher Gelernte zu befestigen und auszubauen; 2.

Grundkenntnisse der Steuerung und der Interpretation einiger Basisstatistikverfahren zu

vermitteln.

Dieser Teil behandelt:

· einfache beschreibende Statistik

· einfache vergleichende (inferentielle oder Prüf-) Statistik

Zur Vorbereitung:

Öffnen Sie die Datei data2.sav!

Beschreibende Statistik

Häufigkeiten und Histogramme

Über Analysieren + Deskriptive Statistiken + Häufigkeiten erhalten Sie folgendes Fenster:


53 von 73 08.06.2009 15:59

Zur Erinnerung: Typisch für die Steuerung der Statistik- und Grafikprozeduren sind:

· die Liste der Variablen (links) (die ja mittels Bearbeiten + Optionen unter dem Reiter

Allgemein und dort unter Variablenlisten umgestaltet werden kann)

!Tipp

Klicken Sie mit der rechten Maustaste auf einem Variablennamen (nehmen Sie hier

Geschlecht als Beispiel) und anschließend auf Info zu Variable, um ein kurze

Zusammenfassung deren Variablendefinition zu erhalten!

· Das nach rechts weisende Dreieck erlaubt das Übertragen markierter Variablennamen

nach weiteren Fenstern – im aktuellen Falle (Prozedur Häufigkeiten) ein einziges

Variable(n)...-Fenster.

· Die Knöpfe oben rechts haben folgende Funktionen:

OK führt die Befehle aus.

Einfügen schreibt die Befehle in Klartext in ein Syntax-Fenster.

Zurücksetzen bringt das Fenster in den ursprünglichen Zustand wieder (d.h. alles, was

bisher definiert wurde, wird „vergessen“ und die vorherigen Definitionen

wiederhergestellt).

Abbrechen schließt das Fenster, ohne die Befehle auszuführen.

Hilfe Bietet Unterstützung und lnformationen mittels der Windows-typischen

Hypertext-Schnittstelle an.

· Weitere, prozedurspezifische Optionen können durch Auswählen bzw. Knopfdruck

gesteuert werden.

Zur grafischen Darstellung von Häufigkeiten gibt es zwei Möglichkeiten:

1. Kontinuierliche Variablen, bei denen prinzipiell jeder Wert innerhalb eines Bereichs

und der Messpräzision vorkommen kann, werden als Histogramme dargestellt. Beispiele:

Alter in Jahren, Größe in cm.

!Tipp

Hier ist es ratsam, die Option Häufigkeitstabellen anzeigen auszuschalten! (Falls Sie sehen

wollen, warum, lassen Sie sie eingeschaltet!)

2. Diskrete (kategoriale, meist Gruppierungs-)Variablen, die lediglich einige, wenige

Werte (Ausprägungen oder Kategorien) aufweisen, können als Balken(Säulen-) oder

Kreisdiagramme dargestellt werden. Beispiele: Geschlecht, Altersgruppierungen,

Nationalität. Hier hat die Häufigkeitstabelle wieder einen Sinn.

Übung


54 von 73 08.06.2009 15:59

Erzeugen Sie (mittels Häufigkeiten) ein Histogramm der (kontinuierlichen) Variablen IQ

(vergessen Sie nicht, die Häufigkeitstabelle auszuschalten)! Wählen Sie über den Knopf

Statistik... Mittelwert und Std.-Abweichung (Standardabweichung), über den Knopf

Diagramme... Histogramme sowie Mit Normalverteilungskurve aus!

Einfache beschreibende Statistik und Grafiken

Über Analysieren + Deskriptive Statistiken + noch einmal Deskriptive Statistiken erhält

man eine Tabelle mit ausgewählten Statistiken.

Übung

Aktivieren Sie die Prozedur Deskriptive Statistiken und untersuchen Sie die Variable IQ!

Verteilungsstatistiken und -darstellungen

Über Analysieren + Deskriptive Statistiken + Explorative Datenanalyse... kann man

explorative sowie einige beschreibende Statistiken und Grafiken erzeugen – Boxplots,

beispielsweise.

Übung

Geben Sie mittels Explorative Datenanalyse beschreibende Statistiken zur abhängigen

Variablen Attitude aus! Benutzen Sie die Variable Geschlecht als einzigen Eintrag in der

Faktorenliste, um getrennt pro Geschlecht beschreibende Statistiken auszugeben!

Das Explore-Fenster unmittelbar vor dem Ausführen sieht so aus:

Über den Knopf Diagramme... erzeugen Sie Boxplots: Schalten Sie die Stengel-Blatt-

Darstellung aus!


55 von 73 08.06.2009 15:59

Zur Interpretation eines Boxplots:

Für die Schüler (m) und Schülerinnen (w) getrennt werden die Verteilungen

nichtparametrisch dargestellt: Der dicke Balken im schraffierten Bereich (Box) ist der

Median: Würde man die Stichprobe anhand der dargestellten Variablen Attitude sortieren,

so ist der Median der Wert, der die Person genau in der Mitte dieser Sortierung geliefert

hat. Hätten z.B 264 Fälle Werte zur Variablen Attitude geliefert, so ist der Median der Wert,

den die 132. Person lieferte. Hier haben wir die Mediane beider Geschlechter getrennt

dargestellt. 50% der Fälle insgesamt liegen in der Box: Der obere Rand der Box halbiert

wiederum die obere Hälfte der Stichprobe (der Rand liegt also am 75. Perzentil).

Entsprechendes gilt für die untere Hälfte: Der untere Rand entspricht dem 25. Perzentil. Die

kleinen Kreise zeigen so genannte Ausreißer an – Werte, die mehr als 1,5 Box-Längen vom

75. Perzentil entfernt liegen. Noch extremere Werte werden als Sternchen dargestellt: Diese

liegen mehr als 3 Box-Längen vom 75. bzw. 25. Perzentil entfernt. Die dünnen,

waagrechten Striche zeigen die höchsten bzw. niedrigsten beobachteten Werte, die keine

Ausreißer sind.

Zur inhaltlichen Interpretation dieses Boxplots: im Schnitt sehen die Schülerinnen dieser

Stichprobe ihre Zukunft mit weniger Zuversicht entgegen als die Schüler.

Solche Plots sagen natürlich nichts über die statistische Signifikanz des Unterschieds aus,

das heißt, inwieweit man den Schluss ziehen darf, dass Mädchen im Allgemeinen Ihre

Zukunftschancen schlechter einschätzen als Buben – dafür werden die später zu

besprechenden statistischen Tests benötigt. Sie sind jedoch eine wichtige, visuelle


56 von 73 08.06.2009 15:59

Darstellung der Daten.

!Tipp

Es gehören sowohl passende statistische Tests als auch geeignete grafische Darstellungen

gemeinsam in einer Veröffentlichung!

Diese Plots helfen auch bei der zentralen Frage nach dem praktischen Belang vom

Unterschied (formal: nach dem Effek), eine Frage, die nur aus inhaltlichen (zum Beispiel in

diesem Fall didaktischen) Überlegungen entschieden werden kann.

einige Ausreißer (vor allem Fall 49) sind in diesem Boxplot erkennbar: Die Daten dieser

Fälle sollten näher inspiziert werden, denn solche Extremwerte könnten falsch eingetragene

Daten sein (bei diesem aktuellen Datensatz sind sie es nicht).

Man könnte überlegen, ob die angezeigten Ausreißer aus der Analyse ausgeschlossen

werden sollten:

!Tipp

Der Diagrammeditor bietet folgendes Werkzeug an, durch das man individuelle Punkte

identifizieren und auch entfernen kann:

Übung

Aktivieren Sie durch Doppelklick im Bereich der Grafik den Diagrammeditor, und

benutzen Sie dieses Identifikationswerkzeug um die Fall-Identifikation zu inspizieren bzw.

auszuschalten!

!Tipp

Ausreißer können auch über die Sortierfunktion von SPSS identifiziert werden. Sortieren

Sie (im Datenfenster über Daten + Fälle sortieren...) den Datenbestand absteigend nach

der Variablen Attitude: Die Fälle mit extrem hohen Werten sind dann die ersten des

Datenfensters. Fälle mit extrem niedrigen Werten sind am unteren Ende der Daten.

Über Analysieren + Tabellen + Einfache Tabellen... können die relevanten Statistiken

tabellarisch aussgegeben werden. Übertragen Sie die Variablen wie folgt:


57 von 73 08.06.2009 15:59

Wählen Sie unter Statistik... 25. Perzentil, Median sowie 75. Perzentil (in dieser

Reihenfolge) aus und führen Sie mit OK die Analyse durch, um folgende Tabelle zu

erhalten (Anmerkung: die Überschrift „Geschlecht“ und die Wertelabels „männlich“ und

„weiblich“ erscheinen natürlich nur bei entsprechend definiertem Labels!):

Geschlecht

männlichweiblich

25.Perzentil

Median

75.

Perzentil

25.

Perzentil Median

75.

Perzentil

Einstellung

zur eigenen

Zukunft

2447,29 3151,02 3595,96 1684,30 2013,12 2449,53

Übung

Erzeugen Sie eine Tabelle der Mittelwerte und Standardabweichungen der Variablen IQ

der drei Schultypen!

Übung

Erzeugen Sie eine Tabelle mit denselben Mittelwertstatistiken, aber für Schüler und

Schülerinnen getrennt!

!Tipp


58 von 73 08.06.2009 15:59

Experimentieren Sie auch mit der komplexeren Tabellenvariante (Analysieren + Tabellen

+ Allgemeine Tabellen...)!

Kreuztabellen: Untersuchung kategorialer Variablen

Öffnen Sie, falls nötig, die Datei data2.sav!

Über Analysieren + Deskriptive Statistiken + Kreuztabellen kann man Kreuztabellen

gestalten.

Übung

Öffnen Sie ein neues Ausgabe-Fenster!

Übung

Erzeugen Sie eine Kreuztabelle: Ausprägungen der Variablen Klasse bilden die Zeilen,

Ausprägungen der Variablen Altersgp bilden die Spalten dieser Tabelle!

Übung

Öffnen Sie erneut das Kreuztabellen-Steuerungsfenster und fügen Sie als Schicht-

Variablen Geschlecht hinzu! Klicken Sie OK, aktivieren Sie die so erzeugte Pivot-Tabelle

(und falls nötig über den Menüpunkt „Pivot“ die Pivot-Leisten-Fenster) und gestalten Sie

diese Tabelle so um, dass die Schichten durch Altersgp, die Zeilen durch Klasse und die

Spalten durch Geschlecht bestimmt werden!

Inspizieren Sie alle Schichten dieser Tabelle!

Prüfstatistik

Die klassischen parametrischen Testverfahren (T-Test, Varianzanalyse, ...) basieren auf

Annahmen der Verteilung der zu untersuchenden (abhängigen) Variablen. In den meisten

Fällen wird die sogenannte „Normalität“ dieser Verteilung angenommen. (Die LRZ-Schrift

SPSS for Windows Special Topics: Einige Grundbegriffe der Statistik enthält Einiges zu

diesem Thema: Siehe Anhang B.)

Korrelation

Falls nötig, öffnen Sie die Datei data.sav!

Die passende Grafik zur Korrelation ist das Streudiagramm – hier anhand der Korrelation

zwischen IQ und der Mathenote: Grafiken + Streu-/Punkt-Diagramm… + Auswahl von

Einfaches Streudiagramm:


59 von 73 08.06.2009 15:59

(Es ist üblich, die abhängige Variable in der Y-, die unabhängige in X-Achse darzustellen:

in diesem Fall wird die Mathenote als von dem IQ abhängig betrachtet.)

Das Ergebnis:

Jeder Punkt im Diagramm stellt eine oder mehrere Personen dar: deutlich zu sehen ist das


60 von 73 08.06.2009 15:59

für eine positive Korrelation typische Muster, eine von unten links nach oben rechts

steigende Punktwolke.

Der dazugehörige Korrelationskoeffizienten ist entweder der Pearson’sche Koeffizient r,

der den linearen Zusammenhang zwischen zwei Variablen quantifiziert; oder aber der

Spearman’sche Koeffizient rho, der den monotonen Zusammenhang misst. (Dementgegen,

was in einigen Büchern zu lesen ist, setzt die Berechnung des Pearson’schen Koeffizienten

keine Normalverteilung voraus! Die Normalverteilung wird lediglich für die Berechnung

der Signifikanz dieses Koeffizienten angenommen.). Das Steuerungsfenster erlaubt es

auch, ein- oder zweiseitige Signifikanzen zu berechnen, unterstützt jedoch leider keine

Korrektur für die Signifikanzwerte mehrerer gegenseitig abhängigen Koeffizienten.

Füllen Sie das mittels Analysieren + Korrelation + Bivariat … geöffnete Steuerfenster wie

folgt aus:

um die Ergebnisse zu r und zu rho zu erhalten:


61 von 73 08.06.2009 15:59

Es ist üblich im Falle vom Pearson’schen Koeffizienten nicht nur den einfachen r sondern

auch r2 als Maß der Effektgröße (Proportion gegenseitig erklärter Varianz) zu berichten. In

Ihrer Arbeit könnte zum Beispiel stehen:

Zum Testen der Hypothese, dass IQ und Mathe einen positiven linearen Zusammenhang

aufweisen wurde der Pearson’sche Koeffizient r herangezogen. Die Hypothese wurde

bestätigt: r = 0,71, p < 0,001; r2 = 0,50 – d.h. 50% der gemeinsamen Varianz wird

durch diesen Koeffizienten erklärt.

Mittelwertvergleiche: T-Test

Der T-Test erlaubt Mittelwertvergleiche entweder:

· anhand von einer Variablen gemessen an zwei zu vergleichenden Gruppen; oder

· innerhalb einer einzigen Gruppe anhand von zwei zu vergleichenden Variablen (d.h.:

jeder Fall liefert beide Variablen).

Öffnen Sie, falls nicht schon getan, die Datei data2.sav!

Gruppenvergleiche mit dem T-Test bei unabhängigen Stichproben

Der T-Test für unabhängige Stichproben testet, ob zwei Gruppen sich im Mittel anhand

von einer Variablen statistisch unterscheiden. Über Analysieren + Mittelwerte vergleichen

+ T-Test bei unabhängigen Stichproben... erhält man folgendes (hier: schon ausgefülltes

Fenster):


62 von 73 08.06.2009 15:59

(Die zu vergleichenden Ausprägungen „0“ und „1“ der Gruppierungsvariablen Geschlecht

werden über den Knopf Gruppen def. ... festgelegt.) Klicken Sie OK!

Unsere Hypothese: Mädchen haben im Mittel signifikant höhere Noten in Englisch als

Junge.

Das Ergebnis dieses Tests:

Der erste Teil dieser Ausgabe (Gruppentatistiken) enthält beschreibende Statistiken zu den

beiden Gruppen: Hier werden die Geschlechtsgruppen anhand der Englischnote verglichen.

Die Mädchen haben einen rein numerisch höheren Mittelwert als die Jungen. Ob dieser im

statistischen Sinne höher ist, wird in der zweiten Tabelle dargestellt.

Der klassische T-Test beruht auf der Annahme der gleichen Varianzen für beide zu

vergleichenden Gruppen. Die Spalten mit der Überschrift Levene Test der

Varianzgleichheit teilen mit, inwieweit diese Annahme erfüllt ist. Ist dieser F-Test

signifikant (oft wird hier p < 0,1 als Grenzwert genommen), so unterscheiden sich die

Varianzen und man lese die unterste Zeile der Tabelle (Varianzen sind nicht gleich), die

eine Korrektur für die ungleichen Varianzen enthält. Ist er – wie hier – nicht signifikant, so

lese man die Zeile davor (Varianzen sind gleich).


63 von 73 08.06.2009 15:59

Eine Veröffentlichung zu dieser Studie könnte folgendes berichten:

Im Schnitt ist die Englischnote der Mädchen (Mittelwert: 9,45, Standard Abweichung

2,10) signifikant höher als die der Jungen (Mittelwert 3,38, Standard Abweichung 1,66):

T = -10,992, df = 48, p < 0,001.

In diesem Beispiel testen wir die einseitige Hypothese, dass Mädchen im Schnitt höhere

Englischnoten als Buben erhalten. Das heißt: die Signifikanz ist nur dann relevant—und

darf auch nur dann inspiziert und berichtet werden—wenn der Mittelwert der Mädchen

rein numerisch in der Tat höher ist als der der Buben. Der vom Programm ausgegebene

Signifikanzwert ist aber ein zweiseitiger Wert, der gleichzeitig beide Möglichkeiten testet:

Mädchen besser als Buben und/oder Buben besser als Mädchen. Demnach ist dieser

zweiseitige p-Wert genau das Doppelte vom einseitigen Wert, den wir für unsere Hpothese

benötigen. Die Justierung ist also einfach: Man halbiere den ausgegebenen Wert. Wäre der

zweiseitige Signifikanzwert zum Beispiel p = 0,06, so wäre der einseitige p = 0,03.

Im aktuellen Fall ist dieser von SPSS ausgegeben Wert 0,000, da SPSS per Voreinstellung

lediglich drei Stellen ausgibt. Das heißt, der wahre Wert ist auf jeden Fall kleiner 0,001

(p < 0,001) und auch für den korrigierten, halbierten Wert gilt dies natürlich ebenfalls.

!Tipp:

Enthält die SPSS-Ausgabe – wie in diesem Fall – als Signifikanzwert „0,000“, so berichten

Sie dies als „ p < 0,001“! Sonst nach „ p = “ geben Sie den von SPSS ausgegebenen Wert

an!

Gruppenvergleiche mit dem T-Test für abhängige Stichproben

Der T-Test für gepaarte Stichproben testet, ob zwei Variablen, pro Fall gemessen, sich im

Mittel unterscheiden. Über Analysieren + Mittelwerte vergleichen + T-Test bei gepaarten

Stichproben... aktivieren Sie das Steuerungsfenster und übertragen Sie die Variablen

Mathe und Englisch ins Feld „Gepaarte Variablen“.

Wir testen die Hypothese, dass die Noten in Englisch und in Mathe sich im Mittel

unterscheiden. Das Ergebnis:


64 von 73 08.06.2009 15:59

Der p-Wert von 0,876 erreicht kein auch nur annähernd signifikantes Level: Statistisch

betrachtet unterscheiden sich die Englisch- und Mathenoten nicht. In Ihrem Bericht

könnten Sie schreiben:

Die Englischnote (Mittelwert: 6,90, Standardabweichung: 3,58) ist zwar numerisch leicht

höher als die Mathematiknote (Mittelwert: 6,80, Standardabweichung: 2,41), diese

Differenz ist jedoch statistisch nicht signifikant (T = 0,157, df= 49, p = 0,876, n.s.).

Mittelwertvergleiche: Einfaktorielle Varianzanalyse (ANOVA)

Der parametrische Test für Mittelwertunterschiede einer Variablen zwischen mehreren

(mehr als zwei) Gruppen (Ausprägungen einer einzigen Klassifikationsvariablen wie zum

Beispiel Schultyp eingeteilt in 1: Realschule, 2: Gymnasium und 3: Hochbegabtenschule) ist

die einfaktorielle Varianzanalyse (ANOVA). Auch dieser Test setzt nicht nur die Normalität

der Variablen sondern auch die Varianzhomogenität (das heißt: Statistisch dürfen die

Varianzen der Gruppen sich nicht unterscheiden) voraus!

Über Analysieren + Mittelwerte vergleichen + Einfaktorielle ANOVA. . . erhält man

folgendes Steuerungs-fenster:

Übung

Testen Sie, ob die drei Schultypen (Faktor = Gruppierungsvariable) sich anhand der

Mathemathiknote (abhängiger Variablen) unterscheiden!

!Tipp

Da der ANOVA-Test die Homogenität der Varianz voraussetzt, müssen Sie dies auch

testen: Über Optionen... schalten Sie den Test ein!

Die Ausgabe bestätigt: Der Levene-Test in der ersten Tabelle zeigt keine signifikante


65 von 73 08.06.2009 15:59

Abweichung von der Homogenität der Varianzen (auch hier wird einen Grenzwert von 0,1

oft akzeptiert). Wir dürfen also ohne Bedenken die klassische ANOVA-Tabelle (die zweite

Tabelle) interpretieren: Diese bestätigt, dass ein signifikanter Gruppenunterschied besteht:

Berichten könnte man:

Die drei Schultypen unterscheiden sich signifikant: F(2;47)=9,467, p<0,001.

Der klassische ANOVA hört damit auf – meistens will man aber nicht nur testen, ob es

Unterschiede zwischen den Gruppen gibt, sondern auch welche Gruppen sich signifikant

voneinder unterscheiden. Liefert also der klassische Test ein signifikantes Ergebnis, so

wiederhole man die Analyse und schalte dabei über den Knopf Post Hoc. . . einen

nachträglichen Test, der formal dann und nur dann angewendet werden darf, falls der Test,

wie gerade durchgeführt, einen signifikanten Unterschied zwischen allen Gruppen

nachgewiesen hat. In diesem Fall ist dies gegeben, so dass man aus der Testgruppe

Varianz-Gleichheit angenommen (wie vom Levene Test bestätigt) einen passenden Test

für diese paarweisen Vergleiche auswählen kann. Ein häufig angewandter Ansatz zum

Vergleich der Gruppen bei Homogenität der Varianzen ist (wie hier ausgewählt) der von

Bonferroni:


66 von 73 08.06.2009 15:59

Die Ausgabe dazu:

Diese Tabelle vergleicht alle Ausprägungen der Klassifizierungsvariablen paarweise

miteinander: Schultyp 1 mit Schultypen 2 und 3; Schultyp 2 mit Schultypen 1 und 3 usw.

Die Spalte Signifikanz gibt pro Paar den für multiple gegenseitig abhängige Vergleiche

korrigierten Signifikanzwert aus. Hier unterscheiden sich also die Schultypen 2 und 3

anhand der Mathematiknote nicht, die anderen Paare doch.

Deutet der Levene-Test dagegen auf einen signifikanten Unterschied zwischen den

Gruppenvarianzen, so schalte man einen der Tests aus der Rubrik Keine Varianz-

Gleichheit angenommen ein.

Nichtparametrische Vergleiche

Falls nötig: Öffnen Sie die Datei data2.sav!

Vergleich von zwei Gruppen

Häufig benutzte nichtparametrische Pendants zum T-Test für zwei unabhängige

Stichproben sind der Mann-Whitney-U-Test und der Wilcoxon-W-Test.

Zunächst inspizieren wir die Englischnoten der beiden Geschlechter anhand eines


67 von 73 08.06.2009 15:59

Boxplots:

Testen wir nun mit dem nicht-parametrischen Mann-Whitney-Test, ob der dargestellte

Unterschied statistische Signifikanz erreicht: Analysieren + Nichtparametrische Tests +

Zwei unabhängige Stichproben...:

Das Ergebnis:


68 von 73 08.06.2009 15:59

Sowohl Mann-Whitney als auch Wilcoxon bauen ihre Tests auf einen Vergleich der

Rangreihen der Fälle nach der zu untersuchenden Variablen. Die obere Tabelle enthält eine

Zusammenfassung dieser Rangstatistiken: Der mittlere Rang anhand der Englischnote der

Jungen ist in unserem Beispiel 11,19, der der Mädchen 35,86. Überwiegend liegen die

Jungen in den niedrigeren, haben also im Schnitt schlechtere Englischnoten als die

Mädchen. Ob dieses „schlechter“ signifikant ist, wird in der unteren Tabelle berichtet. Der

U-Wert von Mann-Whitney beträgt 4, oder als Z-Werte ausgedrückt einen Wert, der fast

sechs Standardabweichungen vom theoretischen Mittelwert entfernt liegt. Die 2-seitige

Signifikanz (p < .001) bestätigt den Eindruck des Boxplots.

Anmerkung:

Die SPSS-Realisierung der nicht-parametrischen Verfahren zu Gruppenvergleichen

erkennt „String“ (Zeichenketten-)Variablen gar nicht. Hätte man bei Geschlecht zum

Beispiel „m“ und „w“ eingegeben, um zwischen den Geschlechtern zu unterscheiden, so

würde der Variablenname in der Variablenliste nicht einmal erscheinen, und man müsste

die Variable mittels Transformieren + Umkodieren so verändern, dass numerische Werte,

wie etwa „0“ und „1“, die Buchstaben ersetzen. Aus diesem ganz praktischen Grund könnte

man diese Variablen von vonherein so realisieren.

Paarweise Vergleiche von Variablen

Ein häufig anzutreffendes Äquivalent zum paarweisen T-Test ist der Wilcoxon-Test, der

über Analysieren + Nichtparametrische Tests + Zwei verbundene Stichproben... zu

erreichen ist.

Übung

Wiederholen Sie den Vergleich zwischen den Variablen Englisch und Mathe aller Schüler,

jedoch mit dem nichtparametrischen Wilcoxon-Test! Interpretieren Sie die Ergebnisse!


69 von 73 08.06.2009 15:59

Vergleiche von mehr als zwei Gruppen

Nichtparametrische, einfaktorielle Varianzanalysen (also: Vergleiche von mehr als zwei

Gruppen) können mit dem Kruskal-Wallis-Test realisiert werden: Analysieren +

Nichtparametrische Tests + K unabhängige Stichproben.

Übung

Versuchen Sie, mit Ihrem nun erworbenen Wissen, den Kruskall-Wallis Test anzuwenden,

um die drei Schultypen anhand der Variablen IQ zu vergleichen!

Die SPSS-Ausgabe dazu:


70 von 73 08.06.2009 15:59

Übungen zu Teil 2

Öffnen sie die Datei alcohol.sav!

Inspizieren Sie die Liste der Variablen (am einfachsten über den Hauptmenüpunkt Extras

+ Variablen...), um ein „Gefühl“ für den Inhalt dieser Datei zu bekommen!

Benutzen Sie grafische Methoden, um die Verteilungen der Variablen stre_v und stre_n zu

untersuchen!

Erzeugen Sie eine Grafik der Verteilungen der Variablen stre_v und stre_n, die

(parametrisch) die Werte der Stadt- und Landbewohner vergleicht! Gestalten Sie diese

Grafik so, dass sie für eine Veröffentlichung benutzt werden könnte! Exportieren Sie diese

Grafik nach Word!

Erzeugen Sie eine Tabelle, die der gerade erzeugten Grafik entspricht (Inhalt: Mittelwert

und Streuung der beiden Variablen, für Stadt- und Landbewohner getrennt)! Exportieren

Sie auch diese Tabelle nach Word!

Berechnen Sie eine neue Variable, die den Unterschied zwischen Stress-Level vor und

Stress-Level nach Alkoholeinnahme enthält!

Unterscheiden sich Stadt- und Landbewohner anhand der Alkoholeinnahme? Anhand des

Stress-Levels vor Alkoholeinnahme? Anhand des Stress-Levels nach Alkoholeinnahme?

Anhand des Stress-Unterschieds vor gegen nach Alkoholeinnahme? Sind diese

Unterschiede statistisch signifikant?

Wiederholen Sie den Geschlechtsvergleich, aber veranlassen Sie, dass SPSS die Tests

getrennt für Stadt und Land durchführt!

Falls Sie signifikante Unterschiede finden, erzeugen Sie passende Grafiken dazu!

Anhang A: Beispielfragebögen

Fragebogen-Nr.: 116 Noten (1 - 15):

Deutsch: 2


71 von 73 08.06.2009 15:59

Schultyp (1 - 3): 1

Englisch: 6

Mathematik: 2

Alter: 10

IQ: 99

Geschlecht (0=m, 1=w): 0

Chancen: 72

Klasse (5 - 13): 5

Fragebogen-Nr.: 150 Noten (1 - 15):

Deutsch: 1

Schultyp (1 - 3): 1

Englisch: 4

Mathematik: 1

Alter: 10

IQ: 91

Geschlecht (0=m, 1=w): 0

Chancen: 26

Klasse (5 - 13): 5


72 von 73 08.06.2009 15:59

Anhang B: Dokumentation

Die gesamte Dokumentation zur deutschen bzw. englischen Variante des Programms SPSS

erhalten Sie beim Kauf einer Lizenz als zweite CD zum Programm.

Folgende LRZ-Schriften zum Programm sind sowohl im Internet als auch in gedruckter

Form verfügbar:

Wiseman, M. SPSS für Windows Special Topics: Einige Grundbegriffe der Statistik.

München, 1999: Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften.

Auch im Internet:

http://www.lrz-muenchen.de/services/schulung/unterlagen/grundbegriffe/

Inhalt: Erklärungen und Diskussion zu folgenden Begriffen der Statistik: Skalenniveau;

Normalverteilung (Bedeutung? Wann notwendig? Wie überprüfen?); Signifikanz,

Effektgröße, Power; „Exakte Statistik“ und kleine Stichproben

Wiseman, M. SPSS für Windows Special Topics:Lineare Regression. München, 1999:

Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften. Auch im Internet:

http://www.lrz-muenchen.de/services/schulung/unterlagen/regression/

Inhalt: Detaillierte Diskussion mit Beispielen über die Anwendung und Problematik des

Regressionsmodells


73 von 73 08.06.2009 15:59

Date post:	04-Jun-2018
Category:	Documents
Upload:	vuongkhanh
View:	235 times
Download:	0 times

Einführung in SPSS für Windows - uni-kassel.de · Einführung in SPSS für Windows Stand:...

Documents