FPR I - SS 2009- Herzlich Willkommen -
2. Block
Crash-Kurs: VersuchsplanungVersuchsdesign
Planung und Gestaltung einer empirischen Studie
Heutige Themen
Versuchsplanung, Versuchsdesign, Planung und Gestaltung einer empirischen Studie
Die multiple lineare Regression
Die Reliabilitätsanalyse
Die Faktorenanalyse
Versuchsplanung Versuchsdesign
Planung und Gestaltung einer empirischen Studie
Planung einer empirischen Studie (1)
Planungsreferat Phase 1: Erkundungsphase
– Interesse, Idee, praktisches Problem, Literatursuche Phase 2: theoretische Phase
– Datensammlung und Datenauswahl– Formulierung einer Fragestellung– Aufstellen der statistischen Hypothesen (H0, H1)
Planung einer empirischen Studie (2)
Phase 3: Planungsphase– Aufstellen eines Versuchsdesigns – Auswahl der Stichprobe – Auswahl der Versuchsbedingungen– Auswahl des Messinstruments – ev. Fragebogen-, Testkonstruktion und Beschreibung der
Items/Fragen– Auswahl der (voraussichtlichen) statistischen Methoden (mit
Begründung und Voraussetzungen)
--- Ende Planungsreferat ---
Planung einer empirischen Studie (3)
Phase 4: Untersuchungsphase– Datenerhebung mittels Experiment, Befragung,
Beobachtung, Testung und...– Eingabe der Daten in SPSS
Auswertungsreferat Phase 5: Auswertungsphase
– Testtheoretische Überprüfung eigens konstruierter Tests, Fragebögen,… (Reliabilitätsanalyse, Item-Trennschärfen, Itemschwierigkeiten, ev. Validität: Korrelationen mit einem Kriterium,…)
Planung einer empirischen Studie (4)
Phase 5 (Fortsetzung)– Deskriptive Beschreibung der Stichprobe, (Grafiken,
Tabellen, Mittelwerte, Median, Varianzen, Quartilabstand…)
– Verteilungen der selbst konstruierten Items bzw. Fragen (Rohscore, Häufigkeiten der Antwortmögl. pro Item…)
– Hypothesenprüfung: Durchführung diverser zulässiger (!) statistischer Verfahren (t-Test, (M)ANOVA, Korrelationen, Regression, Kreuztabellen, Chi-Quadrat-Test...)
Anmerkung: Bessere Verfahren/Analysen – bessere Bewertung der Seminararbeit
Planung einer empirischen Studie (5)
Phase 6: Interpretationsphase– Ergebnisse, ev. Kritikpunkte, schwächen der
Untersuchung, Störvariablen
Phase 7: Konklusion (Kurzzusammenfassung der wichtigsten Ergebnisse der Studie! – wichtig für den Zuhörer!)
Literatursuche (1)
UB-OPAC (Online Katalog ab 1989)– (http://aleph.univie.ac.at/ALEPH/) – Gesamtbestand der Uni Wien ab 1989
(Hauptbibliothek und Institutsbibliotheken)– Suche nach Titel, Autor, Schlagwort,…
Literatursuche (2)
(psychologische) Datenbanken– Psyndex – PsycInfo– Medizinische Datenbank: Pubmed– Über diesen Link auch von zu Hause: https://univpn.univie.ac.at/– Login mit User-ID und Passwort
Literatursuche (3)
Wichtig: Vor allem mit englischen Suchbegriffen und Schlagwörtern suchen!
Viele Zeitschriften auch online verfügbar
http://bibliothek.univie.ac.at/fb-psychologie/online_verfuegbare_zeitschriften.html
Gesamte verfügbare Zeitschriftenliste in FB (neben PCs) oder Online über FB-Homepagehttp://bibliothek.univie.ac.at/fb-psychologie/zeitschriftenliste_al.html
Elektronische Zeitschriftenbibliothek UNI Wien
http://rzblx1.uni-regensburg.de/ezeit/fl.phtml?bibid=UBWI&colors=7&lang=de¬ation=CL-CZ
– Zugang zu Zeitschriften: freie bis kostenpflichtige Volltextverfügbarkeit. (Ampelsymbol)
– Zugang über Campus PCs oder von zu Hause über https://univpn.univie.ac.at/
Literatursuche (4)
Literatursuche (5)
Psychologische Tests/Messinstrumente
„Testliste“ in FB für Psychologie (bei PCs)
Testbeschreibungen und Gütekriterien in – Kubinger, K. D. (1995). Einführung in die psychologische
Diagnostik. Weinheim: Psychologie Verlags Union. (siehe auch Anhang!)
– Kubinger, K. D. (2003). Schlüsselbegriffe der psychologischen Diagnostik. Weinheim: Beltz
– Handbuch des Messinstruments
Literatursuche (6)
Lehrbücher, Monographien ausleihen– Online suchen– bei UB Wien online bestellen– bei FB f. Psych. online oder selbst suchen (jedes
Buch hat eine Signaturnummer aus einem Buchstaben+Zahlencode) z.B: EA-521/P-Rot
Zitierregeln (1) kurzes Beispiel
Nach der Deutschen Gesellschaft für Psychologie– www.dgps.de
A) Zitieren im Literaturverzeichnis
Bsp Monographie: Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Erscheinungsort: Verlag.
Rost, J. (1996). Lehrbuch Testtheorie Testkonstruktion. Bern: Verlag Hans Huber.
Zitierregeln (2)
Bsp Zeitschrift:Nachname, Vorname abgekürzt. (Erscheinungsjahr). Titel der Arbeit (inkl. Untertitel). Name der Zeitschrift, Jahrgang bzw. Band, Seitenangaben.Borg, I. (1984). Das additive Konstantenproblem der multidimensionalen Skalierung. Zeitschrift für Sozialpsychologie, 15, 248-253.
Zitierregeln (3)
B) Zitieren im Text
Bsp: In einer Studie konnten Schmid et al. (1981) zeigen, dass…
Bsp: 1981 konnten Schmid et al. in einer Studie zeigen, dass…
Bsp: In einer Studie (Schmid et al., 1981) konnte gezeigt werden, dass…
Einführung in die Versuchsplanung
Versuchsdesign aufstellen
1. Was will ich erheben, testen,…2. Wie will ich es erheben, testen,…
a) Fragebogenb) Testc) Experiment, Quasiexperiment (VG, KG)d) Beobachtunge) Interview f) …-> selbst konstruiert (vs. aus Literatur, bereits vorhanden)
Test/Fragebogensuche:1. Literatursuche2. Existiert bereits ein Fragebogen, Test?3. Wenn ja, Testqualität (Gütekriterien)
überprüfen (Handbuch)4. Wenn nein, eigene Konstruktion
Ad Messinstrument:
Selbstkonstruktion
1) Wie kann ich eine Fragestellung, Hypothese operationalisieren?
Grundfrage für weitere stat. Auswertungen:-> Welche Variablenart bzw. welches Skaleniveau soll
mein Messinstrument aufweisen?!!!
Variablentypen
Quantitativ Stetig: (theoretisch) unendlich viele Ausprägungen/Intervalle
(wie Größe, Gewicht, Längen,...) Diskret: eine bestimmte, endliche Anzahl (z.B: Anzahl der
Personen in einem Raum, Testscore,...).
Qualitativ nur beschränkte Ausprägungen oder quantitative Variablen in Klassen
zusammengefasst Dichotom: 2 Ausprägungen (z.B: Geschlecht, Versuchs-
Kontrollgruppe, Psychologie vs. Nicht-PsychologiestudentInnen, Altersklasse: 15-30 und 31-60…)
Polytom: mehr als 2 Ausprägungen (z.B: Bildung, Haarfarbe, Beruf, Einkommensklasse: 0-500, 501-1000, >1000 Euro...)
Skalentypen
– intervallskaliert/rationalskaliert (Größe, Gewicht, Längen, (~)Rohscore, Temperatur...)
– rang- oder ordinalskaliert (Noten, Rangreihen, Dienstgrade, Beliebtheit von Personen...)
– nominalskaliert (Geschlecht, Bildungsgrad, Haarfarbe, Beruf...)
Zusammenhang Skalen- Variablentypen
Intervallskala Quantitativ (stetig, diskret)
Rangskala Grenzfall zw. Quant. und Qual.
Nominalskala Qualitativ (dichotom, polytom)
Vorplanung
Achtung!!! -> Je nach Variablentyp sind nur bestimmte zulässige
statistische Verfahren anwendbar!-> daher muss vor Item-, Test- oder
Fragebogenkonstruktion folgendes beachtet werden:– welche statistischen Verfahren will ich anwenden– wie müssen demnach die Variablen erhoben bzw.
konstruiert werden– Welche Möglichkeiten der Erhebung habe ich
Beispiel 1
Ich will eine lineare Regression rechnen:
Voraussetzung für eine Regression: AV muss
intervallskaliert, quantitativ sein.
Beispiel 2
Ich will eine zweifache Varianzanalyse rechnen:
Voraussetzung für eine 2-fache ANOVA: AV
intervallskaliert, quantitativ UVs
beide qualitativ (dichotom, polytom) oder qualitative V. in Klassen zusammengefasst
Genügend VP pro Zelle (Faktorkombination)
Skalenkonstruktion
Definition: Eine Skala besteht aus einer Reihe von Items, welche die gleiche Dimension messen.
Qualitätsprüfung: Mittels testtheoretischer Verfahren (Reliabilitätsanalyse, FA, Rasch Modell!, Trennschärfen…)
Beispiel: Forschungsfrage: Einstellung zur EU Konstruktion einer Anzahl von Items (Skala), welche die
Einstellung der Befragten zur EU erfassen.
Skalenkonstruktion
Vorgehen:– die Items formulieren– Das Antwortformat festlegen (z.B. „Rating Skala“:
dreikategoriell: stimme zu, weiß nicht, stimme nicht zu; multiple choice, single choice, Zahlenwerte von 1 bis 10… )
– Das Antwortformat muss über die Items gleich bleiben!
…und hoffen dass die Qualität der Skala bei späteren testtheoretischen Auswertungen gewährleistet ist.
– Die testtheoretische, qualitative Überprüfung der Skala kann i.d.R. nur nach Testungen (mit Daten!) durchgeführt werden!
SkalenkonstruktionExemplarischer Fragebogen mit 3 Items
zum Thema „Einstellung zur EU“
Frage 1: Die EU bringt uns viele wirtschaftliche Vorteile.O trifft zu O trifft manchmal zu O trifft nicht zu
Frage 2: Eine ständige Erweiterung des europäischen Raumes schadet der heimischen Wirtschaft enorm.
O trifft zu O trifft manchmal zu O trifft nicht zu
Frage 3: Ich würde bei einer Volksabstimmung für die EU stimmen.O trifft zu O trifft manchmal zu O trifft nicht zu
Kodierung: 1-3 Werte pro ItemRohscore: hoher Wert: positive Einstellung, niedriger Wert: negative Einstellung
Min. Max: 3 bzw. 9 Rohwertepunkte Eine Skala hat immer 2 Dimensionen Achtung auf die Polarität der einzelnen Items!!
3 12
321
3 2 1
Rohwert
Die gewählten Antwortwerte aller Items eines Befragten werden zu (s)einem Rohwert summiert.
Likert-Skala, Ratingskala Voraussetzung!: Die Skala ist testtheoretisch in
Ordnung (die Überprüfung ist jedoch erst mit Daten möglich!)
Rohwert
Achtung!!: auf die richtige Punktevergabe der Antwortmöglichkeiten pro Item achten! (die Polarität muss stimmen!) (siehe oben: Bsp.-Skala „EU“)
Eine Skala hat 2 Dimensionen: ad Beispiel:hoher Rohscore -> positive Einstellung zur EUniedriger Rohscore -> negative Einstellung zur EU
Antwortkategorien (1)
Rating-Skalen 0 stimmt gar nicht 0 stimmt teilweise 0 stimmt völlig
Durch Punktevergabe: z.B.: Wertebereich von 1 bis 10
Polaritätenprofil:gespannt 1 2 3 4 5 gelöst
aggressiv -2 -1 0 1 2 friedlichAnalogskala:
Durch ankreuzen | x |
Durch ankreuzen |
Antwortkategorien (2)
Multiple Choice
Mehrfachantworten: Wählen sie Ihre Hobbies0 Sport 0 Kino 0 Lesen 0 Ausgehen 0 Basteln,…
Meist bei demographischen Fragen
Einfachantwort: Hauptstadt von Frankreich0 Istanbul 0 Oslo 0 Paris 0 Bukarest
Meist bei Leistungstests
Testtheoretische Analyse der Skala
Qualitätsprüfung der Skala– Immer erst nach der Stichprobenerhebung
möglich– Man benötigt Daten um testtheoretisch
auszuwerten
1. Überprüfung der Eindimensionalität
„Messen alle Items einer Skala die gleiche Dimension?“– Reliabilitätsanalyse – Rasch Modell – ev. Faktorenanalyse (1 Faktor)
2. Itemparameter
Itemschwierigkeit (bzw. Lösungshfgkt) Dichotom (richtig/falsch)
Item1
2 2,9 2,9 2,966 97,1 97,1 100,068 100,0 100,0
nicht gelöstgelöstTotal
ValidFrequency Percent Valid Percent
CumulativePercent
nicht gelöst gelöst
Item1
0
20
40
60
80
100
Perc
ent
Item1
2. Itemparameter
– Häufigkeiten/Verteilungen der gewählten Antwortkategorien pro Item
– auch mehrkategoriell! Number of Children
419 27,6 27,8 27,8255 16,8 16,9 44,7375 24,7 24,9 69,5215 14,2 14,2 83,8127 8,4 8,4 92,254 3,6 3,6 95,824 1,6 1,6 97,323 1,5 1,5 98,917 1,1 1,1 100,0
1509 99,5 100,08 ,5
1517 100,0
01234567Eight or MoreTotal
Valid
NAMissingTotal
Frequency Percent Valid PercentCumulative
Percent
2. Itemparameter
– Itemtrennschärfe („Wie gut passt das Item zur Gesamtskala“) -> Korrelation eines Items mit der Skala
Item-Total Statistics
6,66 9,877 ,686 ,8956,38 8,883 ,837 ,8406,32 8,697 ,815 ,8486,31 9,350 ,741 ,876
J1J2J3J4
Scale Mean ifItem Deleted
ScaleVariance if
Item Deleted
CorrectedItem-TotalCorrelation
Cronbach'sAlpha if Item
Deleted
Reliability Statistics
,896 4
Cronbach'sAlpha N of Items
3. Validität(eventuell)
„Misst die Skala das, was sie messen soll?“– Korrelation mit Testwerten aus einem anderem
Test, der gleiches misst– Korrelation mit einem anderen (Außen-)Kriterium
(z.B: Rohscore im Mathematiktest korreliert mit Mathematiknote)
Vorgehen
Nach testtheoretischen Überprüfung der Skala:– Eliminierung der Items, die nicht zu den anderen
passen (geringe Trennschärfe, zu leicht, zu schwer, verringerte Reliabilität…)
Achtung!!: ev. nur falsche Polarität Weitere Auswertung und Hypothesenprüfung nur
mit der korrigierten Skala!
Zusammenfassung: selbst konstruierte Messinstrumente
Angabe von: – Entwicklungsschritten/Vorgehen (kurz)– Skalentyp – Antwortformat (Bsp.: 3stufige Ratingskala) – Anzahl der Items– (!) Itembeispiele (wichtig für das Referat! – besseres
Verständnis für den Zuhörer)– Gütekriterien: (v.a. Reliabilität und Itemtrennschärfen!)
Testtheoretische Analysen (nach Datenerhebung) des selbst entwickelten Messinstruments sind Voraussetzung für weiteres Vorgehen!
gegebene Tests, Fragebögen
Prüfung, ob passend und testtheoretisch in Ordnung (Handbuch lesen)
Immer Angabe von:– Name des Untersuchungsinstruments – Autor(inn)en– Kurze Erklärung, was mit dem Instrument gemessen wird– Gütekriterien (Rel., Obj., Val…)– Welches Antwortformat– Anzahl der Items– (!) Itembeispiel (wichtig für das Referat! – besseres
Verständnis für den Zuhörer)– Wurden die Items modifiziert? Warum? (wenn möglich
Originalskala übernehmen)
Demographische Variablen
Niemals bei Erhebung vergessen! Fast alle Fragestellungen zielen auf differentielle
Unterschiede ab!– Geschlecht– Alter– Schulbildung– Beruf– Familienstand– Anzahl der Kinder– ……immer an die Untersuchung angepasst
Tipp…
Immer maximale Information erfragen!Beispiel
Alter immer genau erheben (z.B: in Jahren 21, 54, 66…) nicht in Klassen erheben (0-20, 21-60,…) bereits anfänglicher Informationsverlust!
In Altersklassen kann nachträglich in SPSS eingeteilt werden
Qualitative vs. Quantitative Auswertung
Was kann wie ausgewertet werden?
1 Demographische Variablen (1)
z.B. Geschlecht, Bildungsstand, Haarfarbe… Sind qualitative (dichotome, polytome)
Variablen, nominalskaliert Auswertung:
deskriptiv, nach Häufigkeiten, qualitativ (Binomialtest, Chi-Quadrat-Test,
Kreuztabellen)
1. Demographische Variablen (2)
z.B. Alter, Einkommen Sind quantitative (stetige, diskrete) Variablen,
min. intervallskaliert Auswertung: alles möglich
Deskriptiv, nach Häufigkeiten, qualitativ (wenn in Klassen) quantitativ (t-Test, VA, Regression…)
2. einzelne Fragen, Items(nominalskaliert)
z.B. Welche Augenfarbe 0 blau 0 grün 0 braun 0 andere Ist eine qualitative (polytome) Variable,
nominalskaliert Auswertung:
deskriptiv, nach Häufigkeiten qualitativ (Binomialtest, Chi-Quadrat-Test, Kreuztabellen)
3. einzelne Fragen, Items(rangskaliert)
z.B. Sind sie mit dem EU Betritt der Türkei einverstanden?
0 trifft zu 0 trifft eher zu 0 trifft eher nicht zu 0 trifft nicht zu
Ist eine rangskalierte Variable Auswertung:
deskriptiv, nach Häufigkeiten, qualitativ (Binomialtest, Chi-Quadrat-Test,
Kreuztabellen) beschränkt quantitativ (Median, Quartilabstand)
4. Eine Skala von Items(~ intervallskaliert) (1)
A) Normierter Test, Fragebogen aus Literatur
B) Selbstkonstruierte Skala, wenn Testtheoretische Kriterien (Reliabilität, Item-Trennschärfen,…) in Ordnung sind Regel für FPR I:
Reliabilität: >0.6…ok, >0.8…gut Trennschärfen: >0.10…ok, >0.3…gut Items mit negativen oder Trennschärfen um
Null eliminieren!
4. Eine Skala von Items(~ intervallskaliert) (2)
Der Rohscore (Summe der Antworten pro Item) ist eine ~intervallskalierte Variable
Auswertung: Deskriptiv, nach Häufigkeiten, qualitativ Quantitative Auswertung (t-Test, VA,
Regression, Produkt-Moment-Korrelation,…)
ZusammenfassungFragebogen-Testkonstruktion
Was will ich überprüfen Wie will ich es überprüfen Welche statistischen Verfahren will ich anwenden Fragen, Items so konstruieren, dass Variablentyp
und Skalenniveau passend für Fragestellung und Auswertung sind einzelne Items/Fragen, Antwortformat richtig
wählen Welche demographischen Variablen benötige ich?
ZusammenfassungFragebogen-Testkonstruktion
Nach Datenerhebung testtheoretische Überprüfung der Items/Fragen, Skala
Eliminierung nicht geeigneter Items/Fragen Statistische Analyse und Hypothesenprüfung
mit verbliebenen Items/Fragen Mit geeigneten statistischen Methoden!
Essentielle LiteraturVersuchsplanung
Bortz, J. & Döring, N. (1995). Forschungsmethoden und Evaluation. Berlin, Heidelberg: Springer.
Bortz, J. (1993). Statistik für Sozialwissenschaftler. Berlin: Springer.
Kubinger, K. D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psychologie Verlags Union.