© Fraunhofer FKIE Experimente in der Linguistik apl. Professor Dr. Ulrich Schade...

© Fraunhofer FKIE

Experimente in der Linguistik

apl. Professor Dr. Ulrich Schade

Fraunhofer-Institut für Kommunikation, Informationsverarbeitung und Ergonomie

[email protected]

8. Vorlesung (09.12.2010)

© Fraunhofer FKIE

apl. Professor Dr. Ulrich SchadeFraunhofer-Institut für Kommunikation, Informationsverarbeitung und Ergonomie(FKIE) Neuenahrer Straße 20 53343 Wachtberg

E-Mail: [email protected]

Telefon: 0228 9435 376Fax: 0228 9435 685

Kontaktdaten


© Fraunhofer FKIE

Überblick

Einführung

Zur wissenschaftstheoretischen Bedeutung von Experimenten

Hypothesenbildung

– Grundlagen zu „Experiment“

– Arten von Experimenten

– Hypothesen

Statistische Auswertung

Beispiele für Experimente in der Linguistik


© Fraunhofer FKIE


Der Vollständigkeit halber folgt noch der Test, mit dem man überprüfen kann, ob für die Messwerte einer Messreihe eine Normalverteilung vorliegt. (Untersucht wird eigentlich die Frage, ob die beobachtete Häufigkeitsverteilung signifikant von der Normalverteilung abweicht.)

Voraussetzungen:

eine Messreihe mit n Messwerten

Die Messwerte sind kardinal skaliert.


© Fraunhofer FKIE

Statistische Auswertung:

Normalverteilungsanpassungstest nach David

Schritt 1: Berechnung der Spannweite w

w = xmax – xmin

Schritt 2: Berechnung des arithmetischen Mittels

Xarith = (x1 + … + xn)/ n


© Fraunhofer FKIE



Schritt 3: Berechnung der Summe der quadrierten Differenzen zwischen den Messwerten und dem Mittelwert

Q = (x1 – Xarith)2 + … + (xn – Xarith)2

Schritt 4: Berechnung der Varianz

s2 = Q / (n – 1)


© Fraunhofer FKIE



Schritt 5: Berechnung des Testwertes D

D = w / s

Das Nachschlagen in der Tabelle gibt für D und (z.B. = 0.05) die beiden kritischen Schranken, Dmin und Dmax.

Sofern D zwischen diesen beiden Schranken liegt (Dmin ≤ D ≤ Dmax), liegt keine signifikante Abweichung von der Normalverteilung vor.


© Fraunhofer FKIE



Ausschnitt

aus der Liste

für D-Werte


= 0.05 = 0.01

n Dmin Dmax Dmin Dmax

10 2.67 3.685 2.51 3.875

20 3.18 4.49 2.99 4.80

30 3.47 4.89 3.27 5.26

50 3.83 5.35 3.62 5.77

100 4.31 5.90 4.10 6.36

200 4.78 6.39 4.59 6.84

500 5.37 6.94 5.13 7.42

1000 5.79 7.33 5.57 7.80

© Fraunhofer FKIE


Wir haben bislang für die Diskussion der statistischen Auswertung immer zwei Messreihen miteinander verglichen.

Häufig hat man jedoch sehr viel mehr Messreihen.

Betrachten wir dazu wieder das Beispiel

Schriefers, H., Meyer, A.S. & Levelt, WJ.M. (1990). Exploring the time course of lexical access in speech production. Journal of Memory and Language, 29, 86-102.


© Fraunhofer FKIE

Schriefers, Meyer & Levelt (1990)


-150 0 +150

0

50

100Ziel: sigaar (Zigarre)Unrel: poes (Katze)Sem: pijp (Pfeife)Phon: citroen (Zitrone)

Aufgetragen wird die Differenz zur Produktion ohne Störwort.

© Fraunhofer FKIE


Im Prinzip haben wir in diesem Beispiel (wenigstens) 9 Messreihen: Messreihe semantische Ähnlichkeit bei SOA -150ms

Messreihe semantische Ähnlichkeit bei SOA 0ms

Messreihe semantische Ähnlichkeit bei SOA +150ms

Messreihe phonologische Ähnlichkeit bei SOA -150ms

Messreihe phonologische Ähnlichkeit bei SOA 0ms

Messreihe phonologische Ähnlichkeit bei SOA +150ms

Messreihe unrelatiert bei SOA -150ms

Messreihe unrelatiert bei SOA 0ms

Messreihe unrelatiert bei SOA +150ms


© Fraunhofer FKIE

Statistische Auswertung: Wechselwirkungen

In diesem Fall müssen wir auch Wechselwirkungen zwischen den Messreihen untersuchen.

Eine Wechselwirkung (Interaktion) liegt dann vor, wenn eine Kombination mehrerer Faktoren für einen Unterschied zwischen den Mittelwerten verantwortlich ist.

Im Beispiel wechselwirken die Faktoren „Relation zwischen Ziel- und Störwort“ und „SOA“.


© Fraunhofer FKIE


Die besondere hemmende Wirkung von Störwörtern, die dem Zielwort semantisch ähnlich sind, zeigt sich nur für SOA = -150ms.

Die vergleichsweise beschleunigende Wirkung von Störwörtern, die dem Zielwort phonologisch ähnlich sind, zeigt sich nicht für SOA = -150ms, sondern nur für SOA = 0ms und SOA = +150ms.


© Fraunhofer FKIE


„Wechselwirkung“ bedeutet:

Ein Effekt der in Bezug auf eine der unabhängigen Variablen sichtbar wird, ergibt sich nur unter bestimmten Werten für eine andere unabhängige Variable.

Im Beispiel: Die stärkere Verzögerung, die man bei semantisch ähnlichen Störwörtern beobachten kann, tritt nicht für alle SOA auf, sondern nur im Fall „SOA = -150ms.


© Fraunhofer FKIE


Um die Bedeutung von Wechselwirkungen zu klären,betrachten wir zunächst einen Fall, in dem die Faktoren von einander unabhängig sind.

(Beispiel von http://www.phil.uni-sb.de/~jakobs/seminar/vpl/mehrfak/interact.htm)

Vier Gruppen von Kindergartenkinder sollen „Früchte wiegen“.

Gruppe a1 wiegt zwei Äpfel; Gruppe a2 wiegt vier Äpfel;

Gruppe b1 wiegt zwei Birnen; Gruppe b2 wiegt vier Birnen.

Die Faktoren sind „Anzahl der Früchte“ und „Art der Frucht“.

Das Gewicht eines Apfels ist unabhängig vom Gewicht einer Birne.


© Fraunhofer FKIE


Wir betrachten zunächst einen anderen Fall, in dem die Faktoren von einander unabhängig sind.

Das Gewicht eines Apfels ist unabhängig vom Gewicht einer Birne.


Faktor 1: Anzahl

Faktor 2: Art der Frucht (Apfel vs. Birne)Gew

icht

© Fraunhofer FKIE


Wenn die Faktoren unabhängig sind, kann man die „Haupteffekte“ interpretieren.

Haupteffekt zu Faktor 1: Äpfel sind schwerer als Birnen.

Haupteffekt zu Faktor 2: Mehr Früchte wiegen mehr.


Faktor 1: Anzahl

Faktor 2: Art der Frucht (Apfel vs. Birne)

Gew

icht

© Fraunhofer FKIE


Da unter Wechselwirkungen Effekte nur unter bestimmten Umständen sichtbar sind, stellt sich die Frage, in welchen Fällen „Haupteffekte“ interpretierbar sind.

Ein Haupteffekt ist dabei ein signifikanter Unterschied zwischen den Mittelwerten aller Messwerte, die zu einer Ausprägung eines Faktors gehören.


© Fraunhofer FKIE


Im Beispiel fasst man etwa die Messwerte der drei Messreihen Messreihe semantische Ähnlichkeit bei SOA -150ms

Messreihe semantische Ähnlichkeit bei SOA 0ms

Messreihe semantische Ähnlichkeit bei SOA +150ms

zusammen zu einer Messreihe und die Messwerte der ReihenMessreihe unrelatiert bei SOA -150ms

Messreihe unrelatiert bei SOA 0ms

Messreihe unrelatiert bei SOA +150ms

zu einer zweiten Messreihe.


© Fraunhofer FKIE


Man kann nun die Mittelwerte der ersten Messreihe („Zielwort und Störwort sind semantisch ähnlich“ [SOA ist egal]) mit dem Mittelwert der zweiten Messreihe („Zielwort und Störwort sind unrelatiert“ [SOA ist egal]) vergleichen. Ergibt sich dann ein signifikanter Unterschied zwischen den beiden Messreihen, kann man sagen, dass es generell zu einer größeren Verzögerung bei semantisch relatierten Störwörtern (im Vergleich zu unrelatierten Störwörtern) kommt (unabhängig von der SOA). Das wäre dann ein interpretierter Haupteffekt.


© Fraunhofer FKIE


Wir unterscheiden drei Typen von Wechselwirkungen:


disordinale Wechselwirkungordinale Wechselwirkung hybride Wechselwirkung

© Fraunhofer FKIE


Bei disordinalen Wechselwirkungen sind die Haupteffekte nicht interpretierbar.


ordinale Wechselwirkung

© Fraunhofer FKIE


Bei ordinalen Wechselwirkungen sind die Haupteffekte im Prinzip interpretierbar.

Ordinale Wechselwirkungen sind insbesondere dann interessant, wenn nachgewiesen werden kann, dass die Gegenläufigkeit signifikant wird.


disordinale Wechselwirkung

© Fraunhofer FKIE



Beispiel aushttp://www.phil.uni-sb.de/~jakobs/seminar/vpl/mehrfak/empbeispiele/beispielinteraktionen.htm

(gilt nur bei begrenzter Lernzeit)

© Fraunhofer FKIE


Bei hybriden Wechselwirkungen ist (nur) einer der Haupteffekte, hier der zu Faktor 2, interpretierbar.


hybride Wechselwirkung

Faktor 2: (rot vs. blau)

Faktor 1: (links vs. rechts)

© Fraunhofer FKIE


Mehrfaktorielle Designs

Generell kann das Problem der Wechselwirkungen nur dann auftreten, wenn unser Experiment ein mehrfaktorielles Design hat.

Dies bedeutet, dass wir zwei oder mehr unabhängige Variablen vorgeben und in Abhängigkeit von diesen den Wert der abhängigen Variablen bestimmen.

In unserem Beispiel liegt ein 3x3-faktorielles und damit ein zweifaktorielles Design vor. Jeder Faktor (= unabhängige Varaible) hat drei mögliche Ausprägungen.


© Fraunhofer FKIE



Mehrfaktorielle Designs sind nicht nur in Bezug auf mögliche Wechselwirkungen problematisch. Sie erfordern auch eine gute Versuchsplanung.


Zielwort IS SOA

VP1 sigaar poes -150

VP2 sigaar poes 0

VP3 sigaar poes +150

VP4 sigaar pijp -150

VP5 sigaar pijp 0

VP6 sigaar pijp +150

VP7 sigaar citroen -150

VP8 sigaar citroen 0

VP9 sigaar citroen +150

© Fraunhofer FKIE



Mehrfaktorielle Designs sind nicht nur in Bezug auf mögliche Wechselwirkungen problematisch. Sie erfordern auch eine gute Versuchsplanung.


Zielwort IS SOA

VP1 sigaar poes (UR) -150

VP1 thermometer noot (UR) 0

VP1 veer slot (UR) +150

VP1 vinger teen (SR) -150

VP1 zak tas (SR) 0

VP1 cactus dadel (SR) +150

VP1 bureau buurman (PR)

-150

VP1 fietspomp file (PR) 0

VP1 geweer gewei (PR) +150

© Fraunhofer FKIE



Bei einem 3x3-faktroriellen Design benötigt man also eine Anzahl von Materialien, die ein Vielfaches von 9 ist, damit jede Versuchsperson jede der neun Testbedingungen gleich häufig präsentiert bekommt.

Auch die Zahl der Versuchspersonen sollte ein Vielfaches von 9 betragen, damit jede der Bedingungen von der selben Anzahl von Versuchspersonen bearbeitet wird.


© Fraunhofer FKIE


Versuchspläne

Ein weiteres Problem ergibt sich daraus, dass die einzelnen Bedingungen einer Versuchsperson in einer bestimmten Reihenfolge präsentiert werden und dass diese Reihenfolge eine Auswirkung auf die Ergebnisse haben könnte. Also versucht man die Präsentation der Stimuli für die verschiedenen Versuchspersonen unterschiedlich zu gestalten. Daraus ergibt sich letztlich ein Versuchsplan, der besagt, in welcher Reihenfolge welche Stimuli welcher Versuchsperson präsentiert werden.


© Fraunhofer FKIE


Versuchspläne

Im Prinzip soll durch die Anwendung eines Versuchsplans erreicht werden, dass systematische Fehler, etwa solche, die durch Lern-effekte entstehen, reduziert werden.

Im einfachsten Fall wird die erste Hälfte der Versuchspersonen zunächst mit den Stimuli der Bedingung A konfrontiert und dann mit denen der Bedingung B (A und B sind dabei Ausprägungen eines Faktors). Die zweite Hälfte der Versuchspersonen wird erst mit B und dann mit A konfrontiert.


© Fraunhofer FKIE


Versuchspläne

Hat man n Bedingungen (in unserem Beispiel eines 3x3-faktoriellen Designs haben wir neuen Bedingungen), so teilt man die Versuchspersonen in n Gruppen. Die Reihenfolge, in der die einzelnen Gruppen dann mit den Bedingungen konfrontiert werden, ergeben sich aus einem so genannten „lateinischen Quadrat“, einem Quadrat aus nxn Feldern, wobei die Felder so mit n verschiedenen Symbolen belegt werden, dass jedes Symbol genau einmal in jeder Zeile und in jeder Spalte auftritt. (Das kennen wir von „Sodoko“.)


© Fraunhofer FKIE


Versuchspläne

Bedingung1: Messreihe semantische Ähnlichkeit bei SOA -150ms

Bedingung2: Messreihe semantische Ähnlichkeit bei SOA 0ms

Bedingung3: Messreihe semantische Ähnlichkeit bei SOA +150ms

Bedingung4: Messreihe phonologische Ähnlichkeit bei SOA -150ms

Bedingung5: Messreihe phonologische Ähnlichkeit bei SOA 0ms

Bedingung6: Messreihe phonologische Ähnlichkeit bei SOA +150ms

Bedingung7: Messreihe unrelatiert bei SOA -150ms

Bedingung8: Messreihe unrelatiert bei SOA 0ms

Bedingung9: Messreihe unrelatiert bei SOA +150ms


© Fraunhofer FKIE


Versuchspläne


1 2 3 4 5 6 7 8 9

2 3 4 5 6 7 8 9 1

3 4 5 6 7 8 9 1 2

4 5 6 7 8 9 1 2 3

5 6 7 8 9 1 2 3 4

6 7 8 9 1 2 3 4 5

7 8 9 1 2 3 4 5 6

8 9 1 2 3 4 5 6 7

9 1 2 3 4 5 6 7 8

Dies ist ein einfach zu erstellendes lateinisches Quadrat, das etwa für die Erstellung von Spiel-plänen (Bundesliga etc.) Anwendung findet, das aber insofern problematisch ist, als sich die Abfolge der Bedingungen nicht ändert.

© Fraunhofer FKIE


Versuchspläne


3 6 4 7 8 5 1 2 9

1 8 2 4 3 9 6 5 7

7 9 5 2 1 6 8 3 4

4 7 1 5 9 2 3 6 8

9 5 6 3 7 8 4 1 2

8 2 3 6 4 1 7 9 5

2 1 8 9 6 4 5 7 3

6 3 9 8 5 7 2 4 1

5 4 7 1 2 3 9 8 6

Man kann das Problem der Abfolge der Bedingungen dadurch verringern, dass man zusätzliche Bedingungen einführt, die für die Einträge gelten müssen, z.B. die Sodoku-Bedingung für n = 9.

© Fraunhofer FKIE


Versuchspläne


Man kann bei einem zweifaktoriellen Design statt dessen auch so genannte „griechisch-lateinische Quadrate“ (auch „Euler-Quadrate“) nutzen, bei denen in jedem Feld zwei Symbole stehen, wobei jedes Symbolpaar nur einmal auftreten darf und jedes einzelne Symbol in jeder Zeile und in jeder Spalte genau einmal auftritt.

Bild aus http://de.wikipedia.org/wiki/Griechisch-lateinisches_Quadrat

© Fraunhofer FKIE



Insgesamt sprechen die Probleme, die man mit multifaktoriellen Design bekommen kann, dafür, die Anzahl der unabhängigen Variablen (der Faktoren) sowie die Anzahl der zu diesen gehörenden Ausprägungen (Werte) zu beschränken.

Das heißt auch, dass bei Experimenten möglichst viele (mögliche) Variablen fest gewählt werden.


Date post:	05-Apr-2015
Category:	Documents
Upload:	ernust-bonnes
View:	103 times
Download:	2 times

© Fraunhofer FKIE Experimente in der Linguistik apl. Professor Dr. Ulrich Schade...

Documents