+ All Categories
Home > Documents > Tests im Spannungsfeld von Individualdiagnostik und … · 2012-09-28 · Verhaltensstichprobe P x...

Tests im Spannungsfeld von Individualdiagnostik und … · 2012-09-28 · Verhaltensstichprobe P x...

Date post: 17-Sep-2018
Category:
Upload: buidung
View: 218 times
Download: 0 times
Share this document with a friend
30
D. Leutner Tests im Spannungsfeld 1 [30] Tests im Spannungsfeld von Individualdiagnostik und Bildungsmonitoring Detlev Leutner Universität Duisburg-Essen Lehrstuhl für Lehr-Lernpsychologie Dank an Jens Fleischer, Christian Spoden & Joachim Wirth
Transcript

D. Leutner Tests im Spannungsfeld 1 [30]

Tests im Spannungsfeld von Individualdiagnostik und Bildungsmonitoring

Detlev Leutner

Universität Duisburg-Essen Lehrstuhl für Lehr-Lernpsychologie

Dank an Jens Fleischer, Christian Spoden & Joachim Wirth

D. Leutner Tests im Spannungsfeld 2 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 3 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 4 [30]

Einleitung

Seit PISA: Ergebnisse von Bildungs- und Ausbildungsprozessen vermehrt im Fokus der Aufmerksamkeit („Produkte statt Zertifikate“)

– erworbenes Wissen, ausgebildete Fähigkeiten, Fertigkeiten, – Einstellungen und Bereitschaften, verfügbare Qualifikationen Kompetenzen (als „Kontextspezifische kognitive Leistungsdisposition,

die sich funktional auf Situationen und Anforderungen in einer bestimmten Domäne beziehen“; Klieme & Leutner, 2006).

Tests als notwendige Instrumente zur Erfassung von– Lernvoraussetzungen (z.B. individuelle Sprachstandsfeststellung in NRW)– Lernergebnissen

(Ebene einzelner Schüler, Ebene einzelner Klassen & Schulen, Ebene der Bildungssysteme) „evidence-based policy and practice“ (Slavin, 2002)

D. Leutner Tests im Spannungsfeld 5 [30]

Einleitung

Ziele der Nutzung von (standard-bezogenen) Testverfahren in der Bildungspraxis(„Klieme“-Expertise zur Entwicklung nationaler Bildungsstandards; Klieme et al., 2003)

– Bildungsmonitoring » Das Erreichen von Bildungsstandards kontrollieren – zum Beispiel:

Werden die Mindeststandards von allen Schülern erreicht? Entspricht die Verteilung der Schüler über die Kompetenzstufen den Erwartungen?

– Schulevaluation » Rückschlüsse auf den Erfolg schulischer Programme oder unterrichtlicher Maßnahmen ziehen,

um damit eine Grundlage für die Verbesserung von Schule zu haben– Individualdiagnostik

» Etwas über den einzelnen Schüler erfahren, über seine Stärken und Defizite, damit Entscheidungen über gezielte Fördermaßnahmen getroffen werden können

D. Leutner Tests im Spannungsfeld 6 [30]

Einleitung Jeder kennt Tests…

Zweck des Tests unmittelbar erkenntlich?

D. Leutner Tests im Spannungsfeld 7 [30]

Einleitung Jeder

kennt Tests…

Zweck des Tests unmittelbar erkenntlich?

Wie komme ich preisgünstig und schnell von A nach B?

D. Leutner Tests im Spannungsfeld 8 [30]

Einleitung Jeder

kennt Tests…

Zweck des Tests unmittelbar erkenntlich?

D. Leutner Tests im Spannungsfeld 9 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 10 [30]

Tests: Interpretation von Testergebnissen

KTT ItemPerson 1 2 3 4 5 6 7 8 Summe

1 0 0 0 0 0 0 0 0 02 0 0 1 0 0 0 0 0 13 0 1 0 1 0 0 0 0 24 1 1 0 0 0 1 0 0 35 0 0 1 0 1 0 1 0 36 0 1 1 0 1 0 1 0 47 1 1 0 1 0 1 1 0 58 0 1 1 1 0 1 1 1 69 1 0 1 1 1 1 1 1 7

10 0 1 1 1 1 1 1 1 7Summe 3 6 6 5 4 5 6 3 38

Grundstruktur eines Tests:

– Beobachtung einerVerhaltensstichprobe

P x S R – Schluss auf ein

(latentes) Konstruktin Abhängigkeit von einemgeeigneten Testmodell

D. Leutner Tests im Spannungsfeld 11 [30]

Tests: Interpretation von Testergebnissen

„Kompetenz“ als Konstrukt– Vgl. (kognitivistische) Lehrzieldefinition nach Klauer (1987),

vgl. Klauer & Leutner (2007)

Lehrziel(Soll-Zustand)

S-Komponente(Inhalt und Situation)

R-Komponente(Erwartete Handlung)

Aufgabenmenge(Lehrstoff)

Lösungs-wahrscheinlichkeit Kompetenz bzw.

Verhaltensdisposition(Ist-Zustand)

Geforderter Ausprägungsgrad

D. Leutner Tests im Spannungsfeld 12 [30]

Testmodelle: Justus hat 4 Punkte

im Mathe-Test erreicht.– ??? (Justus hat mehr Punkte als Johanna.)

Justus hat 4 von 8 Aufgaben im Mathe-Test richtig gelöst.

– Justus hat 50 % richtig. Justus hat 4 von 8 Aufgaben im

lehrziel-orientierten Mathe-Testrichtig gelöst.

– Justus hat nach dem „binomialen“ Testmodell eine Kompetenz von 50 % (95 %-Vertrauensintervall 50 +/- 34.3 %).

Tests: Interpretation von Testergebnissen

KTT ItemPerson 1 2 3 4 5 6 7 8 Summe

1 0 0 0 0 0 0 0 0 02 0 0 1 0 0 0 0 0 13 0 1 0 1 0 0 0 0 24 1 1 0 0 0 1 0 0 35 0 0 1 0 1 0 1 0 36 0 1 1 0 1 0 1 0 47 1 1 0 1 0 1 1 0 58 0 1 1 1 0 1 1 1 69 1 0 1 1 1 1 1 1 7

10 0 1 1 1 1 1 1 1 7Summe 3 6 6 5 4 5 6 3 38

D. Leutner Tests im Spannungsfeld 13 [30]

Tests: Interpretation von TestergebnissenTestmodelle: Justus hat 4 von 8 Aufgaben im

Guttman- oder Rasch-skalierten Mathe-Test richtig gelöst.

– Justus hat Kompetenzniveau xyz erreicht. Empirisch prüfbare Datenstruktur,

setzt „kumulative“ Aufgaben voraus.

0.0

1.0

0.5

Kompetenz

Items mit ICC

Lösu

ngsw

ahrsc

heinl

ichke

t Guttman-Items Rasch-Items

Guttman ItemPerson 1 2 3 4 5 6 7 8 Summe

1 0 0 0 0 0 0 0 0 02 1 0 0 0 0 0 0 0 13 1 1 0 0 0 0 0 0 24 1 1 1 0 0 0 0 0 35 1 1 1 0 0 0 0 0 36 1 1 1 1 0 0 0 0 47 1 1 1 1 1 0 0 0 58 1 1 1 1 1 1 0 0 69 1 1 1 1 1 1 1 0 7

10 1 1 1 1 1 1 1 1 8Summe 9 8 7 5 4 3 2 1 39

Rasch ItemPerson 1 2 3 4 5 6 7 8 Summe

1 0 1 0 0 0 0 0 0 12 1 0 1 0 0 0 0 0 23 1 0 1 0 0 0 0 0 24 1 1 0 1 0 0 0 0 35 1 1 1 0 1 0 0 0 46 1 1 1 0 1 0 0 0 47 1 1 1 1 0 0 1 0 58 1 1 1 1 0 1 0 1 69 1 1 1 1 1 0 1 0 6

10 1 1 1 1 1 1 0 1 7Summe 9 8 8 5 4 2 2 2 40

D. Leutner Tests im Spannungsfeld 14 [30]

Tests: Interpretation …

PISA 2003:Zuordnung der „Anschlusszüge“-Aufgabe zu den Stufen der Problemlösekompetenz

D. Leutner Tests im Spannungsfeld 15 [30]

Tests: Interpretation von TestergebnissenLernstandserhebungen

NRW 2004:MathematischeModellierkompetenz

– M4/4+: Komplexes Modellieren, Modelle entwickeln

– M3: Einschrittiges Modellieren

– M2: Elementares Situationsverständnis

– M1: Kontextbezogenes Rechnen

D. Leutner Tests im Spannungsfeld 16 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 17 [30]

Tests im Spannungsfeld: Individualdiagnostik versus Bildungsmonitoring

Individualdiagnostik Bildungsmonitoring(der KMK)

Funk-tion

Vorbereitung von Entscheidungen im Einzelfall(Selektion, Platzierung)

Vorbereitung politischer Entscheidungen auf Schulsystemebene(Fremdevaluation)

Fokus Inhaltliche Tiefein einem Fachgebiet:

Itemstichprobe

Kompetenzschätzung des Individuums

Fachliche Tiefeund zugleich fachliche Breite:

Item- und Personenstichprobe; „rotiertes“ Testdesign

Kompetenzverteilung in Bundesländern, Staaten(keine Individualdiagnostik, keine Aussagen auf Schul- und Klassenebene)

D. Leutner Tests im Spannungsfeld 18 [30]

Tests im Spannungsfeld: Lernstandserhebungen/ Vergleichsarbeiten als Bindeglied?

Individualdiagnostik Lernstandserhebungen(in NRW)

Bildungsmonitoring(der KMK)

Funk-tion

Vorbereitung von Entscheidungen im Einzelfall(Selektion, Platzierung)

Vorbereitung päd./ did./ curricularer Entscheidungen auf Schul- und Unterrichtsebene(Selbstevaluation)

Vorbereitung politischer Entscheidungen auf Schulsystemebene(Fremdevaluation)

Fokus Inhaltliche Tiefein einem Fachgebiet:

Itemstichprobe

Kompetenzschätzung des Individuums

Erst Tiefe in einem Fachgebiet, dann Breite:

Vollerhebung aller Personen; Itemstichprobe

Kompetenzverteilung in Klassen, Schulen(keine Individualdiagnostik)

Fachliche Tiefeund zugleich fachliche Breite:

Item- und Personenstichprobe; „rotiertes“ Testdesign

Kompetenzverteilung in Bundesländern, Staaten(keine Individualdiagnostik, keine Aussagen auf Schul- und Klassenebene)

D. Leutner Tests im Spannungsfeld 19 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 20 [30]

Konsequenzen: Testentwicklung & Testdurchführung

Gewährleistung der Testgütekriterien

– Objektivität» Durchführung, Auswertung & Interpretation: Externe Testleiter versus Lehrkräfte „vor Ort“

– Reliabilität» Unsystematischer Messfehler bei (kompetenzbezogenen) Aussagen über einzelne Personen » Unsystematischer Stichprobenfehler bei (kompetenzbezogenen) Aussagen über Personengruppen

– Validität» Gültigkeit aller Aussagen: Kontent, Konstrukt & Testmodell; aber auch: Curriculum

Nicht trivial.

D. Leutner Tests im Spannungsfeld 21 [30]

Konsequenzen: Testentwicklung & TestdurchführungBeispiel Reliabilität & Objektivität bei den

Lernstandserhebungen 2004 Klasse 9 in NRW, Deutsch schreiben– Ursprünglich: Je Schreibaufgabe 6 „Dimensionen“ (Items),

die auf einer von 4 Lösungsstufen (A bis D) zu bewerten waren.

– Überarbeitet: Dimension 1 ausgeschärft („Lupenmodell“) und skaliert; Reliabilität als „person seperation reliability“ der Raschskala.

Schreibaufgabe Reliabilität auf Skalen-Ebene(Interne Konsistenz, Erst-Rater)

Objektivität auf Item-Ebene(mittleres Item-Gamma zweiter Rater)

A 1 .94 .57A 2 .91 .67A 3 .92 .54A 4 .93 .39

Reliabilität Objektivität (Mittleres Item-Gamma)Deutsch (Schreiben) .87 .72

D. Leutner Tests im Spannungsfeld 22 [30]

Konsequenzen: Testentwicklung & Testdurchführung

Beispiel Reliabilität: 95 %-Vertrauensintervallefür Kompetenstufenzuordnungauf Ebene

– des Individuums – der Klasse – der Schule

Lernstandserhebung 2007Klasse 8 in NRW, Deutsch Leseverständnis

WLE-Para-meter

0

1

2

3

-.67-.33

+.24

+.83

+1.66

+3.84

5

4

3

2

1

Individu-um N=1

KlasseN=25

SchuleN=100

Kompetenz-stufen

D. Leutner Tests im Spannungsfeld 23 [30]

Konsequenzen: Testentwicklung & TestdurchführungBeispiel Validität:

Lernstandserhebung 2005 Klasse 9 in NRW, KonstruktvaliditätNMDS (stress < .001)Radex-Struktur

– Fach als „Circumplex“-Facette– Kompetenzskala innerhalb des Faches

als „Simplex“-Facette(rezeptiv Lesen rezeptiv Hören produktiv Schreiben/ Problemlösen)

Hörverst

LesenSchreiben

Problem-lösen

Hörverst

Schreiben

Mathematik Deutsch

Englisch

D-L D-S D-H E-H E-S M-PD-Lesen 1,00 0,54 0,70 0,63 0,64 0,60D-Schreiben 0,54 1,00 0,51 0,40 0,47 0,38D-Hörverst. 0,70 0,51 1,00 0,57 0,56 0,55E-Hörverst. 0,63 0,40 0,57 1,00 0,67 0,57E-Schreiben 0,64 0,47 0,56 0,67 1,00 0,51M-Probleml. 0,60 0,38 0,55 0,57 0,51 1,00

D. Leutner Tests im Spannungsfeld 24 [30]

Konsequenzen: Umgang mit Testergebnissen(LSE 2004 NRW, Ergebnisrückmeldung)

Verständlichkeit & Akzeptanz– Deutsch & Englisch (Lesen):

unauffällig– Mathematik (Modellieren):

anders (homogener) als in Referenzgruppen, aber gleiches Niveau

D. Leutner Tests im Spannungsfeld 25 [30]

Konsequenzen: Umgang mit Testergebnissen(LSE 2004 NRW, Ergebnisrückmeldung)

Verständlichkeit & Akzeptanz– Deutsch & Englisch (Lesen):

Niveau höher als in Referenzgruppen

– Mathematik (Modellieren): unauffällig

D. Leutner Tests im Spannungsfeld 26 [30]

Was Sie erwartet…

EinleitungTests

– Interpretation von Testergebnissen: TestmodelleTests im Spannungsfeld

– Individualdiagnostik versus Bildungsmonitoring– Lernstandserhebungen/Vergleichsarbeiten als Bindeglied?

Konsequenzen– Testentwicklung– Testdurchführung – Umgang mit Testergebnissen

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 27 [30]

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

„Kompetenzmodelle zur Erfassung individueller Lernergebnisse und zur Bilanzierung von Bildungsprozessen“

– Das … Schwerpunktprogramm soll … kognitiv orientierte Experten auf den Gebieten einzelner bereichsspezifischer Kompetenzen mit Experten auf dem Gebiet des Messens und Testens zusammenbringen. Ziel ist es, Kompetenzstruktur- und Kompetenzentwicklungsmodelle zu erarbeiten und empirisch zu prüfen, anhand derer sich valide und faire Messinstrumente auf zwei Ebenen konstruieren lassen: zum einen auf der Ebene der Förderung individueller Lernprozesse (im Sinne einer individuellen „Kompetenzdiagnostik“), zum anderen auf der Ebene von Untersuchungen zum Monitoring von Bildungsinstitutionen und Bildungssystemen („Assessment“)….

– Kompetenz = „Kontextspezifische kognitive Leistungsdisposition, die sich funktional auf Situationen und Anforderungen in einer bestimmten Domäne bezieht“ (Klieme & Leutner, 2006).

D. Leutner Tests im Spannungsfeld 28 [30]

Kompetenz-modelle

Strukturen und Niveaus

Kognitive Grund-voraussetzungen

Messkonzepteund Messverfahren

psychometrischeModelle

Nutzung vonDiagnostik und Assessment

1

2

3

4

1

2

3

4

1

2

3

4

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

D. Leutner Tests im Spannungsfeld 29 [30]

Ausblick: DFG-Schwerpunktprogramm „Kompetenzmodelle“

Fruchtbare Kooperation dreier „fremder Schwestern“??? (in Anlehnung an Terhart, 2002)

Positiv-Beispiele koord. DFG-Forschungsprogramme» NWU-Essen: FG und GK „Naturwissenschaftlicher Unterricht“» Bamberg: FG „Bildungsprozesse, Kompetenzentwicklung

und Selektionsentscheidungen im Vor- und Grundschulalter“» Tübingen: FG "Analyse und Förderung effektiver Lehr-

Lernprozesse“» Landau: GK „Unterrichtsprozesse» SPP 1293: „Kompetenzmodelle zur Erfassung individueller

Lernergebnisse und zur Bilanzierung von Bildungsprozessen“

Perspektiven der Einbindung weiterer sozial- & geisteswissenschaftlicher Fachdidaktiken???

Psychologie:Orientierung

am Individuum

Fachdidaktik:Orientierungam Unterricht

Bildungsforschung:Orientierungan Schule & Schulsystem

Psychologie:Orientierung

am Individuum

Fachdidaktik:Orientierungam Unterricht

Bildungsforschung:Orientierungan Schule & Schulsystem

D. Leutner Tests im Spannungsfeld 30 [30]

Kontakt: [email protected]; http://www.uni-due.de/LLPsychhttp://kompetenzmodelle.dipf.de

Veröffentlichungen:– Klieme, E. & Leutner, D. (2006). Kompetenzmodelle zur Erfassung individueller Lernergebnisse

und zur Bilanzierung von Bildungsprozessen. Beschreibung eines neu eingerichteten Schwerpunktprogramms der DFG. Zeitschrift für Pädagogik, 52, 876-903.

– Leutner, D., Fleischer, J., Spoden, C. & Wirth, J. (2007). Landesweite Lernstandserhebungen zwischen Bildungsmonitoring und Individualdiagnostik. Zeitschrift für Erziehungswissenschaft, Sonderheft 8, 149-167.

– Klieme, E., Leutner, D. & Kenk, M. (2010). Kompetenzmodellierung. Eine aktuelle Zwischenbilanz des DFG-Schwerpunktprogramms (Editorial). Zeitschrift für Pädagogik, Beiheft 56, 9-11. Online unter http://www.pedocs.de/frontdoor.php?source_opus=3342&la=de.


Recommended