methoden vollst ss 14b lmu - Hans...

Post on 04-Aug-2019

216 views 0 download

transcript

1

MethodenNormalverteilungIntelligenzSkalentypenKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

www.hans.strasburger.de

2

VorbemerkungDie Folien enthalten weitgehend vollständig den gesamten GK-Stoff zur Methodik im Rahmen der Medizinischen Psychologie/Medizinischen Soziologie und dienen der Vorbereitungauf das Physikum.

Die Beispiele stammen nicht aus der Methodik, aber aus dem GK.

Korrekturen, Hinweise, Ergänzungen, Fragen gerne an mich schicken:strasburger@uni-muenchen.dewww.hans.strasburger.de

3

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

4

NormalverteilungCarl-Friedrich Gauß

1777-1855

5

Normalverteilung

-3 -2 -1 0 1 2 3

y = ex2

x

MittelwertMittelwertStandardabweichungStandardabweichung

1/1/ee≈≈40%40%34%34%

FlFlääche=Hche=Hääufigkeitufigkeit!!

HHää u

figke

itsuf

igke

its-- D

icht

eD

icht

e=

H=

Hää u

figke

it pr

o x

ufig

keit

pro

x --In

terv

all

Inte

rval

l

1/e1/e²²≈≈14%14%

221xey

0,4

Wendepunkt

6

Statistische Grundbegriffe

n

i nx1

Mittel arithm. 2/Median nx„„Zentrale TendenzZentrale Tendenz““::

Unterschied Grundgesamtheit Unterschied Grundgesamtheit StichprobeStichprobe

VarianzVarianz = mittlere quadratische Abweichung vom Mittelwert:= mittlere quadratische Abweichung vom Mittelwert:

StandardabweichungStandardabweichung = Wurzel aus der Varianz= Wurzel aus der Varianz (( Kennzeichnung)Kennzeichnung)

StandardfehlerStandardfehler = Standardabweichung / Wurzel aus n= Standardabweichung / Wurzel aus n (( Mittelwerte)Mittelwerte)

KonfidenzintervallKonfidenzintervall = 1,96 = 1,96 ×× StandardfehlerStandardfehler

n

i nxxVarianz1

2)(

7

00

1

Normalverteilung: 95%

1.961.96

-3 -2 -1 0 1 2 3

y = ex2

x

HHää u

figke

itsuf

igke

its--

Dic

hte

Dic

hte

221 xey

0,4

Verteilung der Mittelwerte

8

HHää u

figke

itsuf

igke

its--

Dic

hte

Dic

hte

Standardfehler = Standardfehler = std. std. errorerror of of thethe meanmean (SEM)(SEM)

signifikantsignifikantbeibei 1,96 SEM1,96 SEM

n/

Brauchen wir fBrauchen wir füür Unterschied Streuung r Unterschied Streuung StandardfehlerStandardfehler

Grundlage fGrundlage füür r InferenzInferenz--StatistikStatistik

d.h. nicht-zufällig

= statistischbedeutsam

(GK 1.3.8)

9

eduVoteausprobieren

Zu schnell? Zu langsam?

A Zu schnellB Tempo richtigC Zu langsam

00,20,40,60,81

A B C

10

Anwendung der Normalverteilung:

SkalentypenIntelligenzmessung

11

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

12

99,999,997,897,8

..AbwStdMittelwertWertz

13

Multiple-Choice Frage

In einer neurologischen Klinik werden die neuropsychologischen Testergebnisse in Form von Prozentrangwerten aufgezeichnet. Patient A. wurde in einem Gedächnistest zum Aufnahmezeitpunkt ein Prozentrangwert von 25 zugeordnet. Bei der Entlassung wurde ein Prozentrang von PR=50 ermittelt.Bei der Entlassung …

A entspricht die Gedächtnisleistung dem Durchschnitt der ReferenzgruppeB entspricht die Gedächtnisleistung etwa 50% gelöster ItemsC hat sich die Gedächtnisleistung signifikant verbessertD hat sich die Gedächtnisleistung verdoppeltE hat die Gedächtnisleistung um 25% zugenommen.

14

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

15

•Intelligenz ist ein Konstrukt, das die Fähigkeit eines Menschen beschreibt, sich flexibel auf wechselnde Umweltanforderungen undProbleme einzustellen und diese effektiv (d.h. mit minimalem kognitiven Aufwand) zu bewältigen.

•Maß für Intelligenz: Intelligenzquotient IQ

Stern (1912):rLebensalte

zalterIntelligenIQ

Wechsler (1932): Abweichungs-IQ:Intelligenz bezüglich der Altersgruppe normiert (Mittelwert = 100; Standardabw. = 15)

Beispiel:Beispiel: = = 120%120%Leistung eines 12Leistung eines 12--JJäährigenhrigenAlter 10 JahreAlter 10 Jahre

Problem: ?Problem: funktioniert nicht im Erwachsenenalter

Binet (1905): Intelligenzalter

16

IQ im HAWIE / HAWIK

Mittelwert = 100 gesetztMittelwert = 100 gesetzt

Standardabweichung Standardabweichung = 15 gesetzt= 15 gesetzt

55 70 85 100 115 130 1450,0

0,5

1,0

Häuf

igke

itHH

ää ufig

keits

ufig

keits

--D

icht

eD

icht

e

17

heute aktuelle

Intelligenztheorien... bauen alle auf Faktorenanalyse auf ... bauen alle auf Faktorenanalyse auf ……

kommen wir drauf zurkommen wir drauf zurüück.ck.

18

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

19

Korrelation

n

ii nyyxxr1

21))(( PearsonPearson‘‘ss r:r:

In welchem Bereich liegt In welchem Bereich liegt r?r? ––1 1 r r +1+1

r r ≈≈ 11 r r ≈≈ 0,50,5 r r ≈≈ 00 r r ≈≈ –– 0,50,5

(r(r²² = erkl= erkläärte Varianz in %, anschauliches Marte Varianz in %, anschauliches Maßß))

Steigung sagt nix aus, nur wieweit Punkte von der Geraden weg liSteigung sagt nix aus, nur wieweit Punkte von der Geraden weg liegenegen

r r ≈≈ –– 11

20

Beispiele zum Determinationskoeffizient r²

Kurzsichtigkeit korreliert mit IntelligenzKurzsichtigkeit korreliert mit Intelligenz

Abitursnote korreliert mit Abitursnote korreliert mit Erfolg im MedizinstudiumErfolg im Medizinstudium

r=0,1r=0,1

r=0,4r=0,4

rr²²=1%=1%

rr²²=16%=16%

r² ist die erklärte Varianz … anschauliches Maß, Beispiel für ein

Maß der Effektstärke und inhaltlichen Bedeutsamkeit (GK 1.3.7)

unerklunerkläärterte VarianzVarianz: 1: 1––rr²²=84%=84%

(r lässt sich aber auch direkt interpretieren: Als Reduktion des Klassifikationsfehlers. Z.B.: Klassifikation zugelassen/abgelehnt hat Zufallsfehler von 50%.r=0,4 reduziert ihn um 40% (von 50%) auf 30%)

21

Korrelation

22

Beispiel: Yerkes-Dodson-Gesetz

Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau

Was steht an den Achsen?

Yerkes & Dodson (1908)

23

Beispiel: Yerkes-Dodson-Gesetz (1908)

Yerkes & Dodson (1908)

Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau

ARASARAS

kogn

itive

kogn

itive

Leis

tung

Leis

tung

oder Stresslevel

24

Beispiel: Yerkes-Dodson-Gesetz

Yerkes & Dodson (1908), aus Zimbardo et al. 2004

Die Beziehung zwischen der Leistung bei einer Aufgabe und dem optimalen Erregungsniveau

25

Korrelation,Beispiel

normalerweise normalerweise nichtnichtdurch Ursprungdurch Ursprung!! x

y

±±Std.AbwStd.Abw

26

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientFaktorenKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

27

Regression (von x auf y)rote Linie: erklärte Varianz

gepunktete Abweichungen von roter Linie: Restvarianz

Gesamt-varianz

Restvarianz

28

Faktorenanalyse

Faktor 1 erklFaktor 1 erkläärt rt viel Varianzviel Varianz

Faktor 2Faktor 2

Die Faktorenanalyse ist ein mathematischDie Faktorenanalyse ist ein mathematisch--statistisches statistisches Verfahren, um auf der Basis der Korrelationsstruktur neue, Verfahren, um auf der Basis der Korrelationsstruktur neue, erklerkläärende Variablen (Faktoren) zu findenrende Variablen (Faktoren) zu finden

Gesamtvarianz = erklGesamtvarianz = erkläärte + unerklrte + unerkläärte Varianzrte Varianz

29

heute aktuelle

Intelligenztheorien

SpearmanSpearman (1904)(1904): Generalfaktortheorie : Generalfaktortheorie (g)(g)(HAWIE hat 11 Untertests)(HAWIE hat 11 Untertests)

ThurstoneThurstone (1931)(1931): 7: 7--Faktorentheorie Faktorentheorie Sprachverständnis, Wortflüssigkeit, Rechengewandtheit, räumliches Denken, Auffassungsgeschwindigkeit, Merkfähigkeit, schlussfolgerndes Denken

CattellCattell (1963)(1963): : kristalline/fluidekristalline/fluide IntelligenzIntelligenz

GuilfordGuilford (1956)(1956): Intelligenzstrukturmodell: Intelligenzstrukturmodell

... bauen alle auf Faktorenanalyse auf... bauen alle auf Faktorenanalyse auf

30

Einige verbale Intelligenzdefinitionen (aus Rost 2009)

▶▶ Allgemeine FAllgemeine Fäähigkeit eines Individuums, sein Denken bewusst auf neue higkeit eines Individuums, sein Denken bewusst auf neue ForFor--derungenderungen einzustellen; sie ist die allgemeine geistige Anpassungsfeinzustellen; sie ist die allgemeine geistige Anpassungsfäähigkeit an neue higkeit an neue Aufgaben und Bedingungen des Lebens bzw. FAufgaben und Bedingungen des Lebens bzw. Fäähigkeit, sich unter zweckmhigkeit, sich unter zweckmäßäßiger iger VerfVerfüügung gung üüber Denkmittel auf neue Forderungen einzustellen (W. Stern, 1912ber Denkmittel auf neue Forderungen einzustellen (W. Stern, 1912).).

▶▶ Was ein Intelligenztest misst (Boring, 1923).Was ein Intelligenztest misst (Boring, 1923).

▶▶ Zusammengefasste oder globale KapazitZusammengefasste oder globale Kapazitäät des Individuums, zweckvoll zu t des Individuums, zweckvoll zu handeln, rational zu denken und sich effektiv mit seiner Umwelt handeln, rational zu denken und sich effektiv mit seiner Umwelt auseinanderzuauseinanderzu--setzensetzen (Wechsler, 1944).(Wechsler, 1944).

▶▶ Sehr allgemeines geistiges Potential, das u. a. die FSehr allgemeines geistiges Potential, das u. a. die Fäähigkeit zum higkeit zum schlussfolschlussfol--gerndengernden Denken, zum Planen, zur ProblemlDenken, zum Planen, zur Problemlöösung, zum abstrakten Denken, zum sung, zum abstrakten Denken, zum VerstVerstäändnis komplexer Ideen, zum schnellen Lernen und zum Lernen aus Endnis komplexer Ideen, zum schnellen Lernen und zum Lernen aus Erfahrung rfahrung umfasst. Es ist nicht reines Bumfasst. Es ist nicht reines Büücherwissen, cherwissen, keinekeine enge akademische enge akademische SpezialSpezial--begabungbegabung, keine , keine TesterfahrungTesterfahrung. Vielmehr reflektiert Intelligenz ein breites und . Vielmehr reflektiert Intelligenz ein breites und tieferes Vermtieferes Vermöögen, unsere Umwelt zu verstehen, gen, unsere Umwelt zu verstehen, „„zu kapierenzu kapieren““, , „„Sinn in Dingen zu Sinn in Dingen zu erkennenerkennen““ oder oder „„herauszubekommen, was zu tun istherauszubekommen, was zu tun ist““. (. („„ErklErkläärung zur rung zur MehrheitsMehrheits--meinungmeinung““ von 52 fvon 52 füührenden Intelligenzforschern, 1994)hrenden Intelligenzforschern, 1994)

31

Anderes Beispiel für Faktoren:

Big Five

aus der Persönlichkeitstheorie:

Verträglichkeit

Offenheit für Erfahrungen

Gewissenhaftigkeit

Extraversion

Labilität/Stabilität = Neurotizismus

32

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientFaktorenKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

33

Beispiele zu Korrelation / Kausalität

•• In Taiwan korreliert der Gebrauch von In Taiwan korreliert der Gebrauch von VerhVerhüütungsmitteln positiv mit der Zahl elektrischer tungsmitteln positiv mit der Zahl elektrischer HaushaltsgerHaushaltsgeräätete

•• Die AuftretenshDie Auftretenshääufigkeit von Stufigkeit von Stöörchen korreliert rchen korreliert positiv mit der Zahl der Geburtenpositiv mit der Zahl der Geburten

•• Die von Schulkindern vor dem Fernseher verbrachte Die von Schulkindern vor dem Fernseher verbrachte Zeit korreliert negativ mit den Leistungen in Lesen Zeit korreliert negativ mit den Leistungen in Lesen und Mathematikund Mathematik

•• Kurzsichtigkeit korreliert mit IntelligenzKurzsichtigkeit korreliert mit Intelligenz

34

Vermittelnde Variablen

•• intervenierende Variableintervenierende Variable

•• StStöörvariablervariable

•• konfundierendekonfundierende VariableVariable

•• MediatorvariableMediatorvariable

•• ModeratorvariableModeratorvariable

Baron & Kenny (1986)“…we differentiate between two often-confused functions of third variables: (a) the moderator function of third variables, which partitions a focal independent variable into subgroups that establish its domains of maximal effectiveness in regard to a given dependent variable, and (b) the mediator function of a third variable, which represents the generative mechanism through which the focal independent variable is able to influence the dependent variable of interest.”

35

Mediator- vs. Moderatorvariable(a) the moderator function of third variables, which partitions a focal independent variable into subgroups that establish its domains of maximal effectiveness in regard to a given dependent variable …

… die Moderatorfunktion von dritten Variablen, die eine unabhängige Variable in Untergruppen aufteilt, die ihrerseits größtmögliche Wirkung auf die abhängige Variable haben.

zur ModeratorvariablenFarbe = Moderatorvariable

R2 = 0

00.5

11.5

22.5

33.5

4

0 2 4 6 8 10

X

Y

Gruppe A

Gruppe B

beide

Linear (

36

Mediator- vs. Moderatorvariable(b) the mediator function of a third variable, which represents the generative mechanism through which the focal independent variable is able to influence the dependent variable of interest.”

Y ist die Mediator-Variable zwischen

X und Z

y = 0.481x + 0.4582R2 = 0.9488

0

2

4

6

8

10

0 2 4 6 8 10

X

Y

y = -2x + 10R2 = 1

0

1

2

3

4

5

6

7

8

9

0 2 4 6 8 10

Y

Z

y = -0.9619x + 9.0836R2 = 0.9488

0

1

2

3

4

5

6

7

8

9

0 2 4 6 8 10

X

Z

rxy ryz = rxz

Die Unterscheidung von M. & M. ist aber oft nicht klar

37

Kausalität und Korrelation

KausalzusammenhangKausalzusammenhang

korrelativerkorrelativer ZusammenhangZusammenhang

Schluss Schluss immer immer

mmööglichglich

Schluss nur Schluss nur durch durch ExperimentExperiment

38

Kausalität kann nur im Experiment nachgewiesen werden, nicht in anderen Studendesigns. Deshalb jetzt einiges zum Thema

Experiment und Studiendesigns

39

Experiment

• Kriterien (Wilhelm Wundt):– Willkürlichkeit: Jederzeit auslösbar– Variierbarkeit: Vorhandensein von unabhängigen

Variablen– Wiederholbarkeit: Wiederholung unter gleicher

Bedingung --> vergleichbare Resultat

• Prüft Ursache-Folge-Beziehung (Kausalzusammenhang)

• Nachteil: Künstliche Bedingungen (alltagsfern)

40

Andere Studiendesigns

• Korrelative Studie • Felduntersuchung

(im „normalen Leben“); Unkontrollierbarkeit der unabhängigen Variablen, Störvariablen

• Längsschnittstudie:mehrmalige Untersuchung einer Person in bestimmten Abständen

• Querschnittsstudie:Untersuchung zu einem Zeitpunkt mit Personen verschiedener Altersgruppe

41

Andere Studiendesigns

• Kohortenstudie (Kohorte = bestimmtes biographisches Ereignis ~ zum selben Zeitpunkt, z.B. Geburtskohorte)

• Fall-Kontroll-Studie (retrospektive Untersuchung einer Gruppe Erkrankter (=Fälle), mit parallelisierter Stichprobe Gesunder)(d.h. der Krankheitsstatus ist bekannt und die Exposition unbekannt.)

• Einzelfallstudie• Evaluationsstudie

42

Andere Studiendesigns

• Blindstudie: Vpn nicht aufgeklärt• Doppelblindstudie: Vpn und Versuchsleiter nicht

aufgeklärt (Ziel ist Vermeidung des Rosenthal-Effekts)

43

Beobachtungs- und Beurteilungsfehler

Es sind 11Es sind 11

RosenthaleffektSelbst-erfüllende ProphezeiungHaloeffektLogischer FehlerKontrastfehlerStrenge-/MildefehlerProjektionHawthorne-EffektJa-Sage-TendenzSoziale ErwünschtheitSuggestionTendenz zur Mitte

44

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

45

Begriff stammt aus der Messtheorie; hat nichts mit der GBegriff stammt aus der Messtheorie; hat nichts mit der Güüte einer te einer Skala zu tun, sondern damit, welche Rechenoperationen Skala zu tun, sondern damit, welche Rechenoperationen „„erlaubterlaubt““–– d.h. d.h. sinnvollsinnvoll sind.sind.

Messen = Zuordnung von Messen = Zuordnung von a) Zahlen zu Merkmalen unda) Zahlen zu Merkmalen undb) b) RelationenRelationen zwischen Zahlen zu zwischen Zahlen zu RelationenRelationen zwischen Merkmalen.zwischen Merkmalen.

Zuordnung muss eineindeutig sein (Zuordnung muss eineindeutig sein („„1 zu 11 zu 1““))

Relationen mRelationen müüssen im Merkmalsbereich gelten.ssen im Merkmalsbereich gelten.

BeipielBeipiel: Bei einer Ordinalskala gilt die : Bei einer Ordinalskala gilt die OrdnungsrelationOrdnungsrelation im im Zahlenbereich und MerkmalsbereichZahlenbereich und Merkmalsbereich::wenn wenn a<ba<b und und b<cb<c, dann , dann a<ca<c ((„„ZahlenraupeZahlenraupe““))

Beispiel Hausnummern: Ordnungsrelation gilt im Merkmalsbereich Beispiel Hausnummern: Ordnungsrelation gilt im Merkmalsbereich nicht.nicht.

Skalenniveaus

46

•• NominalskalaNominalskala

•• OrdinalskalaOrdinalskala

•• IntervallskalaIntervallskala

•• VerhVerhäältnisskalaltnisskala

••

Eigentlich keine SkalaEigentlich keine SkalaBsp.: Bsp.: mmäännl./weiblnnl./weibl..

••

Ordnung Ordnung angebbarangebbarBsp.: Schulnoten, Rangfolge Marathon, Bsp.: Schulnoten, Rangfolge Marathon, LikertLikert--SkalenSkalen

••

Definierte Intervalle. Z.B. 6 Definierte Intervalle. Z.B. 6 –– 4 = 3 4 = 3 –– 11Bsp.: Celsius, IQBsp.: Celsius, IQ

••

Definierte VerhDefinierte Verhäältnisse. Z.B. 6/3 = 4/2ltnisse. Z.B. 6/3 = 4/2Es gibt einen sinnvollenEs gibt einen sinnvollen absoluten Nullpunkt absoluten Nullpunkt undund ProportionalitProportionalitäät t zw. Mazw. Maßß und und GemessenemGemessenemBsp.: Temperatur in Kelvin, LBsp.: Temperatur in Kelvin, Läänge, Blutdruck?nge, Blutdruck?

Skalenniveaus

47

Skalenniveaus

Nominal-skala

Ordinal-skala

Intervall-skala

Verhältnis-skala

definierte Relationen

= zusätzlich

zusätzlich+ –

zusätzlich* /

zuläss. Transfor-mationen

jede eindeutige nurjede monotone

nurx bx + a

nurx bx

Interpre-tationen

gleich / ungleich kleiner / größer

Differenzen haben Sinn

Brüche haben Sinn

Beispiele HausnummernModalwert

WindstärkeMedian

IQarithm.Mittel

Körpergrößearithm.+geom.

Mittel

48

Beispiel: Fechnerskala

Fechner (1860) postulierte, dass der Zuwachs der Fechner (1860) postulierte, dass der Zuwachs der EmpfindungsstEmpfindungsstäärke der (von Weber gefundenen) rke der (von Weber gefundenen) Unterschiedsschwelle entspricht.Unterschiedsschwelle entspricht.

Daraus ergibt sich ein logarithmischer Daraus ergibt sich ein logarithmischer Zusammenhang, die sogenannte FechnerZusammenhang, die sogenannte Fechner--SkalaSkala

Sie wird heute z.B. zur LautstSie wird heute z.B. zur Lautstäärkemessung in dB rkemessung in dB benutzt.benutzt.

49

0

2

4

6(S

ubje

ktiv

e W

ert e

)Em

pfin

dun g

sstä

rke

E

0 10 20 30 40 50 60Just noticeable differences (JND)

(physikalische Werte)

Fechner Skala

S / S = const.

S

( = Weber'sches Gesetz)

S

S

S

S

S

E = log S

Beispiel: Fechnerskala (z. B. Lautstärke)

50

Beispiel: Lautstärke

Schalldruck in dB: logarithmisch.Schalldruck in dB: logarithmisch.Phon: zusPhon: zusäätzlich mit Htzlich mit Höörkurven gewichtetrkurven gewichtet

51

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

52

Gerechtigkeit

Wie beurteilt man einen Test?

53

Testgütekriterien

Wie heißen die drei wichtigsten Testgütekriterien?

Objektivität

Reliabilität

Validität

Unabhängigkeit vom Untersucher

Gültigkeit

Zuverlässigkeit (egal was man misst)

54

Testgütekriterien, Definition

Objektivität bezeichnet die Unabhängigkeit des Messergebnisses vom Untersucher. Man unterscheidet Durchführungs-, Auswertungs- und Interpretationsobjektivität.

Reliabilität bezeichnet die Zuverlässigkeit einer Messung. Man kennt z.B. Re-Test-, Parallel-Test- und Split-half-Reliabilität.

Validität bezeichnet die Gültigkeit eines Messverfahrens:Misst der Test das, was er vorgibt zu messen?

Man unterscheidet z.B. Inhalts-, Kriteriums-, Vorhersage- undKonstruktvalidität (faktorielle, konvergente, diskriminante Val.).

55

Wie gut können die Gütekriterien sein?

Validität Reliabilität Objektivität

Entscheidend ist die Validität!

ValiditätReliabilität

Objektivität

Korrelationskoeffizient0 1

56

Wie gut können die Gütekriterien sein?

Verbessern der Objektivität und Reliabilität verbessert nicht die Validität.

ValiditätReliabilität

Objektivität

(Korrelationskoeffizient)0 1

ValiditätReliabilität

Objektivität

(Korrelationskoeffizient)0 1

vorhervorher

nachher?nachher?

57

MC-Frage

Das Testgütekriterium Reliabilität beschreibt• (A) das Ausmaß, in dem ein Test das erfasst, was er auch

tatsächlich messen soll. • (B) Den Grad der Genauigkeit, mit dem ein Test ein

Merkmal misst.• (C) Die Übereinstimmung der Testergebnisse mit einem

Außenkriterium• (D) Die Unabhängigkeit der Testbogenergebnisse vom

Untersucher• (E) Ob ein Test in angemessener Zeit durchzuführen ist.

58

Noch zwei TestgütekriterienSensitivität: Spricht der Test an, wenn die Krankheit vorliegt?

Spezifität: Spricht der Test nicht an, wenn die Krankheit nicht vorliegt?

Typische Denkfehler:

• Bei positivem Aids-Test und Testsensitivität von 98% habe ich mit 98% Wahrscheinlichkeit Aids (P).

(Man muss Sensitivität, Spezifität, und Prävalenz kennen!)

)Spezifität–(1 Prävalenz)–(1 ät SensitivitPrävalenztät Sensitivi Prävalenz

wertVorhersagePos

.

59

BeispielPrävalenz: 1%, Sensitivität 92%, Spezifität 93%

Ich gehe zum Arzt … Der Test fällt positiv aus …

10.000 Personen

100Glaukom

9.900normal

8 normal(falsch negativ)

92 Glaukom(richtig positiv)

9207 normal(richtig negativ)

693 Glaukom(falsch positiv)

92+693 werden als Glaukom diagnostiziert (grün), 92 davon haben es wirklich= 92 / (92+693) = 11,7%

= positiver prädiktiver Wert = Relevanz (= Wirksamkeit = Genauigkeit)

Die Wahrscheinlichkeit, wirklich Glaukom zu haben, beträgt nur ~12%

tatsächlich:

Dia-gnose:

Sensi- Spezi-

Positiver & Negativer Vorhersagewert (Wikipedia)

Sensitivität(grün/links) und

Falsch-Negativ-Rate (rot/links)

Ein Test soll kranke und gesunde Menschen voneinander unterscheiden. Jeder Mensch wird durch einen Punkt dargestellt, der links (krank) bzw. rechts (gesund) von der schwarzen Linie liegt. Die Punkte im Oval sind die von dem Test als krank klassifizierten Menschen. Die Farben entsprechen den vier Fällen, die bei dieser Klassifikation auftreten können.positiver Vorhersagewert = Relevanz = Wirksamkeit = Genauigkeitnegativer Vorhersagewert = Segreganz = Trennfähigkeit = NPVKlassifikationsfehler = Falschklassifikationsrate = (falschpos+falschneg) / alleVertrauenswahrscheinlichkeit = Korrektklassifikationsrate = (richtigpos+richtigneg) / alle

Spezifität(grün/rechts) und Falsch-Positiv-Rate

(rot/rechts)

PositiverVorhersagewert

(grün/(grün+rot))

NegativerVorhersagewert (grün/grün+rot)

krank

gesund

krank krank krank

gesund gesund gesund

61

Beispiel: Sensitivitäten & Spezifitäten von Glaukomtests

62

BeispielPrävalenz: 1%, Sensitivität 85%, Spezifität 90%

Ich gehe zum Arzt … Der Test fällt negativ aus …

10.000 Personen

100Glaukom

9.900normal

15 normal(falsch negativ)

85 Glaukom(richtig positiv)

8910 normal(richtig negativ)

990 Glaukom(falsch positiv)

15+8910 werden als gesund diagnostiziert (rot), 8910 davon sind es wirklich= 8910 / (15+8910) = 99,8%

= negativer prädiktiver Wert

Die Wahrscheinlichkeit, doch krank zu sein, beträgt nur 0,2%

tatsächlich:

Dia-gnose:

Sensi- Spezi-

63

Beispiel: Abhängigkeit von der Prävalenz

S: Symptom K: Krankheit

Beispiel 1 Beispiel 2

Prävalenz: p(K) % der Erkrankten 0,1% 1%

Positiver Vorhersagewert

p(K|S) % krank bei pos. Test

16,4% 66%

Negativer Vorhersagewert

p(¬K|¬S)

% nicht krank bei neg. Test

99,998% 99,98%

Sensitivität p(S|K) % pos. Test bei Krankheit

98% dto.

Spezifität p(¬S|¬K)

% neg. Test bei Gesundheit

99,5% dto.

PrPräävalenzvalenz Aids (Deutschland 2006): 0,7Aids (Deutschland 2006): 0,7‰‰, Sensitiv. ELISA 99,9%, , Sensitiv. ELISA 99,9%, SpezifSpezif. 99,8%. 99,8%

64

(andere Darstellung:) VierfeldertafelWirklichkeit

krank (=pos) gesund (=neg) Summen

lautTest

krank (=pos)

richtig pos.A

Sensitivität= A/(A+C)

falsch pos.B

A+BPos.

Prädiktionswert

A/(A+B)

gesund (=neg)

falsch neg.C

richtig neg.D

Spezifität= D/(B+D)

C+DNeg.

Prädiktionswert

D/(C+D)

Summen A+C B+D 100%

65

Welchen Test wählen?

Hohe SensitivitHohe Sensitivitäät = t = ScreeningScreening TestTest

(niemand (niemand üübersehen)bersehen)

Hohe Hohe SpezifitSpezifitäätt ==

Sicherheit gegen Sicherheit gegen falschfalsch--positive positive DiagnoseDiagnose

krank gesund

Sensitivität 80% Spezifität 80%

Sensitivität 90%

Sensitivität 60%

Spezifität 60%

Spezifität 90%

KriteriumKriterium

66

Alpha- und Beta-Fehler(Inferenzstatistik, GK 1.3.7

NullhypotheseNullhypothese

kein Effektkein Effekt

AlternativAlternativ--HypotheseHypothese

Effekt vorhandenEffekt vorhanden

-Fehler

-Fehler = falsche Annahme der Alternativhypothese-Fehler = falsche Annahme der Nullhypothese

-FehlerMesswert

Häu

figke

itsdi

chte

„Wahrheit“

67

Effektstärke und Teststärke (Power)(Inferenzstatistik, GK 1.3.7

ohne ohne BehandlungBehandlung

Effektstärke = meist Cohen‘s d = Abstand / StdAbwPower = 1– = richtige Annahme der Alternativhypothese

mitmitBehandlungBehandlung

1–

=Power

d StdAbw

68

Welche Aussage zur Effektstärke als Maß für einen Treatmenteffekt trifft am ehesten zu?

(A) Mit steigender Effektstärke steigt auch die Number needed to treat. (B) Mit zunehmender Effektstärke sinkt die Testpower. (C) Mit zunehmendem Signifikanzniveau sinkt die Effektstärke. (D) Mit zunehmender Stichprobengröße steigt die Effektstärke. (E) Mit zunehmender Streuung verringert sich die Effektstärke.

aus Physikum SoSe 2013:

69

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

70

Epidemiologische BegriffePrävalenz = Krankheitshäufigkeit in der Population

Inzidenz = Anzahl der Neuerkrankungen in der Population… wird gemessen durch die

Inzidenzrate = die Anzahl der Neuerkrankungen (Inzidenz) in einer Zeitspanne (z.B. 1 Jahr) dividiert durch Individuenzahl (z.B. 100.000):

Inzidenzrate = Inzidenz / Individuenzahl (pro Jahr)

= (Absolutes) Risiko (= Erkrankungsrisiko in einer bestimmten Population).

(Inzidenzrate und Risiko ist oft dasselbe)

Relatives Risiko = Risiko (exponiert) / Risiko (nicht exponiert)(gibt an um welchen Faktor sich ein Risiko in zwei Gruppen unterscheidet, z.B. alt vs. jung.)

Attributables Risiko = Risiko (exponiert) – Risiko (nicht exponiert).(gibt an, um welchen Prozentsatz man eine Krankheitshäufigkeit senken kann, würde man den Risikofaktor ausschalten)

71

RE = Risiko_exponiert = a / (a+c) (meist %)

RNE = Risiko_nicht_exponiert = b / (b+d) (meist %)

Attributables Risiko: (meist %)

Relatives Risiko:

nochmal mit Vierfeldertafel

exponiert nicht exponiertAnzahl erkrankt a b

Anzahl nicht erkrankt c d

Summe Anzahl a+c b+d

dbb

caaRNEREAR

cadb

ba

dbb

caaRNERERR

//

72

RE = Risiko_exponiert = a / (a+c) (meist %)

RNE = Risiko_nicht_exponiert = b / (b+d) (meist %)

Attributables Risiko: (meist %)

R1 = Risiko_1 = a / (a+c) (meist %)

R2 = Risiko_2 = b / (b+d) (meist %)

Risiko-Unterschied: (meist %)

NNT = 1/ Risiko-Unterschied:weil R × NNT ≥ 1 Person

aus dem attributablen Risiko kann man dieNumber needed to treat (NNT) bestimmen:

exponiert nicht exponiertAnzahl erkrankt a b

Anzahl nicht erkrankt c d

Summe Anzahl a+c b+d

NNT = Anzahl der Patienten, die behandelt werden müssen, um bei einer einzigen Person einen negativen Ausgang zu vermeiden.Misst Effektgröße einer Behandlung

Methode 2Methode 1

Ziel erreicht

Ziel nicht erreicht

dbb

caaRRR

NNT

1

2111db

bca

aRNEREAR

db

bca

aRRR

21

Risiko-Reduktion

https://www.youtube.com/watch?v=eHxaDQNyfV4

NNT

dbb

caaRRRARR

NNT

1

21111

weil mindestens eine Person weniger betroffen sein muss, (halbe Personen gibt es nicht)Risiko-Reduktion mal Zahl der Behandelten = 1 PersonalsoARR × NNT ≥ 1

NNT anschaulich. RRR irreführend

74

Vierfeldertafel bei Fall-Kontrollstudie:exponiert nicht exponiert Summe

Anzahl erkrankt a b 1

Anzahl Kontrollen c d 1

Odds = Chance = Quote= Wahrscheinlichkeit/Gegenwahrscheinlichkeit

)(1)(AP

AP

Odds Ratio = Chancenverhältnis= bcad

dcba

OR

Odds

Beispiel: Rauchen erhöht Erkrankungsquote auf das x-facheUnterschied zu relativem Risiko: Bezieht sich auf Quoten, nicht WahrscheinlichkeitenAnwendung: Fall-Kontroll-Studien, Querschnitt-, InterventionsstudienVorteil: Leichteres RechnenTutorial auf dem Internet: http://gim.unmc.edu/dxtests/

75

Methoden

NormalverteilungSkalentypenIntelligenzKorrelationskoeffizientKausalitätSkalenniveausTestgütekriterienEpidemiologische BegriffeStatistische Grundbegriffe

76

Statistische Grundbegriffe

n

i nx1

Mittel arithm. 2/Median nx„„Zentrale TendenzZentrale Tendenz““::

Unterschied Grundgesamtheit Unterschied Grundgesamtheit StichprobeStichprobe

VarianzVarianz = mittlere quadratische Abweichung vom Mittelwert:= mittlere quadratische Abweichung vom Mittelwert:

StandardabweichungStandardabweichung = Wurzel aus der Varianz= Wurzel aus der Varianz (( Kennzeichnung)Kennzeichnung)

StandardfehlerStandardfehler = Standardabweichung / Wurzel aus n= Standardabweichung / Wurzel aus n (( Mittelwerte)Mittelwerte)

KonfidenzintervallKonfidenzintervall = 1,96 = 1,96 ×× StandardfehlerStandardfehler

n

i nxxVarianz1

2)(

77

Grundgesamtheit:

Alle Medizinstudisim 4. FSn=250

Stichprobe:Kurs

n=23

Wichtigste Stichprobenarten:

randomisierte St. = Zufalls-St.

Quoten-St. = Quote der GG

78

Beispiele zu den Grundbegriffen

Mittelwert 23,5Mittelwert 23,5Median 13Median 13

Median Median anwenden beianwenden bei OrdinalskalenniveauOrdinalskalenniveau

79

Beispiele zu den Grundbegriffen3 m3 möögliche Fehlerbalken:gliche Fehlerbalken:

Beurteilung der/des Beurteilung der/des ……StreuungStreuung

derder MittelwerteMittelwerteVertrauensVertrauens

in in MittelwerteMittelwerteStreuungStreuungderder WerteWerte

80

WHO (Fünf) Fragebogenzum Wohlbefinden nach dem Methodenrepetitorium

Nach der Methodenvorlesung ... (in den letzten zwei Wochen)1 = nie5 = die ganze Zeit

... war ich froh und guter Laune

… habe ich mich ruhig und entspannt gefühlt

... habe ich mich energisch und aktiv gefühlt

... bin ich aufgewacht und habe mich frisch und ausgeruht gefühlt

... war mein Abend voller Dinge die mich interessierten

AuffAuffäällig, wenn Summe < 13 Punkten (d.h.<50%)llig, wenn Summe < 13 Punkten (d.h.<50%) Summe

••ValiditValiditäät: Korrelation mit Beck Depressionsinventar sehr gut. t: Korrelation mit Beck Depressionsinventar sehr gut. ••SensitivitSensitivitäät: ~ 93%t: ~ 93%

81

Schönen Tag noch ...