Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ Institut für Medizinische Informatik und Statistik Medizinische Fakultät der Christian-Albrechts-Universität Kiel Universitäts-Klinikum Schleswig-Holstein Campus Kiel Brunswiker Straße 10 24105 Kiel
Bemerkung: Die vorliegende Aufgabensammlung bildet die Grundlage der Übungen zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“. Bei den Übungen handelt es sich um eine Pflichtveranstaltung, die den Zweck hat, die in der begleitenden (wahlfreien) Vorlesung vermittelten Lehrinhalte zu vertiefen und die Studierenden auf das anschließend stattfindende Literaturseminar im Q1 vorzubereiten. Ungeachtet der nicht gegebenen Anwesenheitspflicht wird allen Studierenden im Q1 der regelmäßige Besuch der Vorlesung dringend empfohlen. Um einen möglichst nachhaltigen Lernerfolg zu erzielen, sollten zudem alle Aufgaben von allen Studierenden jeweils vor der entsprechenden Übungsstunde selbstständig bearbeitet werden. Die Lösungen werden während der Übung durch einzelne Studierende vorgestellt und von den Übungsleitern gegebenenfalls näher erläutert. Die Aufgabenstellung orientiert sich am Inhalt der Vorlesung, in der auch das zur Lösung benötigte Wissen vermittelt wird.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 2
Übung 1 (Deskriptive Statistik) 1. (Lage- und Streuungsmaße, Box-Whisker-Plot) a:1 b:1 c:1 d:1 Im Zuge einer bevölkerungsmedizinischen Untersuchung wurde der Body-Mass-Index (BMI) von 100 zufällig ausgewählten Männern im Alter von 18 bis 65 Jahren ermittelt. Die Ergebnisse der Messungen sind in der folgenden Tabelle der Größe nach sortiert aufgeführt.
BMI (kg/m2) von 100 zufällig ausgewählten Männern (18-65 Jahre)
21.68 21.89 22.02 22.07 22.11 22.14 22.17 22.20 22.41 22.55
22.57 22.58 22.83 22.95 23.01 23.10 23.13 23.14 23.18 23.18
23.52 23.53 23.58 23.60 23.62 23.64 23.67 23.84 23.96 24.05
24.07 24.10 24.14 24.22 24.23 24.24 24.24 24.39 24.45 24.49
24.50 24.54 24.55 24.62 24.68 24.71 25.08 25.29 25.38 25.45
25.45 25.56 25.62 25.67 25.72 25.80 25.80 25.91 25.98 26.11
26.14 26.15 26.31 26.38 26.44 26.51 26.55 26.80 27.12 27.17
27.24 27.48 27.85 28.02 28.04 28.44 28.65 29.05 29.37 29.56
29.64 30.56 30.84 30.85 31.19 31.24 31.90 33.00 33.12 33.83
34.00 34.09 34.16 35.49 36.32 37.57 38.46 38.87 40.56 41.38
Aus den 100 Probanden wurden nach dem Zufallsprinzip 15 Kandidaten für eine eingebettete Interventionsstudie ausgewählt. Die BMI-Werte dieser Probanden sind in der Tabelle markiert.
a. Ermitteln Sie für die Teilstichprobe den Mittelwert und die Standardabweichung des BMI.
b. Ermitteln Sie für die Teilstichprobe den Median und die Quartile sowie den Interquartilabstand des BMI.
c. Ermitteln Sie den Median und die Quartile des BMI für die gesamte Stichprobe.
d. Skizzieren Sie für die gesamte Stichprobe den Box-Whisker-Plot.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 3
Übung 2 (Wahrscheinlichkeitstheorie) 1. (diskrete Zufallsvariable, Wahrscheinlichkeitsfunktion, Erwartungswert) a:1 b:1 Etwa 8% der deutschen Bevölkerung sind so genannte „Non-Responder“ für die Hepatitis-B Schutzimpfung, d.h. bei ihnen führt auch die übliche dreistufige Impfung (nach 0, 1 und 6 Monaten) nicht zu einer Immunisierung.
a. Berechnen Sie alle möglichen Werte der Wahrscheinlichkeitsfunktion der Zufallsvariablen „Anzahl der Non-Responder unter 6 geimpften Personen“ (kurz:„X). Berechnen Sie den Erwartungswert der Zufallsvariablen X.
b. Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen höchstens ein
Non-Responder? Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen mindestens ein Non-Responder?
2. (stetige Zufallsvariable, Dichtefunktion, Normalverteilung) a:1 b:1 c:1 Die Körpergröße Kieler Studentinnen ist normalverteilt mit einem Erwartungswert von 168 cm und einer Varianz von 36 cm2.
a. Skizzieren Sie die Dichtefunktion der Zufallsvariablen „Körpergröße einer Kieler Studentin“ (kurz: Y). Interpretieren Sie anhand der Skizze den Erwartungswert und die Varianz von Y.
b. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin höchstens
174 cm groß? Hinweis: Verwenden Sie zur Lösung die Transformation der Zufallsvariablen Y in eine Zufallsvariable Z mit Standard-Normalverteilung; die Quantile der N(0,1)-Verteilung finden Sie in Tabelle A.1.
c. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin zwischen
171 cm und 178.5 cm groß?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 4
Übung 3 (Parameterschätzung) 1. (Binomial-Verteilung, Maximum-Likelihood-Schätzung) a:1 b:1
Von den 100 Personen einer Population sind 10 Personen erkrankt. In drei Zufallsstichproben aus dieser Population (A, B, C) befanden sich 2, 3 bzw. 4 Erkrankte.
a. Welcher Parameter kann aus diesen Stichproben sinnvollerweise geschätzt werden? Welche Voraussetzung muss dafür erfüllt sein?
b. Welche Schätzfunktion sollte für die unter a. genannte Schätzung verwendet werden
und warum? Schätzen Sie den unter a. genannten Parameter aus jeder der drei Stichproben und vergleichen Sie die Ergebnisse.
2. (Normalverteilung, Punktschätzung, Konfidenzintervall) a:1 b:1 c:1 Im Rahmen einer sportmedizinischen Studie wurde bei 100 Kieler Studentinnen deren Körpergröße gemessen. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst.
Körpergröße (cm) von 100 Kieler Studentinnen
174.5 177.2 169.5 170.4 163.9 171.7 186.4 176.1 171.9 174.4
170.2 169.1 170.9 171.3 172.5 174.6 178.1 180.6 165.7 169.7
173.1 174.0 175.8 170.9 167.6 169.0 164.2 166.9 175.4 182.1
172.5 167.3 178.7 169.7 176.5 168.8 170.1 164.9 167.4 175.9
170.4 166.5 168.1 169.5 168.5 168.7 177.9 170.4 176.2 181.0
169.1 173.9 159.7 171.4 166.7 166.9 173.8 167.5 167.6 177.4
168.5 173.7 171.9 175.6 171.7 174.4 169.5 162.4 169.8 173.7
169.4 166.6 172.7 167.4 171.2 180.4 178.2 163.2 169.8 166.5
169.1 177.4 166.1 165.0 171.2 169.5 177.9 168.2 168.3 174.8
180.5 182.4 169.1 174.3 173.3 172.5 169.6 170.9 175.5 178.0
a. Mit welchen Schätzfunktionen sollten Erwartungswert und Standardabweichung der (normalverteilten) Körpergröße der Kieler Studentinnen geschätzt werden und warum? Schätzen Sie beide Parameter aus der Stichprobe.
Hinweis: 2950720x ;9.17170x ;xnx)xx(n
1i
2i
n
1i i2n
1i
2i
n
1i
2i
b. Geben Sie ein 95%- und ein 99%-Konfidenzintervall für den Erwartungswert an. Hinweis: Quantile der t-Verteilung sind t0.975,99=1.99 und t0.995,99=2.63.
c. Für eine weitere Studie wurde eine Teilstichprobe von 10 Studentinnen entnommen (in
der Tabelle grau markiert). Schätzen Sie aus dieser Teilstichprobe und geben Sie ein
95%- und ein 99%-Konfidenzintervall für an. Hinweis: Quantile der t-Verteilung sind t0.975,9=2.26; t0.995,9=3.25, 36.5s;54.170x .
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 5
Übung 4 (Epidemiologie) 1. (Fall-Kontrollstudie, Odds-Ratio) a:1 b:1 In einer Klinik wurde retrospektiv über einen Zeitraum von 5 Jahren der Einfluss eines erhöhten Alkohol-Konsums auf das Auftreten eines Ösophagus-Karzinoms untersucht. Als Vergleichsgruppe wurden dabei Patienten mit anderen internistischen Krankheitsbildern herangezogen.
Alkoholkonsum Ösophagus-Karzinom
Ja Nein
>80g Alkohol pro Tag 192 54
80g Alkohol pro Tag 208 333
Gesamt 400 387
a. Schätzen Sie die Odds-Ratio erhöhten Alkoholkonsums (>80g pro Tag) für das Auftreten eines Ösophagus-Karzinoms. Warum kann aus dieser Studie kein relatives Risiko bestimmt werden?
b. Geben Sie für die Odds-Ratio ein 95%-Konfidenzintervall an.
2. (Kohorten Studie, relatives Risiko, Überschussanteil) a:1 b:1 c:1 In einer chirurgischen Abteilung wurde prospektiv über einen Zeitraum von 6 Monaten das Auftreten von Wundheilungsstörungen während der stationären Liegezeit nach OP erfasst. Zusätzlich wurde vor der OP bei allen Patienten eine Risiko-Anamnese erhoben.
Risiko-Anamnese
Wundheilungsstörung Gesamt
Ja Nein
Positiv 44 171 215
Negativ 64 734 798
Gesamt 108 905 1013
a. Schätzen Sie das relative Risiko einer Risiko-Anamnese für eine Wundheilungsstörung.
b. Wie hoch ist das populationsattributable Risiko (Überschussanteil)?
c. Geben Sie für das relative Risiko ein 95%-Konfidenzintervall an.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 6
Übung 5 (Diagnostische Tests) 1. (bedingte Wahrscheinlichkeit, Bayes Theorem) a:1 b:1 c:1 Das Vorliegen einer HIV-Infektion kann mithilfe eines ELISA-Tests überprüft werden. Dieses Verfahren, bei dem Antikörper gegen HIV (nicht das Virus selbst) im Blut des Probanden nachgewiesen werden, verfügt über eine Sensitivität und Spezifität von jeweils 99.5%. Die Prävalenz der HIV-Infektion beträgt in Deutschland etwa 0.01% unter Mitgliedern der so genannten „low-risk“ Population (d.h. heterosexuell, nicht drogenabhängig etc.) und 15% unter intravenösen Drogenbenutzern.
a. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen positiv prädiktiven Werte des ELISA-Tests.
b. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen negativ prädiktiven Werte
des ELISA-Tests.
c. Wie hoch ist der positiv prädiktive Wert eines zweiten, unabhängigen ELISA-Tests für „low-risk“ Probanden, bei denen der erste Test positiv ausgefallen war?
2. (Sensitivität, Spezifität) a:1 b:1 Zur Diagnose des Gestationsdiabetes (GD) gibt es zwei alternative Diagnoseverfahren, die deutlich weniger belastend sind als der übliche orale 100g Glucose-Toleranz-Test (der „Gold-Standard“ der GD-Diagnostik). Hierbei handelt es sich um den 50g Glucose-Challenge-Test (GCT) und die Bestimmung des Nüchternblutzuckers (Fasting Plasma Glucose Concentration, FPGC). Beide Verfahren wurden in einer prospektiven Studie hinsichtlich ihrer Aussagekraft und Zuverlässigkeit miteinander verglichen. In einer Stichprobe von 520 zufällig ausgewählten Schwangeren wurde bei 53 Teilnehmerinnen mittels oralem 100g Glucose-Toleranz-Test ein Gestationsdiabetes (GD) diagnostiziert. Die gleichen Frauen waren zuvor auch einem GCT und einer FPGC Bestimmung unterzogen worden.
GD GCT FPGC
Positiv Negativ Positiv Negativ
Ja 36 17 43 10 Nein 84 383 112 355
a. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der GCT-
Bestimmung für den GD.
b. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der FPGC-Bestimmung für den GD. Welches Verfahren ist Ihrer Meinung nach (aus ärztlicher Sicht) besser zum routinemäßigen Screening auf GD geeignet?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 7
Übung 6 (Statistisches Testen I) 1. (Hypothesen, Signifikanzniveau, Power) a:1 b:1 c:1 d:1 Bei gesunden Personen im Alter zwischen 20 und 44 Jahren beträgt die mittlere Plasma-Calcium-Konzentration (Ca) 2.5 mmol/l. Es wird vermutet, dass die Ca-Werte von Patienten mit Congenital Central Hypoventilation Syndrome (CCHS) erhöht sind. In einer Stichprobe von acht CCHS-Patienten wurden folgende Ca-Werte gemessen.
Patient 1 2 3 4 5 6 7 8
Ca (mmol/l) 5.4 2.6 4.3 3.3 2.7 2.3 2.4 3.7
a. Formulieren Sie die eingangs skizzierte wissenschaftliche Fragestellung als statistisches
Entscheidungsproblem. Benennen Sie Nullhypothese (H0) und Alternativhypothese (HA), und legen Sie ein geeignetes Signifikanzniveau fest.
b. Welcher statistische Test kann zur Entscheidung zwischen H0 und HA verwendet
werden, wenn man annimmt, dass die Ca-Konzentration einer Normalverteilung folgt? Wie lauten die kritischen Werte der zugehörigen Teststatistik zum 5%, 1% und 0.1% Signifikanzniveau (siehe Tabelle A.2)?
c. Berechnen Sie die unter b. genannte Teststatistik aus den tabellierten Ca-Werten und
interpretieren Sie das Ergebnis.
d. Bei hinreichend feiner Tabellierung der t-Quantile ließe sich für die unter c. errechnete Teststatistik auch der p-Wert bestimmen. Welche qualitative Aussage über dessen Größe lässt sich bereits auf der Grundlage des Ergebnisses von c. und der t-Quantile in Tabelle A.2 treffen?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 8
Übung 7 (Statistisches Testen II) 1. (Fallzahlplanung, Signifikanzniveau, Power) a:1 b:1 c:1 In einer Phase-II-Studie an 20 adipösen Probanden wurde die Wirkung einer täglichen Gabe von 250 mg M-Oglitin auf das Körpergewicht untersucht. Innerhalb von acht Wochen erreichten die Probanden eine mittlere Gewichtsabnahme von 5.2 kg, bei einer geschätzten Standardabweichung von 3.7 kg.
a. Mit welchem statistischen Test lässt sich das Ergebnis dieser Studie bewerten? Berechnen Sie die Teststatistik und interpretieren Sie das Ergebnis. Welche Konsequenzen ergeben sich daraus für die Fragestellung einer folgenden Phase III-Studie (siehe b.)?
b. Wie viele Probanden müsste man in eine placebokontrollierte Phase-III-Studie
einschließen, um den beobachteten Effekt auf dem 5% Signifikanzniveau mit 80% Power zu verifizieren? Gehen Sie dabei von einem Placeboeffekt von 3.0 kg Gewichtsabnahme bei gleicher Standardabweichung von 3.7 kg aus.
c. Wie viele Probanden würde man benötigen, wenn bei gleicher Power (80%) das
Signifikanzniveau auf 1% gesenkt bzw. bei gleichem Signifikanzniveau (5%) die Power auf 90% erhöht würde?
2. (Vergleich von Anteilen, multiples Testen) a:1 b:1 c:1 In einer prospektiven, doppelblinden und placebokontrollierten Phase-III-Studie wurde die Wirksamkeit des Medikaments Bulliforton zur Behandlung postprandialer Verdauungs-beschwerden von Typ II Diabetes-Patienten untersucht. Primärer Endpunkt (EP) der Studie war eine Reduktion des Upper Abdominal Discomfort Severity Scores nach 4 Wochen (UADS4) um mindestens 200 Punkte gegenüber der Baseline (UADS0). Sekundäre EP waren eine Reduktion des UADS Scores um mindestens 200 Punkte nach 2 Wochen, und auf weniger als 150 Punkte nach 4 Wochen. Die Ergebnisse der Studie sind in der folgenden Tabelle zusammengefasst.
Gruppe Gesamt
primärer EP sekundäre EP
UADS4 UADS0-200
UADS2 UADS0-200
UADS4150
Verum 493 148 128 98 Placebo 487 122 101 71
a. Formulieren Sie die wissenschaftliche Fragestellung der Studie als statistisches
Entscheidungsproblem hinsichtlich des primären EP. Wie lauten H0 und HA? Welche Teststatistik kann sinnvoller Weise zur Entscheidungsfindung verwendet werden?
b. Berechnen Sie die Teststatistik für den primären EP und interpretieren Sie das Ergebnis.
Hinweis: Das Quantil der Chiquadrat-Verteilung ist 20.95,1=3.841.
c. Für die sekundären EP ergaben sich folgende Werte der unter a. gewählten
Teststatistik: 3.734 (UADS2UADS0-200) und 4.821 (UADS4150). Wie sind diese und das unter b. ermittelte Resultat bei Annahme eines 5% Signifikanzniveaus zu interpretieren?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 9
Übung 8 (Korrelation und Regression) 1. (Lineare Regression, Pearson- und Spearman-Korrelationskoeffizient) a:1 b:1 c:1 d:1 e:1 Bei 10 männlichen Unfallpatienten wurde der Harnstoff im Serum (mmol/l) bestimmt.
Patient Alter Harnstoff
1 70 4.1
2 76 5.6
3 81 8.8
4 85 9.7
5 44 2.9
6 58 3.1
7 51 3.5
8 74 6.8
9 45 2.8
10 67 3.8
a. Schätzen Sie aus den Daten in der Tabelle den Achsenabschnitt und die Steigung einer
Regressionsgeraden.
b. Schätzen Sie aus den Daten Pearson-Korrelationskoeffizient und Bestimmtheitsmaß. Hinweis: Zur Berechnung von sX, sY und sXY verwenden Sie bitte
09.1972)xx(10
1i
2i
10
1i
2i 37.57)yy(
10
1i ii 99.292)yy()xx( .
(siehe auch Fußnote 1)
c. Ist der Pearson-Korrelationskoeffizient signifikant von 0 verschieden? Welche Teststatistik kann zur Prüfung der Null-Hypothese verwendet werden? Berechnen Sie diese Teststatistik und interpretieren Sie das Ergebnis.
d. Zeichnen Sie die Regressionsgerade aus b. in das folgende Streudiagramm ein.
Wie ist das Resultat der linearen Regressionsanalyse zu interpretieren?
e. Berechnen Sie für die Daten der Tabelle den Spearman-Korrelationskoeffizienten XY
und vergleichen Sie diesen mit dem Pearson-Korrelationskoeffizienten. Wie ist der Unterschied der beiden Korrelationskoeffizienten zu erklären?
1 Für eine Stichprobe gepaarter Beobachtungen (x1,y1),…,(xn,yn) gilt:
n
1i
2
i
2
X )xx(1n
1s und
n
1i iiXY )yy()xx(1n
1s
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 10
Übung 9 (Statistische Modellbildung) 1. (multiple lineare Regression) a:1 Durch die Untersuchung einer repräsentativen Stichprobe (n=100) sollte geklärt werden, ob bei den Mitarbeitern von Cadmium verarbeitenden Chemieunternehmen ein Zusammenhang zwischen deren Lungen-Vitalkapazität (VK, gemessen in Liter) und der Betriebszugehörigkeit (gemessen in Jahren) besteht. In der folgenden Tabelle sind die Resultate der einfachen und multiplen Regressionsanalysen unter Adjustierung für das Lebensalter (in Jahren) aufgeführt.
Einflussgröße/Parameter einfache Analyse multiple Analyse
b (p-Wert) b (p-Wert) b (p-Wert)
Betriebszugehörigkeit -0.048 (<0.001) --- -0.006 (0.452) Lebensalter --- -0.051 (<0.001) -0.046 (<0.001) Achsenabschnitt 6.020 (<0.001) 7.023 (<0.001) 6.924 (<0.001)
Bestimmtheitsmaß 0.762 0.822 0.823
a. Stellen Sie für die beiden einfachen Regressionsanalysen und für die multiple
Regressionsanalyse die resultierenden Modellgleichungen auf. Wie sind die Resultate dieser linearen Regressionsanalysen zu interpretieren (siehe dazu auch Abbildung A.3)?
2. (logistische Regression, Odds-Ratio) a:1 b:1 c:1 In einer retrospektiven Studie wurden medizinische und epidemiologische Daten von 244 holländischen Männern im Alter zwischen 55 und 65 Jahren ausgewertet, bei denen aufgrund
eines PSA-Wertes (Prostate-Specific Antigen) in der diagnostischen Grauzone von 3-10 g/l ein Verdacht auf Prostatakrebs bestand. Dabei konnten mittels logistischer Regressionsanalyse neben dem Quotienten von freiem (F) und totalem (T) PSA auch ein positiver rektaler Tastbefund (Digital Rectal Examination, DRE) und eine positive Familienanamnese als signifikante diagnostische Marker für Prostatakrebs identifiziert werden.
Logistische Regressionsanalyse diagnostischer Marker für Prostatakrebs, durchgeführt an 244 Männern im Alter zwischen 55 und 65 Jahren
Parameter Regressionskoeffizient 95% KI p-Wert
Achsenabschnitt -0.169 -.- -.- Quotient F :T -10.197 (-18.932,-3.053) 0.0054 DRE (+) 1.643 (0.752,2.559) 0.0004 Familienanamnese (+) 1.076 (0.012,2.131) 0.0437
a. Wie sind die Resultate der logistischen Regressionsanalyse zu interpretieren?
Transformieren Sie dazu die Regressionskoeffizienten der beiden dichotomen Einflussgrößen DRE und Familienanamnese auf geeignete Weise in Odds-Ratios.
b. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T
Quotienten von 0.07, positivem Tastbefund und positiver Familienanamnese.
c. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T Quotienten von 0.35, negativem Tastbefund und negativer Familienanamnese. Vergleichen Sie das Ergebnis mit der unter b. ermittelten Wahrscheinlichkeit.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 11
Übung 10 (Überlebenszeitanalyse) 1. (Kaplan-Meier-Schätzung) a:1 b:1 Für fünf Individuen liegen folgende Überlebenszeiten (in Jahren) vor.
Individuum 1 2 3 4 5
Überlebenszeit 6 7(*) 2 8 4(*)
(*): zensierte Beobachtungen
a. Schätzen Sie mit dem Kaplan-Meier-Verfahren die Überlebenswahrscheinlichkeiten für die Jahre 1 bis 8. Ergänzen Sie hierzu die nachstehende Sterbetafel.
ti ni di )tT(P̂ 1i )tT|tT(P̂ 1ii )tT(P̂ i
2 5 1 1.000 0.800 0.800
b. Skizzieren Sie den Verlauf der geschätzten Überlebenswahrscheinlichkeiten („Kaplan-
Meier-Kurve“) und markieren Sie die zensierten Beobachtungen. 2. (Log-Rank-Test) a:1 b:1 In der folgenden Tabelle sind die Überlebenszeiten (in Monaten) aufgeführt, die in zwei Patientengruppen nach Durchlaufen unterschiedlicher Behandlungsschemata C1 und C2 beobachtet wurden.
Therapie C1 12 18(*) 22 22 23 27
Therapie C2 24 25(*) 27 36(*) 37
(*): zensierte Beobachtungen
a. Formulieren Sie H0 und HA. Ergänzen Sie die nachstehende Tabelle um die fehlenden Angaben zur Anzahl von Personen unter Risiko (nC1,i, nC2,i), zur beobachteten Anzahl an Todesfällen (dC1,i, dC2,i) sowie zur unter der Annahme von H0 erwarteten Anzahl (eC1,i, eC2,i) an Todesfällen.
ti nC1,i dC1,i nC2,i dC2,i eC1,i eC2,i
12 6 1 5 0 0.5455 0.4545
22 0
23 2 1 0
24 1 0 1
27 4
37 0 0 2 1
Summe n.a. 5 n.a. 3
b. Berechnen Sie aus den Ergebnissen unter a. die Teststatistik eines Log-Rank-Tests und
entscheiden Sie auf dem 5% Signifikanzniveau zwischen den Hypothesen H0 und HA anhand des Quantils der Chiquadrat-Verteilung 2
0.95,1=3.841.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 12
Tabelle A.1: Verteilungsfunktion (z) einer Standard-Normalverteilung
z 0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
(z) kann aus der Tabelle für z-Werte zwischen 0.00 und 3.49 abgelesen werden, z.B. (1.96)=0.9750.
Eine separate Tabellierung von (z) für negative z-Werte ist nicht erforderlich, da wegen der Symmetrie
der Normalverteilung (-z)=1-(z) gilt, so dass z.B. (-1.64)=1-(1.64)=1-0.9495=0.0505.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 13
Tabelle A.2: Ausgewählte Quantile t1-, der t-Verteilung
Freiheitsgrade () t0.900, t0.950, t0.975, t0.990, t0.999,
1 3.0777 6.3138 12.7062 31.8205 318.3088
2 1.8856 2.9200 4.3027 6.9646 22.3271
3 1.6377 2.3534 3.1824 4.5407 10.2145
4 1.5332 2.1318 2.7764 3.7469 7.1732
5 1.4759 2.0150 2.5706 3.3649 5.8934
6 1.4398 1.9432 2.4469 3.1427 5.2076
7 1.4149 1.8946 2.3646 2.9980 4.7853
8 1.3968 1.8595 2.3060 2.8965 4.5008
9 1.3830 1.8331 2.2622 2.8214 4.2968
10 1.3722 1.8125 2.2281 2.7638 4.1437
11 1.3634 1.7959 2.2010 2.7181 4.0247
12 1.3562 1.7823 2.1788 2.6810 3.9296
13 1.3502 1.7709 2.1604 2.6503 3.8520
14 1.3450 1.7613 2.1448 2.6245 3.7874
15 1.3406 1.7531 2.1314 2.6025 3.7328
16 1.3368 1.7459 2.1199 2.5835 3.6862
17 1.3334 1.7396 2.1098 2.5669 3.6458
18 1.3304 1.7341 2.1009 2.5524 3.6105
19 1.3277 1.7291 2.0930 2.5395 3.5794
20 1.3253 1.7247 2.0860 2.5280 3.5518