Biostatistik, Sommer 2017 - staff.uni-mainz.de · Organisatorisches Literatur Literaturhinweise (UB...

Post on 24-Oct-2019

2 views 0 download

transcript

Biostatistik, Sommer 2017Einfuhrung, Quadratische Gleichungen

Prof. Dr. Achim Klenke

http://www.aklenke.de

1. Vorlesung: 21.04.2017

1/37

Inhalt1 Organisatorisches

ThemenLiteratur

2 Mathematik anwendenVorgehen (einfach)Vorgehen (anspruchsvoll)

3 Zahlen und RechenregelnZahlendarstellungPotenzen und WurzelnBruchrechnung

4 Quadratische GleichungenTheorieBeispiel: Hardy-Weinberg-Gleichgewicht

2/37

Organisatorisches

Orte, Zeiten, Ubungen, Zulassungskriterien, . . .

http://www.aklenke.de

Ubungen: elektronisch via ilias, von Timo Schluterbetreut. Abgabe jeweils bis Freitag.Tutorien fur Fragen, Besprechung der Ubungsaufgaben,etc.Klausur (Modul 4-1): 24.07.2017, 10-12 Uhr.

3/37

Organisatorisches

Tutoriumstermine und -raume

Es wird vier Tutorien geben. Voraussichtliche Termine:

1 Di 12–14, Raum 04-224 Lukas Metzdorf2 Mi 12–14, Raum 05-514 Lukas Metzdorf3 Do 14–16, Raum 04-516 Fabio Frommer4 Fr 12–14, Raum 04-224 Fabio Frommer

Raume im Institut fur Mathematik, Staudingerweg 9

Anmeldung elektronisch.

4/37

Organisatorisches Themen

ThemenWiederholung Schulmathematik

Dreisatz, Zahlen, quadratische Gleichungen, FolgenExponential- und LogarithmusfunktionDifferential- und Integralrechnung

Beschreibende StatistikMittelwert, Median, Quantile, StandardfehlerLineare RegressionHistogramme etc.

Schließende StatistikGrundbegriffe der WahrscheinlichkeitstheorieSchatzerKonfidenzintervalleTests (t , χ2, Rangtests)

5/37

Organisatorisches Literatur

Literaturhinweise (UB Lehrbuchsammlung)

1 Steland, Mathematische Grundlagen der empirischen Forschung,Springer 2004

2 Bohl, Mathematik in der Biologie, Springer 20013 H. Vogt, Grundkurs Mathematik fur Biologen, 2. Aufl., Teubner,

1994.4 A. Riede, Mathematik fur Biologen, Vieweg, 1993.

5 F. Barlocher, Biostatistik, Thieme, 1999.6 W. Timischl, Biostatistik : eine Einfuhrung fur Biologen und

Mediziner, 2. Aufl., Springer, 2000.7 W. Kohler, G. Schachtel, P. Voleske, Biostatistik : eine Einfuhrung

fur Biologen und Agrarwissenschaftler, 4. Aufl., Springer, 2007.(Auch als E-Book vorhanden)

6/37

Organisatorisches

Quellen

Diese Vorlesung basiert in Teilen auf Material vonBrooks Ferebee (Universitat Frankfurt)Gaby Schneider (Universitat Frankfurt)Anton Wakolbinger (Universitat Frankfurt)Martin Hutzenthaler und Dirk Metzler (LMU Munchen)Matthias Birkner (Uni Mainz)

7/37

Mathematik anwenden Vorgehen (einfach)

Was ist Mathematik?

Mathematik ist Sprache und Kalkul.

Drei Schritte:(1) konkretes Problem formalisieren(2) formales Problem losen(3) formale Losung im Kontext interpretieren

8/37

Mathematik anwenden Vorgehen (einfach)

Beispiel: Ansetzen einer chemischen Losung.

Es sollen 20ml einer 2% igen wassrigen Losung angesetztwerden. Im Regal finden Sie:

15% ige Losungreines Wasser

9/37

Mathematik anwenden Vorgehen (einfach)

(1) Formalisieren: Wir definieren Symbole x und y durch

x = Volumen der 15% igen Losung, die verwendet wirdy = Volumen des Wassers, das verwendet wird

Es ergeben sich zwei Gleichungen

15% · x20 ml

= 2%, x + y = 20 ml.

10/37

Mathematik anwenden Vorgehen (einfach)

15% · x20 ml

= 2%, x + y = 20 ml.

(2) Formale Losung:

15% · x20 ml

= 2% =⇒ 15% · x = 2% · 20 ml

=⇒ x =2%

15%· 20 ml =

83

ml ≈ 2.67 ml.

Aus der zweiten Gleichung (x + y = 20 ml) folgty = 20 ml− x = 52

3 ml ≈ 17.33 ml.

11/37

Mathematik anwenden Vorgehen (einfach)

(3) InterpretationEs mussen 2.67 ml der 15% igen Losung in 17.33 ml Wasserpipettiert werden.

12/37

Mathematik anwenden Vorgehen (anspruchsvoll)

Anspruchsvollere Verwendung vonMathematik

Funf Schritte:(1) Modell bilden(2) Modell formalisieren(3) formales Modell mathematisch analysieren(4) formale Ergebnisse interpretieren(5) Vergleich mit der Natur bzw. Schatzen von

Modellparametern (hier kommt Statistik ins Spiel)

13/37

Mathematik anwenden Vorgehen (anspruchsvoll)

Beispiel: Verseuchung des Edersees.Durch einen Chemie-Unfall ist der Edersee mit PCB verseucht.Konzentration c = 1µg/l .Wie groß ist die Belastung nach einem Jahr?

14/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(1) Modell bilden.

Konstanter Wasserzufluss.Jeden Tag durchmischt sich das zugeflossene Wasserkomplett mit dem Inhalt des Stausees und fließt dann ab.

Alternativen:Das zugeflossene Wasser fließt ab, ohne sich zudurchmischen.Das zugeflossene Wasser verdrangt das vorhandeneWasser....

15/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(2) Modell formalisieren.

Volumen des Sees: V = 200Mio m3.

Zufluss eines Jahres: Z = 600Mio m3.

Konzentration am Tag n = 0,1, . . . ,365: cn.Speziell c0 = c = 1µg/l .

Modellannahme ”konstanter Zufluss“ liefertZufluss eines Tages:

ZT =Z

365.

Modellannahme ”taglich perfekte Vermischung“ liefert

cn+1 = cn ·V

V + ZT.

16/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(3) Formales Modell analysieren.Wir haben c0 = 1 und

cn+1 = cn ·V

V + ZT= cn ·

200Mio

200Mio + 600Mio/365

= cn ·1

1 + 3/365.

Alsoc1 = c0 ·

11 + 3/365

c2 = c1 ·1

1 + 3/365= c0 ·

(1

1 + 3/365

)2

c3 = c2 ·1

1 + 3/365= c0 ·

(1

1 + 3/365

)2

· 11 + 3/365

= c0 ·(

11 + 3/365

)3

17/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(3) Formales Modell analysieren.

Also fur jedes n:

cn = c0 ·(

11 + 3/365

)n

.

Speziell ist

c365 = c0 ·(

11 + 3/365

)365

= 0.0504 µg/l .

18/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(4) Formales Ergebnis interpretieren.

Nach einem Jahr betragt die Konzentration PCB im Ederseenoch 0.0504 µg/l (falls das Modell realistisch ist).

19/37

Mathematik anwenden Vorgehen (anspruchsvoll)

(5) Vergleich mit der Realitat.

20/37

Zahlen und Rechenregeln Zahlendarstellung

Schreibweisen fur reelle Zahlen:√3, 1−

√2, π, e (das lieben Mathematiker)

1.73205 . . ., −0.41421 . . ., 3.14159 . . .(das versteht der Taschenrechner)5/3 = 1.6 = 1.66666 . . .1.67 · 105 = 167 000, denn 105 = 100 0002.3 · 10−4 = 0.00023, denn und 10−4 = 0.00011.67 E5 = 1.67 · 105

2.3 E − 4 = 2.3 · 10−4

(manche altere Messinstrumente)

21/37

Zahlen und Rechenregeln Zahlendarstellung

Zehnerpotenzen101 Zehn deka da

102 Hundert hekto h

103 Tausend kilo k

106 Million mega M

109 Milliarde giga G

1012 Billion tera T

1015 Billiarde peta P

1018 Trillion exa E

10−1 dezi d

10−2 zenti c

10−3 milli m

10−6 mikro µ

10−9 nano n

10−12 pico p

10−15 femto f

10−18 atto a

22/37

Zahlen und Rechenregeln Zahlendarstellung

Zehnerpotenzen101 Zehn deka da

102 Hundert hekto h

103 Tausend kilo k

106 Million mega M

109 Milliarde giga G

1012 Billion tera T

1015 Billiarde peta P

1018 Trillion exa E

10−1 dezi d

10−2 zenti c

10−3 milli m

10−6 mikro µ

10−9 nano n

10−12 pico p

10−15 femto f

10−18 atto a

Gelbes Licht, Wellenlange

440nm = 440 · 10−9 m = 4.4 · 10−7 m.

23/37

Zahlen und Rechenregeln Zahlendarstellung

Zehnerpotenzen101 Zehn deka da

102 Hundert hekto h

103 Tausend kilo k

106 Million mega M

109 Milliarde giga G

1012 Billion tera T

1015 Billiarde peta P

1018 Trillion exa E

10−1 dezi d

10−2 zenti c

10−3 milli m

10−6 mikro µ

10−9 nano n

10−12 pico p

10−15 femto f

10−18 atto a

Stromerzeugung in Deutschland (2015):646TWh = 646 · 1012 Wh = 646 · 109 kWh.1Wh = 3600 J, also wurden erzeugt:

646 · 1012 · 3600 J = 2.32 · 1018 J = 2.32EJ.24/37

Zahlen und Rechenregeln Potenzen und Wurzeln

Fur n = 1,2,3, . . . und a ∈ R (reelle Zahl)

an = a · a · a · · · a (n Faktoren).

Regelnam · an = am+n.

(am)n = amn.

an · bn = (ab)n.

Wir setzena0 = 1

unda−m =

1am falls a 6= 0.

Wir definieren n√

a = a1/n durch

(a1/n)n = a falls a ≥ 0.

Rechenregeln gelten dann auch fur ax mit x ∈ R.25/37

Zahlen und Rechenregeln Bruchrechnung

Bruchrechnunga,b, c,d reelle Zahlen, b,d 6= 0. Rechenregeln

ab· c =

a cb

ab

cd

=a cb d

ab

d=

ab d

abcd

=a db c

, falls c 6= 0

ab

+cd

=ad + bc

b d.

Bruche Kurzen erfordert Geschick.26/37

Quadratische Gleichungen Theorie

Seien a,b, c reelle Zahlen, a 6= 0. Gesucht: Losungen von

0 = ax2 + bx + c.

Definiere Diskriminante ∆ = b2 − 4ac. QuadratischeErganzung liefert die Losungen

x1 =−b −

√∆

2a, x2 =

−b +√

2a.

SatzEs tritt stets genau einer der drei Falle auf:

(i) ∆ = 0: x1 und x2 sind reell und x1 = x2.

(ii) ∆ > 0: x1 und x2 sind reell und x1 6= x2.

(iii) ∆ < 0: Dann sind x1 und x2 keine reellen Zahlen.

27/37

Quadratische Gleichungen Theorie

Beispiel 1

0 = 2x2 − 4x + 2.

a = 2, b = −4, c = 2.

∆ = b2 − 4ac = (−4)2 − 4 · 2 · 2 = 16− 16 = 0.

Nach dem Satz: Einzige Losung ist

x =−b −

√∆

2a=−(−4)− 0

2 · 2= 1.

28/37

Quadratische Gleichungen Theorie

Beispiel 1

f (x) = 2x2 − 4x + 2.

−4 −2 0 2 4

−5

05

10

f(x)

29/37

Quadratische Gleichungen Theorie

Beispiel 2

x2 − 3x + 2 = 0.

a = 1, b = −3, c = 2.

∆ = b2 − 4ac = (−3)2 − 4 · 1 · 2 = 9− 8 = 1 > 0.

Nach dem Satz: Die zwei Losungen sind

x1 =−b −

√∆

2a=−(−3)− 1

2= 1

x2 =−b +

√∆

2a=−(−3) + 1

2= 2.

30/37

Quadratische Gleichungen Theorie

Beispiel 2

f (x) = x2 − 3x + 2.

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

50.

51.

52.

5

f(x)

● ●

31/37

Quadratische Gleichungen Theorie

Beispiel 3

x2 + 2x + 2 = 0.

a = 1, b = 2, c = 2.

∆ = b2 − 4ac = (2)2 − 4 · 1 · 2 = 4− 8 = −4 < 0.

Nach dem Satz: Es gibt keine reellen Losungen.

32/37

Quadratische Gleichungen Theorie

Beispiel 3

f (x) = x2 + 2x + 2.

−6 −4 −2 0 2 4

−5

515

25

f(x)

33/37

Quadratische Gleichungen Beispiel: Hardy-Weinberg-Gleichgewicht

Idealisierte Population: sehr groß, diploid, hermaphroditisch.Annahme:

”Neutralitat“(keine Selektion)rein zufallige PaarungenMendel’sche Segregationzwei Allele A und a

Genotypenhaufigkeiten heute:

Genotyp AA Aa aaAnteil xAA xAa xaa

(xAA + xAa + xaa = 1)

Allelhaufigkeiten heute

Allel A a

Anteil pA = xAA + 12xAa pa = 1

2xAa + xaa

Genotypenhaufigkeiten in der nachsten Generation?34/37

Quadratische Gleichungen Beispiel: Hardy-Weinberg-Gleichgewicht

Heute:Genotyp AA Aa aa

Anteil xAA xAa xaa

Allel A a

Anteil pA = xAA + 12xAa pa = 1

2xAa + xaa

Nachste Generation:Genotyp AA Aa aa

Anteil x ′AA x ′Aa x ′aa

Allel A aAnteil p′A p′a

x ′AA = p2A p′A = pA

x ′Aa = 2 pApa p′a = pa.

x ′aa = p2a

35/37

Quadratische Gleichungen Beispiel: Hardy-Weinberg-Gleichgewicht

Hardy-Weinberg-GleichgewichtAllelhaufigkeiten sind konstant uber die Generationen.Unabhangig von den ursprunglichen Genotyphaufigkeitenstellt sich fur die Genotypen AA, Aa, aa nach einerGeneration das Verhaltnis

p2 : 2p(1− p) : (1− p)2

ein und andert sich dann nicht mehr.

36/37

Quadratische Gleichungen Beispiel: Hardy-Weinberg-Gleichgewicht

Hardy-Weinberg Gleichgewicht:HeterozygotenKann man pA berechnen, wenn man nur den Anteil derHeterozygoten (xAa) kennt?

xAa = 2pA(1− pA) = 2pA − 2p2A,

alsop2

A − pA +12

xAa = 0.

Auflosen nach pA (quadratische Erganzung) gibt

pA =1±√

1− 2xAa

2.

(Zusatzinformation erforderlich, um die Losung auswahlen, z.B.welches der beiden Allele haufiger ist.)

37/37