+ All Categories
Home > Documents > Skript zur Vorlesung Mathematik 2 - htw-dresden.dejung/Skript/skript_ma2_PT_2019.pdf · Mathematik...

Skript zur Vorlesung Mathematik 2 - htw-dresden.dejung/Skript/skript_ma2_PT_2019.pdf · Mathematik...

Date post: 29-Aug-2019
Category:
Upload: others
View: 14 times
Download: 0 times
Share this document with a friend
86
Hochschule f ¨ ur Technik und Wirtschaft Dresden Fakult ¨ at Informatik/Mathematik Prof. Dr. B. Jung Skript zur Vorlesung Mathematik 2 ur den Studiengang Produktionstechnik (053) Stoffgebiete: 5. Integralrechnung f ¨ ur Funktionen einer reellen Variablen 6. Differential- und Integralrechnung f¨ ur Funktionen mehrerer reeller Variabler 7. Gew¨ ohnliche Differentialgleichungen (Grundlagen) 8. Grundlagen der Wahrscheinlichkeitsrechnung 9. Wahrscheinlichkeitsverteilungen
Transcript

Hochschule fur Technik und Wirtschaft DresdenFakultat Informatik/MathematikProf. Dr. B. Jung

Skript zur Vorlesung Mathematik 2

fur den Studiengang Produktionstechnik (053)

Stoffgebiete:

5. Integralrechnung fur Funktionen einer reellen Variablen

6. Differential- und Integralrechnung fur Funktionen mehrerer reeller Variabler

7. Gewohnliche Differentialgleichungen (Grundlagen)

8. Grundlagen der Wahrscheinlichkeitsrechnung

9. Wahrscheinlichkeitsverteilungen

Inhaltsverzeichnis

5 Integralrechnung fur Funktionen einer reellen Variablen 45.1 Integralbegriff und Integrierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

5.1.1 Unbestimmtes Integral, Grundintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . 45.1.2 Bestimmtes Integral und Eigenschaften integrierbarer Funktionen . . . . . . . . . . . . 5

5.2 Integrationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75.2.1 Integration durch Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75.2.2 Partielle Integration (”Produktintegration“) . . . . . . . . . . . . . . . . . . . . . . . . 95.2.3 Integration durch Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . 115.2.4 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

5.3 Einige Anwendungen der Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.3.1 Flacheninhalt ebener Bereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175.3.2 Bogenlange einer ebenen Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185.3.3 Volumen und Mantelflache von Rotationskorpern . . . . . . . . . . . . . . . . . . . . . 185.3.4 Schwerpunkt homogener ebener Bereiche . . . . . . . . . . . . . . . . . . . . . . . . . 195.3.5 Mechanische Arbeit (Arbeit einer Kraft) . . . . . . . . . . . . . . . . . . . . . . . . . 19

5.4 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205.4.1 Entwicklung einer periodischen Funktion in eine Fourier-Reihe . . . . . . . . . . . . . 205.4.2 Weitere Eigenschaften von Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . 22

6 Differential- und Integralrechnung fur Funktionen mehrerer reeller Variabler 236.1 Einfuhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

6.2.1 Grenzwert, Stetigkeit, partielle Ableitungen 1. Ordnung . . . . . . . . . . . . . . . . . 266.2.2 Partielle Ableitungen hoherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 276.2.3 Differentiation nach einem Parameter (verallgemeinerte Kettenregel) . . . . . . . . . . 29

6.3 Das totale Differential einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296.3.1 Definition und Anwendung in der Fehlerrechnung . . . . . . . . . . . . . . . . . . . . 296.3.2 Implizite Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

6.4 Extrema von Funktionen mehrerer Variabler . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316.4.1 Begriff des Extremums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316.4.2 Extrema ohne Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316.4.3 Extrema mit Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

6.5 Ausgleichsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366.6 Weitere raumliche Koordinatensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386.7 Weitere Anwendungen der Differentialrechnung fur Funktionen mehrerer reeller Variabler: Vek-

toranalysis (Einblick) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396.7.1 Einige Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396.7.2 Divergenz eines Vektorfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406.7.3 Rotation eines Vektorfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

6.8 Integralrechnung fur Funktionen zweier reeller Variabler . . . . . . . . . . . . . . . . . . . . . 446.8.1 Zweidimensionale Bereichsintegrale: Definition und Berechnung . . . . . . . . . . . . 446.8.2 Anwendungen des zweidimensionalen Bereichsintegrals . . . . . . . . . . . . . . . . . 47

7 Gewohnliche Differentialgleichungen (Grundlagen) 497.1 Einfuhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497.2 Losungsmethoden fur lineare Differentialgleichungen 1. und 2. Ordnung . . . . . . . . . . . . . 50

7.2.1 Lineare Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . 507.2.2 Lineare Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten . . . . . . . . 53

7.3 Beschreibung mechanischer Schwingungen mit Hilfe von Differentialgleichungen . . . . . . . 56

8 Grundlagen der Wahrscheinlichkeitsrechnung 578.1 Hilfsmittel aus der Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578.2 Grundbegriffe der Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . 58

8.2.1 Das Zufallsexperiment und weitere Grundbegriffe . . . . . . . . . . . . . . . . . . . . 582

8.2.2 Verknupfungen von Ereignissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 598.3 Der Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

8.3.1 Laplace-Experimente, absolute und relative Haufigkeit . . . . . . . . . . . . . . . . . . 618.3.2 Wahrscheinlichkeitsaxiome und Schlussfolgerungen . . . . . . . . . . . . . . . . . . . 618.3.3 Additionssatz, bedingte Wahrscheinlichkeit und Multiplikationssatz . . . . . . . . . . . 628.3.4 Baumdiagramme, totale Wahrscheinlichkeit von Ereignissen . . . . . . . . . . . . . . . 65

9 Wahrscheinlichkeitsverteilungen 689.1 Stetige und diskrete Zufallsvariable (ZV) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689.2 Verteilungsfunktion einer ZV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

9.2.1 Verteilungsfunktion einer diskreten ZV (diskrete Verteilung) . . . . . . . . . . . . . . . 699.2.2 Verteilungsfunktion einer stetigen ZV (stetige Verteilung) . . . . . . . . . . . . . . . . 70

9.3 Kennwerte einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 719.4 Spezielle Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

9.4.1 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 739.4.2 Poisson-Verteilung und Poisson-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . 749.4.3 Stetige Gleichverteilung (Rechteckverteilung) . . . . . . . . . . . . . . . . . . . . . . . 769.4.4 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779.4.5 Weibull-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 799.4.6 Gaußsche Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

9.5 Aussagen uber Summen und Produkte von Zufallsvariablen . . . . . . . . . . . . . . . . . . . . 839.5.1 Kennwerte von Summen und Produkten von Zufallsvariablen . . . . . . . . . . . . . . 839.5.2 Zentraler Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

3

5 Integralrechnung fur Funktionen einer reellen Variablen

Wahrend bei der Differentialrechnung die Ableitungsfunktion einer gegebenen Funktion ermittelt wird, suchtdie Integralrechnung nach einer Funktion, deren Ableitung mit einer gegebenen Funktion ubereinstimmt.

5.1 Integralbegriff und Integrierbarkeit

5.1.1 Unbestimmtes Integral, Grundintegrale

Definition 5.1: Die Funktion y = f(x) sei auf einem Intervall [a, b] definiert. Eine auf diesem Intervalldifferenzierbare Funktion F (x) heißt Stammfunktion von f(x), wenn gilt:

F ′(x) = f(x) .

Zwei Stammfunktionen F1(x), F2(x) einer Funktion f(x) unterscheiden sich lediglich durch eine additive Kon-stante (vgl. dazu Definition 5.1 und die Differentiationsregeln im Abschnitt 4.1.1 des Skriptes Mathematik 1).Diese Aussage fuhrt zu dem Begriff des unbestimmten Integrals.

Definition 5.2: Das unbestimmte Integral einer Funktion f(x) ist die Gesamtheit aller StammfunktionenF (x) + C (F (x): spezielle Stammfunktion, C: beliebige reelle Zahl, die sog. Integrationskonstante).

Schreibweise fur das unbestimmte Integral:ˆf(x) dx = F (x) + C

Beispiel 5.1:

Einige unbestimmte Integrale (Grundintegrale)(C,C1, C2 ∈ R: Integrationskonstanten)

ˆxndx =

1

n+ 1xn+1 + C (n ∈ N)

ˆxadx =

1

a+ 1xa+1 + C (a 6= −1, x > 0)

ˆ1

xdx = ln |x|+ C

ˆaxdx =

1

ln aax + C (a > 0, a 6= 1)

ˆsinx dx = − cosx+ C

ˆcosx dx = sinx+ C

ˆ1

cos2 xdx = tanx+ C

ˆ1

sin2 xdx = − cotx+ C

ˆ1√

1− x2dx = arcsinx+ C1

ˆ1

1 + x2dx = arctanx+ C1

= − arccosx+ C2 = − arccotx+ C2

ˆsinh(x) dx = cosh(x) + C

ˆcosh(x) dx = sinh(x) + C

ˆ1

cosh2(x)dx = tanh(x) + C

ˆ1

sinh2(x)dx = −coth(x) + C

4

5.1.2 Bestimmtes Integral und Eigenschaften integrierbarer Funktionen

Das bestimmte Integral wird als Flacheninhalt A unter der Kurve einer Funktion f(x) in einem vorgegebenenIntervall [a, b] definiert. Dabei wird zunachst angenommen, dass die Funktion in diesem Intervall monoton wach-send ist und samtliche Funktionswerte positiv sind, d.h. die betrachtete Flache wird durch die Geraden x = aund x = b, die x-Achse und die Kurve y = f(x) begrenzt, siehe Bild 5.1. Diese Flache ist i.allg. nach obenkrummlinig berandet, so dass der gesuchte Flacheninhalt nicht mit elementargeometrischen Mitteln bestimmtwerden kann. Er wird als Grenzwert einer Folge von Naherungssummen ermittelt. Diese Vorgehensweise wirdim folgenden genauer beschrieben1.

- Das Intervall [a, b] wird in n Teilintervalle [xk−1, xk] (k = 1, 2, . . . , n, wobei x0 = a und xn = b) zerlegt.Damit wird eine Unterteilung des Flachenstucks in n Streifen mit den Breiten ∆x1, ∆x2, . . . ,∆xn(∆xk = xk − xk−1) vorgenommen.

- Diese Streifen werden durch Rechtecke ersetzt, deren Hohe gleich dem kleinsten bzw. großten Funktionswertin dem entsprechenden Teilintervall ist (siehe Bild 5.1).

- Die Flacheninhalte der Rechtecke werden summiert:

Un =n∑k=1

f(xk−1)∆xk , On =n∑k=1

f(xk)∆xk

Auf Grund der Voraussetzung, dass f(x) eine im Intervall [a, b] monoton wachsende Funktion ist, folgt sofort:Un ≤ A sowie On ≥ A. Daher wird Un auch als Untersumme und On als Obersumme bezeichnet.

- Es erfolgt ein Grenzubergang n→∞, wobei die Breite samtlicher Streifen gegen Null gehen soll(d.h. die Unterteilung der Flache wird immer feiner).

- Wenn bei diesem Grenzubergang die Unter- und Obersumme gegen einen gemeinsamen Grenzwert streben,so wird dieser als das bestimmte Integral der Funktion f(x) in den Grenzen von a bis b bezeichnet.Schreibweise:

limn→∞

n∑k=1

f(xk)∆xk =

a

f(x) dx

-

6

x

y

a c b

f(x)

Bild 5.1 Bild 5.2

Es soll nun die Frage untersucht werden, unter welchen Bedingungen das bestimmte Integral (d.h. der betrachteteGrenzwert) existiert.Eine notwendige Bedingung fur die Integrierbarkeit einer Funktion f(x) im Intervall [a, b] ist die Beschranktheitdieser Funktion (da anderenfalls die betrachteten Summen nicht beschrankt waren und damit kein Grenzwertexistieren wurde).Eine hinreichende Bedingung fur die Existenz des bestimmten Integrals der Funktion f(x) uber [a, b] ist dieStetigkeit oder zumindest die stuckweise Stetigkeit2 von f(x) auf [a, b]. So kann z.B. fur die im Bild 5.2 dar-gestellte, stuckweise stetige Funktion das bestimmte Integral uber [a, b] berechnet werden, und zwar unter derVoraussetzung, dass bei jeder der oben beschriebenen Unterteilungen in x = c ein Anfangs- bzw. Endpunkteines Teilintervalls liegt (siehe dazu auch: ”Eigenschaften integrierbarer Funktionen“, Punkt 4)).

1Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler (Band 1), 12. Auflage, S. 429-4332Das bedeutet, dass in dem betrachteten Intervall nur endlich viele Stellen existieren, an denen die Funktion unstetig ist. Die Eigen-

schaft der stuckweisen Stetigkeit schließt die Beschranktheit mit ein.

5

Bei der praktischen Berechnung eines bestimmten Integrals wird man jedoch nicht die genannte Grenzwertbil-dung nutzen, sondern auf den folgenden Satz zuruckgreifen.

Hauptsatz der Differential- und IntegralrechnungIst f(x) auf [a, b] stetig und F (x) eine beliebige Stammfunktion von f(x), dann gilt:

a

f(x) dx = F (b)− F (a) . (66)

Somit ist bei der Berechnung des bestimmten Integrals zunachst eine Stammfunktion des Integranden f(x) zusuchen und dann das Einsetzen der Integrationsgrenzen gemaß der Formel (66) vorzunehmen.

Beispiel 5.2:

Eigenschaften integrierbarer Funktionen

1) Anderung der Integrationsvariablen:bˆ

a

f(x) dx =

a

f(t) dt

2) Vertauschung der Integrationsgrenzen:bˆ

a

f(x) dx = −aˆ

b

f(x) dx

3) Zusammenfallen der Integrationsgrenzen:aˆ

a

f(x) dx = 0

4) Zerlegung des Integrationsintervalls in Teilintervalle:bˆ

a

f(x) dx =

a

f(x) dx+

c

f(x) dx (a < c < b)

5) Linearkombination mehrerer Funktionen:bˆ

a

(c1f1(x) + c2f2(x)) dx = c1

a

f1(x) dx+ c2

a

f2(x) dx (c1, c2: reelle Konstante)

Diese Regel ist erweiterbar auf eine beliebige endliche Anzahl von Funktionen f1, f2, . . . , fn.

6) Majorisierung eines bestimmten Integrals:bˆ

a

f1(x) dx ≤bˆ

a

f2(x) dx , falls f1(x) ≤ f2(x) fur alle x ∈ [a, b]

Beispiel 5.3:

Beispiel 5.4:

6

5.2 Integrationsverfahren

Beim Aufsuchen der Stammfunktion zu einer gegebenen Funktion f(x) fuhrt die Anwendung der Grundintegra-le und der elementaren Integrationsregeln nicht immer zum Ziel. Aus diesem Grund werden in den Abschnit-ten 5.2.1 bis 5.2.3 einige Integrationsverfahren vorgestellt, die als Hilfsmittel zum Auffinden von Stammfunk-tionen verwendet werden konnen.

5.2.1 Integration durch Substitution

Als erstes Integrationsverfahren wird die Integration durch Substitution vorgestellt. Das Prinzip dieses Integra-tionsverfahrens besteht darin, einen Ausdruck mit der Variablen x auf geeignete Weise durch eine neue Variablezu ersetzen, um dadurch ein einfacher zu losendes Integral (evtl. sogar ein Grundintegral) zu erhalten. Das nach-folgende Beispiel soll dieses Prinzip verdeutlichen (zunachst anhand eines unbestimmten Integrals).

Beispiel 5.5: Zu berechnen ist das Integralˆ √

2x+ 1 dx.

In diesem Fall bietet sich die Substitution u = 2x + 1 an. Grundsatzlich ist bei der Anwendung von Substitu-tionen zu beachten, dass auch das ”alte“ Differential dx durch die ”neue“ Variable u und deren Differential duausgedruckt werden muss. Im vorliegenden Fall ist die folgende Rechnung auszufuhren:

u = 2x+ 1 ⇒ du

dx= 2 ⇒ du

2= dx

(d.h. Differentiation von u nach x gemaß der Ableitungsregeln und anschließendes Umstellen nach dx). DurchEinsetzen in das zu berechnende Integral ergibt sich schließlich:ˆ √

2x+ 1 dx =

ˆ √u · du

2=

1

2

ˆu1/2 du =

1

2· 2

3u3/2 + C ,

und nachdem die Substitution ruckgangig gemacht wurde:ˆ √2x+ 1 dx =

1

3(2x+ 1)3/2 + C .

Die allgemeine Vorgehensweise bei der Integration durch Substitution lasst sich wie folgt beschreiben.

Vorgehensweise bei der Berechnung eines Integrals mittels einer geeigneten Substitution

1) Aufstellung der Substitutionsgleichungen

u = g(x) ,du

dx= g′(x) , dx =

du

g′(x)

2) Durchfuhrung der Integralsubstitution durch Einsetzen der Substitutionsgleichungen in das

vorgegebene (unbestimmte) Integralˆf(x) dx :

ˆf(x) dx =

ˆϕ(u) du .

Das neue Integral enthalt nur noch die neue Variable u und deren Differential du.Der neue Integrand ist die Funktion ϕ(u).

3) Integration (nach u):ˆϕ(u) du = Φ(u) + C wobei Φ(u) eine Stammfunktion von ϕ(u) ist, d.h. Φ′(u) = ϕ(u)

4) Rucksubstitution:ˆf(x) dx = Φ(u) + C = Φ(g(x)) + C = F (x) + C

Erganzung zu Beispiel 5.5:In diesem Beispiel war: g(x) = 2x+ 1, ϕ(u) = 1

2

√u, Φ(u) = 1

3 u3/2, F (x) = 1

3(2x+ 1)3/2 .

7

Besonders vorteilhaft ist die Anwendung des Substitutionsverfahrens bei Integranden von folgender Form:f(g(x))·g′(x) (d.h. der Integrand ist eine verkettete Funktion, multipliziert mit ihrer inneren Ableitung)

oder f(x) · f ′(x) (d.h. der Integrand ist das Produkt aus einer Funktion und ihrer Ableitung).

In dem nachfolgenden Beispiel wird dies deutlich.

Beispiel 5.6:

Im folgenden sind einige haufig verwendete Substitutionen zusammengestellt.3

Einige Standard-Substitutionen bei der Berechnung von IntegralenMit R(a, b, . . .) wird ein rationaler Ausdruck in a, b bezeichnet.

Integraltyp Substitution Integraltyp Substitution

ˆf(ax+ b) dx u = ax+ b

ˆR(sinhx, coshx) dx u = ex

ˆf(x) · f ′(x) dx u = f(x)

ˆR

(x,

n√ax+ b

)dx u = n

√ax+ b

ˆf ′(x)

f(x)dx u = f(x)

ˆR

(x,√a2 + x2

)dx x = a · sinhu

ˆf(g(x)) · g′(x) dx u = g(x)

ˆR

(x,√x2 − a2

)dx x = a · coshu

ˆR(sinx, cosx) dx u = tan

(x2

) ˆR

(x,√a2 − x2

)dx x = a · sinu

In der vorangegangenen Tabelle sind auch Substitutionen vom Typ x = h(u) aufgefuhrt. In diesen Fallen lautendie Substitutionsgleichungen:

x = h(u) ,dx

du= h′(u) , dx = h′(u)du.

Die weitere Vorgehensweise ist vollig analog zu dem Fall, dass eine Substitution der Form u = g(x) vorgenom-men wurde (siehe vorige Seite).

Beispiel 5.7:

3Weitere Substitutionen sind zu finden in: H.J. BARTSCH, Taschenbuch Mathematischer Formeln fur Ingenieure und Naturwissen-schaftler, 23. Auflage (2014), S. 476-478.

8

Schließlich wird noch die Berechnung bestimmter Integrale mittels Substitution anhand eines Beispiels erlautert.

Beispiel 5.8:

Zu berechnen ist das bestimmte Integral2ˆ

0

e4−3x dx.

Zwei prinzipielle Vorgehensweisen sind moglich:1) Stammfunktion mittels Substitution ermitteln (d.h. unbestimmte Integration), erst anschließend die Grenzen

einsetzen

2) Bestimmte Integration mit substituierten Grenzen

zu 1): Mittels Substitution u = 4− 3x erhalt man fur das zugehorige unbestimmte Integral:

du

dx= −3 ⇒ dx = −du

3⇒ˆ

e4−3x dx = −1

3

ˆeu du = −1

3eu + C

Nach Rucksubstitution (in diesem Fall unbedingt erforderlich!) und Einsetzen der Grenzen fur die Inte-grationsvariable x erhalt man:

0

e4−3x dx =

[−1

3e4−3x

]2

0

=1

3(e4 − e−2) ≈ 18.1543 .

zu 2): Substitution der Integrationsvariablen wie bei 1), zusatzlich Substitution der Integrationsgrenzen:x1 = 0 wird durch u1 = 4− 3x1 = 4 und x2 = 2 wird durch u2 = 4− 3x2 = −2 ersetzt. Dann gilt:

0

e4−3x dx = −1

3

−2ˆ

4

eu du =1

3(e4 − e−2) ≈ 18.1543 .

5.2.2 Partielle Integration (”Produktintegration“)

Zur Herleitung der Formel fur dieses Integrationsverfahren geht man von der Produktregel fur die Differentiationeiner Funktion aus (siehe dazu auch Abschnitt 4.1.1 im Skript Mathematik 1):

d

dx(u(x) · v(x)) = u′(x) · v(x) + u(x) · v′(x)

Nach Subtraktion des Terms u′(x) · v(x) auf beiden Seiten dieser Gleichung und anschließender Integrationbeider Seiten der Gleichung nach x erhalt man:ˆ

d

dx(u(x) · v(x)) dx−

ˆu′(x) · v(x) dx =

ˆu(x) · v′(x) dx ,

und nach Auflosung des ersten Integrals auf der linken Seite ergibt sich schließlich die Formel fur die partielleIntegration.

Formel fur die partielle Integration:ˆu(x) · v′(x) dx = u(x) · v(x)−

ˆu′(x) · v(x) dx (67)

Zur Durchfuhrung der partiellen Integration ist es erforderlich, dass die zu integrierende Funktionals Produkt u(x) · v′(x) dargestellt wird. Dabei ist v′(x) die Ableitung einer (zunachst noch unbekannten)Funktion v(x).

Da die partielle Integration das Auffinden einer Stammfunktion zu einer gegebenen Funktion erleichtern soll,sind folgende Voraussetzungen bei der Anwendung dieses Integrationsverfahrens zu beachten:

(I) Zu v′(x) kann problemlos die Stammfunktion v(x) gefunden werden.

(II) Das Integralˆu′(x)v(x) dx ist elementar losbar (oder mit Hilfe anderer Integrationsverfahren,

z.B. Substitution).9

Eine geeignete Wahl der Faktorzerlegung u(x)v′(x) hat wesentlichen Einfluss auf das Erfulltsein dieser Voraus-setzungen.

Beispiel 5.9:

In manchen Fallen muss die partielle Integration mehrfach nacheinander angewendet werden, wie das folgendeBeispiel zeigt.

Beispiel 5.10:

Zu berechnen ist das Integralˆx2 · cosx dx .

Mit u = x2, v′ = cosx⇒ u′ = 2x, v = sinx ergibt sich nach Anwendung der Formel (67):ˆx2 · cosx dx = x2 · sinx−

ˆ2x · sinx dx = x2 · sinx− 2

ˆx · sinx dx . (68)

Das auf der rechten Seite dieser Gleichung entstandene Integral ist jedoch noch kein Grundintegral.

Eine nochmalige Anwendung der partiellen Integration, diesmal auf das Integralˆx · sinx dx, fuhrt zum Ziel.

Man wahlt: u = x, v′ = sinx ⇒ u′ = 1, v = − cosx und erhalt:ˆx · sinx dx = −x · cosx−

ˆ(−1 · cosx) dx = −x · cosx+ sinx+ C1 .

Zusammen mit (68) ergibt sich schließlich fur das gesuchte Integral:ˆx2 · cosx dx = x2 · sinx− 2 (−x · cosx+ sinx+ C1) = x2 · sinx+ 2x · cosx− 2 sinx+ C2

(mit C2 = −2C1; C1, C2 ∈ R).

Bemerkungen:

- Integrale der Formˆxn · cosx dx ,

ˆxn · sinx dx oder

ˆxn · ex dx konnen durch n-malige partielle

Integration gelost werden (analog zu Beispiel 5.10, wo der Fall n = 2 betrachtet wurde).- Die Formel der partiellen Integration gilt sinngemaß auch fur bestimmte Integrale. Sie lautet dann:

a

f(x) dx =

a

u(x) · v′(x) dx =[u(x) · v(x)

]ba−

a

u′(x) · v(x) dx .

Eine weitere Anwendung der partiellen Integration ist der sogenannte Ruckwurf. Durch einmalige oder mehr-malige partielle Integration und geeignete Umformungen wird das gesuchte Integral so reproduziert, dass diegewonnene Beziehung nach diesem Integral aufgelost werden kann. In dem folgenden Beispiel wird diese Me-thode genutzt.

Beispiel 5.11:

Das Integralˆ

sin2 x dx soll berechnet werden.

Mit u = sinx, v′ = sinx und u′ = cosx, v = − cosx ergibt sich nach Anwendung der Formel fur die partielleIntegration:ˆ

sin2 x dx = sinx · (− cosx)−ˆ

cosx · (− cosx) dx = − sinx · cosx+

ˆcos2 x dx. (69)

Eine nochmalige partielle Integration fuhrt nicht zum Ziel, weil dadurch nur die triviale Identitatˆsin2 x dx =

ˆsin2 x dx entstehen wurde. Jedoch kann die trigonometrische Beziehung sin2 x+ cos2 x = 1

genutzt werden, um die Beziehung (69) wie folgt umzuformen:ˆsin2 x dx = − sinx · cosx+

ˆ(1− sin2 x) dx = − sinx · cosx+ x+ C1 −

ˆsin2 x dx .

Auf der rechten Seite dieser Gleichung hat sich das gesuchte Integral zwar reproduziert, aber mit dem Vorfak-tor −1. Daher kann diese Gleichung nach dem gesuchten Integral aufgelost werden:

2

ˆsin2 x dx = − sinx · cosx+ x+ C1 ⇒

ˆsin2 x dx = −1

2sinx · cosx+

x

2+ C2

(mit C2 = 12 C1; C1, C2 ∈ R).

10

5.2.3 Integration durch Partialbruchzerlegung

Die bisher betrachteten Integrationsverfahren fuhren bei der Integration gebrochenrationaler Funktionen (sieheAbschnitt 3.2.3, Punkt 2) im Skript Mathematik 1) nur in speziellen Fallen zum Ziel.Wenn es sich bei der zu integrierenden Funktion um eine unecht gebrochenrationale Funktion handelt, so kanndiese zunachst als Summe eines Polynoms und einer echt gebrochenrationalen Funktion dargestellt werden. DerPolynom-Anteil kann elementar integriert werden (Integration von Potenzfunktionen). Fur den echt gebrochen-rationalen Anteil kann die Partialbruchzerlegung (im folgenden kurz ”PBZ “ genannt) angewendet werden. DieGrundidee der PBZ besteht darin, die echt gebrochenrationale Funktion als Summe einfacherer Bruche (soge-nannter Partialbruche) darzustellen, welche dann leichter zu integrieren sind.Zunachst wird diese Vorgehensweise anhand eines Beispiels erlautert und anschließend allgemein beschrieben.

Beispiel 5.12:

Berechnung des Integralsˆ

5x+ 11

x2 + 3x− 10dx mittels PBZ:

Der Integrand ist eine echt gebrochenrationale Funktion, d.h. es kann sofort mit der PBZ begonnen werden.Zunachst wird eine Produktdarstellung des Nenners des Bruches (vgl. dazu auch Formel (53) aus Abschnitt 3.2.3im Skript Mathematik 1) ermittelt. Der Nenner x2 + 3x − 10 besitzt die Nullstellen x1 = 2 und x2 = −5 ⇒x2 + 3x− 10 = (x− 2)(x+ 5) ist die gesuchte Produktdarstellung.Die Faktoren dieser Produktdarstellung werden unmittelbar fur den Ansatz der PBZ genutzt:

5x+ 11

x2 + 3x− 10=

5x+ 11

(x− 2)(x+ 5)=

A1

x− 2+

A2

x+ 5, (70)

wobei die reellen Koeffizienten A1 und A2 zunachst noch unbekannt sind. Das nachste Ziel wird sein, dieseKoeffizienten zu berechnen. Dazu wird die rechte Seite der Gleichung (70) auf den Hauptnenner (x− 2)(x+ 5)(Nenner des Integranden) gebracht:

5x+ 11

(x− 2)(x+ 5)=A1(x+ 5) +A2(x− 2)

(x− 2)(x+ 5)

und nach Multiplikation mit diesem Hauptnenner entsteht die Gleichung

5x+ 11 = A1(x+ 5) +A2(x− 2) . (71)

Da diese Gleichung fur beliebiges x ∈ R gelten muss, kann durch Einsetzen spezieller Werte fur x eine Berech-nung der Koeffizienten A1 und A2 erfolgen. Als vorteilhaft erweist es sich, genau die Nullstellen des Nennersdes Integranden einzusetzen, weil dann auf der rechten Seite der Gleichung (71) jeweils ein Term entfallt. Manerhalt

fur x = 2 : 21 = A1 · 7 +A2 · 0 = 7A1 ⇒ A1 = 3 ,

fur x = −5 : −14 = A1 · 0 +A2 · (−7) = −7A2 ⇒ A2 = 2 .

Einsetzen der soeben berechneten Koeffizienten in den Ansatz (70) liefert:

5x+ 11

(x− 2)(x+ 5)=

3

x− 2+

2

x+ 5,

d.h. es giltˆ

5x+ 11

x2 + 3x− 10dx =

ˆ5x+ 11

(x− 2)(x+ 5)dx =

ˆ (3

x− 2+

2

x+ 5

)dx = 3

ˆdx

x− 2+ 2

ˆdx

x+ 5.

Die beiden Integrale auf der rechten Seite dieser Gleichung lassen sich mittels Substitution berechnen (das ersteIntegral mit der Substitution u = x− 2, das zweite mit u = x+ 5, siehe dazu Abschnitt 5.2.1), und man gelangtso zu dem Resultat:ˆ

5x+ 11

x2 + 3x− 10dx = 3 ln |x− 2|+ 2 ln |x+ 5|+ C (C ∈ R).

11

Fur die Integration gebrochenrationaler Funktionen kann allgemein die folgende Vorgehensweise angewendetwerden.

Berechnung des Integralsˆf(x) dx mit einer gebrochenrationalen Funktion f(x)

Falls f(x) =g(x)

h(x)echt gebrochenrational ist, kann sofort mit Schritt 1 begonnen werden.

Anderenfalls wird zuerst mittels Polynomdivision die Darstellung f(x) = p(x) +g(x)

h(x)

ermittelt, wobei p(x): Polynom,g(x)

h(x): echt gebrochenrationale Funktion.

Die folgenden Schritte der PBZ werden nur mitg(x)

h(x)durchgefuhrt.

Schritt 1: Produktdarstellung des Nenners h(x) mittels Berechnung der reellen Nullstellen des Nenners(Faktoren der Form (x− xi)ki bzw. (x2 + pix+ qi)

li , ki, li ≥ 1)

Schritt 2: Aufstellen des Partialbruchansatzes(unter Berucksichtigung der Vielfachheit der Nullstellen)

Schritt 3: Berechnung der Koeffizienten im Partialbruchansatz

Schritt 4: Einsetzen der gefundenen Koeffizienten in den Ansatz und Integration der Partialbruchemit Hilfe bekannter Integrationsregeln

Schritt 5: Summation aller Teilresultate

Bemerkung:Eine alternative Moglichkeit zur Berechnung von A1 und A2 im Beispiel 5.12 besteht darin, die Terme auf derrechten Seite der Gleichung (71) auszumultiplizieren, dann soweit wie moglich zusammenzufassen und einenKoeffizientenvergleich durchzufuhren. Man wurde bei dieser Vorgehensweise erhalten:

5x+ 11 = A1x+ 5A1 +A2x− 2A2 = (A1 +A2)x+ 5A1 − 2A2 .

Der Vergleich der Koeffizienten von x auf beiden Seiten der Gleichung ergibt: 5 = A1 + A2 und der Vergleichder Koeffizienten von x0 (Absolutglieder) auf beiden Seiten der Gleichung liefert: 11 = 5A1 − 2A2 . Dasaus diesen beiden Gleichungen gebildete lineare Gleichungssystem besitzt die Losung A1 = 3, A2 = 2 (vgl.Beispiel 5.12).

12

Beim Aufstellen des Ansatzes fur die PBZ sind die Art und die Vielfachheit der Nullstellen des Nenners desIntegranden zu beachten. Dabei werden die folgenden Falle unterschieden.

Fallunterscheidung fur die Ansatze bei der Partialbruchzerlegung vong(x)

h(x)

1. Fall: Das Nennerpolynom h(x) hat nur einfache reelle Nullstellen.Es gilt die Darstellung: h(x) = (x− x1)(x− x2) · . . . · (x− xn).Der zugehorige Ansatz fur die PBZ lautet:

g(x)

h(x)=

A1

x− x1+

A2

x− x2+ . . .+

Anx− xn

.

Die Integration fur jeden dieser Summanden liefert (dabei bezeichnet C die Integrationskonstante) :ˆ

Aix− xi

dx = Ai · ln |x− xi|+ C (i = 1, 2, . . . , n).

2. Fall: Das Nennerpolynom h(x) hat auch mehrfache reelle Nullstellen.Sei xm eine reelle Nullstelle der Vielfachheit k, d.h. h(x) enthalt den Faktor (x− xm)k, k ≥ 2.Dieser mehrfachen reellen Nullstelle entsprechen im Ansatz die Summanden

B1

x− xm+

B2

(x− xm)2+ . . .+

Bk(x− xm)k

.

Fur jede weitere reelle Nullstelle mit Vielfachheit ≥ 2 wird analog vorgegangen.Die Integration dieser Summanden (außer fur den ersten, der im 1. Fall erlautert wurde) ergibt:ˆ

Bi(x− xm)i

dx =Bi

1− i· (x− xm)−i+1 + C =

Bi1− i

· 1

(x− xm)i−1+ C (i = 2, 3, . . . , k).

3. Fall: Das Nennerpolynom h(x) enthalt einfache komplexe Nullstellen, d.h. in der Produktdarstellungdes Nenners treten Faktoren der Form (x2 + pix+ qi) auf, die keine reelle Nullstelle besitzen.Jedem derartigen Faktor entspricht im Ansatz ein Summand der Form:

Cix+Di

x2 + pix+ qi(linearen Term im Zahler beachten!).

Die Integration dieser Summanden kann ggf. sofort mittels Substitution (siehe Beispiel 5.14) erfolgen,anderenfalls muss zunachst eine geeignete Zerlegung der linearen Terme im Zahler durchgefuhrt werden.

4. Fall: Das Nennerpolynom h(x) enthalt mehrfache komplexe Nullstellen, d.h. in derProduktdarstellung des Nenners treten Faktoren der Form (x2 + pix+ qi)

l mit l ≥ 2 auf, die keinereelle Nullstelle besitzen.Einem solchen Faktor entsprechen im Ansatz fur die PBZ die Summanden

E1x+ F1

x2 + pix+ qi+

E2x+ F2

(x2 + pix+ qi)2+ . . .+

Elx+ Fl(x2 + pix+ qi)l

.

Fur jede weitere komplexe Nullstelle mit Vielfachheit ≥ 2 wird analog vorgegangen. Die Integrationder o.g. Terme kann mit Hilfe von Rekursionsformeln erfolgen.

Beispiel 5.13:

Beispiel 5.14:

13

5.2.4 Numerische Integration

Die Zielstellung der numerischen Integration besteht darin, eine Berechnung bestimmter Integrale mittels Nahe-rungsformeln durchzufuhren, wenn die exakte Berechnung sehr kompliziert oder sogar unmoglich ist.

Der Wert des bestimmten Integralsbˆ

a

f(x) dx entspricht bekanntlich dem Inhalt der Flache unter der Funktions-

kurve von f(x) im Intervall [a, b] (siehe dazu Abschnitt 5.1.2). Die Grundidee der numerischen Integration be-steht darin, die zu berechnende Flache in Teilflachen zu unterteilen und jede Teilflache durch eine einfacher zuberechnende Flache zu ersetzen. Im folgenden werden zwei Formeln zur numerischen Integration vorgestellt:die Trapezformel und die Simpsonsche Formel.Bei der Herleitung der Trapezformel wird wie folgt vorgegangen:

- Die Flache unter der Kurve f(x) wird in n Streifen gleicher Breite: h =b− an

unterteilt

(n: vorgegebene Zahl; Bild 5.3 zeigt eine Unterteilung in n = 4 Streifen).

- Die krummlinige Begrenzung der Flachenstreifen wird jeweils durch die zugehorige Sehne ersetzt.⇒ Es entstehen n Trapezflachen.

- Der Flacheninhalt des k-ten Trapezes Tk (k = 1, 2, . . . , n) berechnet sich nach:

ATk =f(xk) + f(xk−1)

2h =

yk + yk−1

2h

- Die Summation aller Trapezflachen ergibt die Trapezformel:

IT =h

2(y0 + 2y1 + . . .+ 2yn−1 + yn)

(Bei der Summation kommen alle Werte y1, y2, . . . , yn−1 genau zweimal vor, die ”Randwerte“ y0 = f(a)und yn = f(b) hingegen nur einmal.)

Bild 5.3

Die Trapezformel zur naherungsweisen Berechung des bestimmten Integrals I =

a

f(x) dx

IT =h

2(y0 + 2y1 + . . .+ 2yn−1 + yn) , (72)

wobei n : Anzahl der Streifen (Teilintervalle auf der x-Achse), h =b− an

: Streifenbreite

und yi = f(xi) (i = 0, 1, . . . , n), x0 = a, xi = a+ ih, xn = b

14

Beispiel 5.15a):

Das Integral2ˆ

1

dx

xsoll mittels der Trapezformel (72) mit n = 8 naherungsweise berechnet werden.

Diese lautet im genannten Fall:

IT =1

16(y0 + 2y1 + . . .+ 2y7 + y8) ,

da h =b− an

=2− 1

8gilt. Die benotigten Werte xk und die zugehorigen Funktionswerte yk (jeweils auf

6 Nachkommastellen gerundet) sind in der nachfolgenden Tabelle zusammengestellt:

k xk yk = f(xk) = 1xk

0 1.000 1.000000

1 1.125 0.888889

2 1.250 0.800000

3 1.375 0.727273

4 1.500 0.666667

5 1.625 0.615385

6 1.750 0.571429

7 1.875 0.533333

8 2.000 0.500000

Man erhalt das Resultat: IT = 0.694122. Das betrachtete Integral kann auch exakt berechnet werden (Stamm-funktion: ln |x| ), in diesem Fall lautet das (wiederum auf 6 Nachkommastellen gerundete) Ergebnis:I = 0.693147. Fur den Fehler bei der naherungsweisen Berechnung des Integrals gilt daher:|IT − I| = 9.75 · 10−4 ≈ 10−3.

Um die Simpsonsche Formel zu erhalten, wird eine gerade Anzahl n von Teilintervallen gewahlt und wiederumeine Unterteilung der zu berechnenden Flache in n gleichbreite Streifen vorgenommen. Dann werden jeweilszwei benachbarte Streifen zusammengefasst und die krummlinige Begrenzung dieser Flachenstreifen wird je-weils durch ein Parabelstuck ersetzt. Anschließend wird exakt integriert, d.h. die Flacheninhalte unter den Para-belstucken werden exakt berechnet.

Die Simpsonsche Formel zur naherungsweisen Berechung des bestimmten Integrals I =

a

f(x) dx

IS =h

3[ y0 + 4(y1 + y3 + . . .+ yn−1) + 2(y2 + y4 + . . .+ yn−2) + yn] (73)

(innerhalb der Klammer mit dem Vorfaktor 4 stehen alle yk mit ungeradem Index k und innerhalbder Klammer mit dem Vorfaktor 2 alle yk mit geradem Index k, außer y0 und yn).Weiterhin gelten wieder die folgenden Bezeichnungen:

n : Anzahl der Streifen (Teilintervalle auf der x-Achse), h =b− an

: Streifenbreite

und yi = f(xi) (i = 0, 1, . . . , n), x0 = a, xi = a+ ih, xn = b.

Beispiel 5.15b):Das im Beispiel 5.15a) betrachtete Integral soll nun mit Hilfe der Simpsonschen Formel (73) naherungsweiseberechnet werden. Diese lautet im genannten Fall:

IS =1

24[ y0 + 4(y1 + y3 + y5 + y7) + 2(y2 + y4 + y6) + y8) ] ,

da h =b− an

=2− 1

8gilt. Die benotigten Werte xk und die zugehorigen Funktionswerte yk sind dieselben wie

15

in der Tabelle im Beispiel 5.15a). Die Berechnung ergibt: IS = 0.693155 , womit der Fehler |IS−I| = 8 ·10−6

betragt, d.h. die Simpsonsche Regel hat fur dieses Beispiel einen genaueren Wert als die Trapezregel geliefert(diese Aussage gilt auch allgemein, siehe Bemerkungen).

Bemerkungen:

- Der mit der Naherungsformel (Trapezformel oder Simpsonsche Formel) berechnete Wert lasst sich verbes-sern, indem die Anzahl n der Teilintervalle vergroßert wird. Fur n → ∞ streben die Naherungswerte gegenden exakten Wert des Integrals.

- Der Fehler bei Verwendung der Trapezformel liegt in der Großenordnung von h2, bei der SimpsonschenFormel in der Großenordnung von h4.

- Die numerische Integration ist auch dann geeignet, wenn die zu integrierende Funktion nicht in geschlossenerForm vorliegt (sondern z.B. nur als Messwerte an einzelnen Stellen).

- Weitere Formeln fur die numerische Integration sind z.B. in: H.J. BARTSCH, Taschenbuch MathematischerFormeln fur Ingenieure und Naturwissenschaftler, 23. Auflage (2014), Abschnitt 9.4 zu finden.

16

5.3 Einige Anwendungen der Integralrechnung

5.3.1 Flacheninhalt ebener Bereiche

Im Abschnitt 5.1.2 wurde das bestimmte Integral als Flacheninhalt A zwischen der Kurve einer Funktion f(x)und der x-Achse in einem vorgegebenen Intervall [a, b] definiert. Dabei wurde jedoch zunachst vorausgesetzt,dass diese Funktion in [a, b] nur positive Werte annimmt, d.h. dass ihre Kurve vollstandig oberhalb der x-Achseverlauft. Betrachtet man nun eine Funktion, deren Kurve in dem betrachteten Intervall vollstandig unterhalb der

x-Achse liegt, so wurde das bestimmte Integralbˆ

a

f(x) dx einen negativen Wert haben und daher nicht der

Maßzahl des Flacheninhaltes zwischen der Funktionskurve von f(x) und der x-Achse entsprechen. In solchenFallen kann der Flacheninhalt wie folgt berechnet werden:

A =

a

|f(x)| dx =

∣∣∣∣∣∣bˆ

a

f(x) dx

∣∣∣∣∣∣ (74)

(anschaulich: die Flache wird an der x-Achse gespiegelt).Im folgenden werden weitere Falle betrachtet, wo bestimmte Integrale zur Berechnung von Flacheninhaltenangewendet werden konnen.

Flacheninhalt eines ebenen Bereiches, der von zwei Kurven begrenzt wirdSeien f1(x) und f2(x) auf dem Intervall [a, b] integrierbare Funktionen und es gelte f1(x) ≤ f2(x).Der Bereich B sei gegeben durch: B = a ≤ x ≤ b ; f1(x) ≤ y ≤ f2(x) (siehe Bild 5.4).Dann gilt fur den Flacheninhalt dieses Bereiches:

AB =

a

[ f2(x)− f1(x)] dx . (75)

-

6y

x

f2(x)

f1(x)

B

ba0-

6y

xba0 x1 x2 x3

f2(x)

f1(x)

BB

Bild 5.4 Bild 5.5

Die Voraussetzung, dass die Differenz f2(x) − f1(x) nicht negativ werden darf, wird nun fallengelassen. MitHilfe der Formel (74) erhalt man fur den Fall, dass der Bereich B durch die Geraden x = a und x = b sowie dieKurven der (auf [a, b] integrierbaren) Funktionen f1(x) und f2(x) begrenzt wird:

AB =

∣∣∣∣∣∣x1ˆ

a

[ f2(x)− f1(x)] dx

∣∣∣∣∣∣+

∣∣∣∣∣∣x2ˆ

x1

[ f2(x)− f1(x)] dx

∣∣∣∣∣∣+ . . .+

∣∣∣∣∣∣bˆ

xn

[ f2(x)− f1(x)] dx

∣∣∣∣∣∣ . (76)

Dabei sind mit x1, x2, . . . , xn die Abszissen der im Intervall [a, b] gelegenen Schnittpunkte der Kurven vonf1(x) und f2(x) bezeichnet, siehe Bild 5.5.

Beispiel 5.16:

17

5.3.2 Bogenlange einer ebenen Kurve

Eine weitere wichtige Anwendung der Integralrechnung ist die Berechnung der Lange einer im Intervall [a, b]gegebenen Funktionskurve.

Berechnung der Bogenlange einer ebenen KurveSeien f(x) und ihre erste Ableitung f ′(x) im Intervall [a, b] stetig. Dann kann die Lange Sder Kurve y = f(x) nach der Formel

S =

a

√1 + [f ′(x)]2 dx =

a

√1 + y′2 dx (77)

berechnet werden.Falls die Kurve in Parameterdarstellung: x = x(t), y = y(t), t1 ≤ t ≤ t2 (siehe dazu Abschnitt 3.2.1im Skript Mathematik 1) gegeben ist, gilt:

S =

t2ˆ

t1

√[x(t)]2 + [y(t)]2 dt =

t2ˆ

t1

√x2 + y2 dt , (78)

wobei x(t) und y(t) sowie ihre ersten Ableitungen als stetig vorausgesetzt werden und außerdem[x(t)]2 + [y(t)]2 6= 0 fur alle t ∈ [t1, t2] gelten muss.

(Fur eine Herleitung dieser Formeln sei auf die folgende Literaturstelle verwiesen: A. FETZER, H. FRANKEL.Mathematik 2: Lehrbuch fur ingenieurwissenschaftliche Studiengange, 6. Auflage, S. 22-24.)

Beispiel 5.17:

Erganzend sei bemerkt, dass die Integrale in (77) bzw. (78) auf Grund des auftretenden Wurzelausdrucks haufignicht auf elementarem Weg losbar sind. Als Ausweg dienen dann die im Abschnitt 5.2.4 eingefuhrten Methodenzur numerischen Integration.

5.3.3 Volumen und Mantelflache von Rotationskorpern

Wahrend bei sehr einfachen Rotationskorpern (wie z.B. Kreis-zylinder, Kreiskegel, Kreiskegelstumpf) eine Berechnung desVolumens und der Mantelflache mittels elementarer Formelnmoglich ist, muss bei allgemeineren rotationssymmetrischenKorpern auf die Integralrechnung zuruckgegriffen werden.Zunachst wird die Situation betrachtet, dass die Kurve einerFunktion y = f(x) in einem gewissen Intervall um die x-Achserotiert (vgl. Bild 5.6).

6

-x

y

a b

f(x)

Bild 5.6

Berechnung des Volumens eines RotationskorpersDurch Rotation der Flache zwischen der Kurve der Funktion y = f(x) und den Geraden x = a sowiex = b um die x-Achse entsteht ein Rotationskorper mit dem Volumen

Vx = π ·bˆ

a

[f(x)]2 dx = π ·bˆ

a

y2 dx . (79)

Berechnung der Mantelflache eines RotationskorpersDie Mantelflache des entstehenden Rotationskorpers lasst sich mit Hilfe der folgenden Formel berech-nen:

AMx = 2π ·bˆ

a

f(x) ·√

1 + [f ′(x)]2 dx = 2π ·bˆ

a

y ·√

1 + y′2 dx . (80)

18

Eine Herleitung der genannten Formeln findet man z.B. in: L. PAPULA. Mathematik fur Ingenieure und Natur-wissenschaftler (Band 1), 12. Auflage, S. 513 - 514 und S. 521 - 522.

Beispiel 5.18:

Bemerkung:Wenn eine Flache, welche von der Kurve x = g(y) und den Geraden y = c sowie y = d begrenzt wird, um diey-Achse rotiert, dann entsteht ein Rotationskorper mit dem Volumen

Vy = π ·dˆ

c

[ g(y)]2 dy = π ·dˆ

c

x2 dy . (81)

Die Mantelflache dieses Rotationskorpers kann nach der Formel

AMy = 2π ·dˆ

c

g(y) ·√

1 + [ g′(y)]2 dy = 2π ·dˆ

c

x ·√

1 + x′2 dy (82)

berechnet werden.Wenn die Gleichung der rotierenden Kurve in der Form y = f(x) vorliegt, dann muss zunachst eine Auflosungdieser Gleichung nach x vorgenommen werden, um die Formeln (81) und (82) anwenden zu konnen.

5.3.4 Schwerpunkt homogener ebener Bereiche

Im weiteren wird vorausgesetzt, dass die betrachteten Bereiche homogen sind, d.h. eine konstante Dichte besit-zen. Dann fallt der Massenschwerpunkt mit dem Flachenschwerpunkt (d.h. dem geometrischen Schwerpunkt)zusammen.

Berechnung des Schwerpunktes eines homogenen ebenen BereichesDer ebene Bereich B sei gegeben durch: B = a ≤ x ≤ b ; f1(x) ≤ y ≤ f2(x) , wobei auf demgesamten Intervall [a, b] gelte: f1(x) ≤ f2(x) (siehe dazu auch Bild 5.4).Die Koordinaten xS und yS des Schwerpunktes dieses Bereiches konnen nach den folgenden Formelnberechnet werden:

xS =1

AB·

a

x · [ f2(x)− f1(x)] dx , yS =1

2AB·

a

[ (f2(x))2 − (f1(x))2 ] dx . (83)

Dabei bezeichnet AB den Flacheninhalt des Bereiches B, welcher gemaß (75) zu ermitteln ist.

Beispiel 5.19:

5.3.5 Mechanische Arbeit (Arbeit einer Kraft)

Die Berechnung der von einer Kraft verrichteten Arbeit ist auf elementare Weise moglich, wenn es sich um einekonstante Kraft handelt, die entlang eines geradlinigen Weges wirkt. Ist die Kraft jedoch ortsabhangig (bzw.wegabhangig), erfolgt die Berechnung der geleisteten Arbeit mit Hilfe der Integralrechnung.

Berechnung der mechanischen ArbeitDie Kraft ~F wirke in Richtung eines geradlinigen Weges und ihr Betrag F sei darstellbar als eine stetigeFunktion F = F (x) (x: Abstand des Angriffspunktes der Kraft von einem festen Punkt 0). Dann gilt furdie Arbeit, die von der Kraft auf dem Weg von x = a nach x = b geleistet wird:

W =

a

F (x) dx . (84)

(Fur eine Herleitung dieser Formel sei auf die folgende Literaturstelle verwiesen: A. FETZER, H. FRANKEL.Mathematik 2: Lehrbuch fur ingenieurwissenschaftliche Studiengange, 6. Auflage, S. 82-83.)

Beispiel 5.20:19

5.4 Fourier-Reihen

In Naturwissenschaften und Technik spielen periodische Vorgange haufig eine Rolle. Ein einfaches Beispielist die harmonische Schwingung eines mechanischen oder elektromagnetischen Schwingungssystems, die sichdurch eine Sinusfunktion beschreiben lasst. Jedoch gibt es auch periodische Vorgange (Funktionen), die nicht mitHilfe einer einzelnen Sinus- oder Kosinusfunktion dargestellt werden konnen. In diesen Fallen versucht man, dieFunktion als Summe (Uberlagerung) harmonischer Schwingungen mit verschiedenen Frequenzen darzustellen.Dies geschieht mit Hilfe von Fourier-Reihen.

5.4.1 Entwicklung einer periodischen Funktion in eine Fourier-Reihe

Zunachst werden Beispiele fur periodische Funktionen, welche in der Elektrotechnik vorkommen, vorgestellt.

Beispiel 5.21:Kippschwingung (Kippspannung)

-

6

u(t)

t

u

r r r r0 T 2T 3T 4T

Sinusimpuls eines Einweggleichrichters

-

6u(t)

t

u

0 T/2 T 3T/2 2T 5T/2

Die beiden im Beispiel 5.21 betrachteten Funktionen besitzen die Eigenschaft, dass sich der im Intervall [0, T )vorliegende Funktionsverlauf in den Intervallen [T, 2T ), [2T, 3T ) usw. wiederholt, d.h. es gilt f(t) = f(t+ T )fur alle t ∈ R, t ≥ 0. Die betrachteten Funktionen sind periodisch4 mit der Periode p = T .Bei der Einfuhrung der Fourier-Reihen werden zunachst Funktionen f(x) mit der Periode p = 2π betrachtet.Alle diese Funktionen besitzen die Eigenschaft f(x) = f(x + 2π) fur alle x ∈ D(f). Spater werden Fourier-Reihen fur Funktionen mit beliebiger Periode betrachtet.

Definition 5.3: Die Fourier-Reihe einer periodischen Funktion f(x) mit der Periode 2π ist gegeben durch:

a0

2+∞∑k=1

(ak cos(kx) + bk sin(kx)) . (85)

Die Fourier-Reihe wird auch als trigonometrische Reihe bezeichnet.Die Fourier-Koeffizienten ak und bk aus (85) werden nach den folgenden Formeln berechnet:

ak =1

π

2πˆ

0

f(x) cos(kx) dx fur k = 0, 1, 2, . . .

(86)

bk =1

π

2πˆ

0

f(x) sin(kx) dx fur k = 1, 2, 3, . . . .

Zunachst erfolgt eine formale Zuordnung der Fourier-Reihe zu der Funktion f(x), die in der Form

f(x) ∼ a0

2+

∞∑k=1

(ak cos(kx) + bk sin(kx)) (87)

geschrieben werden kann.

Die Frage, unter welchen Bedingungen in der letztgenannten Beziehung anstelle von ”∼“ das Gleichheitszeichenstehen darf, wird spater erlautert. Zunachst wird ein Beispiel fur die Berechnung von Fourier-Reihen betrachtet.

4zum Thema Periodizitat von Funktionen siehe auch: Abschnitt 3.2.2 im Skript Mathematik 1

20

Beispiel 5.22:Gegeben ist die 2π-periodische Funktion (Sagezahnkurve, siehe Bild 5.7):

f(x) = π − x fur 0 ≤ x < 2π, f(x+ 2π) = f(x) fur x ∈ R .

-

6

@@@@@@

s@@@@@@

s@@

sf(x)

x0

π

−π

@@@@@@

s@@@@@@

s

@@@@ π 2π

Bild 5.7

Die Berechnung der Fourier-Koeffizienten erfolgt unter Verwendung der Formel (86), wobei der Koeffizient a0

gesondert behandelt wird. Im Fall k = 0 gilt cos(kx) = 1 fur x ∈ R, so dass sich die Formel zur Berechnungvon a0 folgendermaßen vereinfacht:

a0 =1

π

2πˆ

0

f(x) dx .

Nach Einsetzen des Ausdrucks fur f(x) erhalt man dann:

a0 =1

π

2πˆ

0

f(x) dx =1

π

2πˆ

0

(π − x) dx =1

π

[πx− x2

2

]2π

0

= 0 .

Nun werden die verbleibenden Fourierkoeffizienten berechnet.

ak =1

π

2πˆ

0

f(x) cos(kx) dx =1

π

2πˆ

0

(π − x) cos(kx) dx =

2πˆ

0

cos(kx) dx− 1

π

2πˆ

0

x cos(kx) dx

=

[1

ksin(kx)

]2π

0

− 1

π

[x

ksin(kx) +

1

k2cos(kx)

]2π

0

= 0 + 0 = 0 fur k = 1, 2, 3, . . .

bk =1

π

2πˆ

0

f(x) sin(kx) dx =1

π

2πˆ

0

(π − x) sin(kx) dx =

2πˆ

0

sin(kx) dx− 1

π

2πˆ

0

x sin(kx) dx

=

[−1

kcos(kx)

]2π

0

− 1

π

[−xk

cos(kx) +1

k2sin(kx)

]2π

0

= 0 +2

k=

2

kfur k = 1, 2, 3, . . .

Nach Einsetzen der berechneten Fourier-Koeffizienten in die Formel (85) erhalt man die Fourier-Reihe fur f(x):

f(x) ∼ a0

2+

∞∑k=1

(ak cos(kx) + bk sin(kx)) =

∞∑k=1

2

ksin(kx) = 2 sinx+ sin(2x) +

2

3sin(3x) + . . . .

Nun wird der Zusammenhang zwischen den Funktionswerten einer Funktion f(x) und den Werten der Fourier-Reihe betrachtet 5. Es gelten die folgenden Aussagen:

- An allen Stellen, wo f(x) stetig ist, stimmt der Wert der Fourier-Reihe mit dem Funktionswert von f(x)uberein.

- An den Sprungstellen von f(x) ist der Wert der Fourier-Reihe gleich dem arithmetischen Mittelaus dem links- und dem rechtsseitigen Grenzwert von f(x).

5Diese Aussagen gelten auch fur Funktionen mit einer Periode 6= 2π.

21

Fortsetzung zu Beispiel 5.22:

Bei Funktionen, die im gesamten Definitionsbereich stetig sind, kann in der Relation (87) anstelle des Symbols

”∼“ das Gleichheitszeichen geschrieben werden.

Bemerkungen:

- Die Beschreibung periodischer Vorgange mit Hilfe von Fourier-Reihen findet z.B. in der Messtechnik Anwen-dung.

- Durch Abbruch einer Fourier-Reihe nach endlich vielen Gliedern kann man eine Naherungsfunktion fur f(x)erhalten. Diese Naherungsfunktion wird auch als Fourier-Polynom bezeichnet.

5.4.2 Weitere Eigenschaften von Fourier-Reihen

Bei der Berechnung der Fourier-Reihen kann es sich in manchen Fallen als gunstig erweisen, wenn die Integra-tion bei der Berechnung der Fourier-Koeffizienten z.B. uber [−π, π) erfolgt (statt uber [0, 2π), wie in Formel (86)angegeben). Diesbezuglich gilt die folgende Aussage.

Die Integration bei der Berechnung der Fourier-Koeffizienten (siehe Formel (86)) darf uber ein beliebigesPeriodenintervall der Lange 2π erstreckt werden.

Auf Grund der folgenden beiden Eigenschaften verringert sich der Rechenaufwand bei der Berechnung derFourier-Reihe einer geraden bzw. ungeraden Funktion6.

Eigenschaften der Fourier-Reihe einer geraden bzw. ungeraden FunktionDie Fourier-Reihe einer geraden Funktion enthalt nur den Summanden a0

2und Kosinusglieder,

d.h. es gilt: bk = 0 fur k = 1, 2, 3, . . . .Die Fourier-Reihe einer ungeraden Funktion enthalt nur Sinusglieder, d.h. es gilt: ak = 0fur k = 0, 1, 2, . . . .

Um die Formeln fur die Entwicklung von Funktionen mit beliebiger Periode in eine Fourier-Reihe anzugeben,werden Funktionen betrachtet, die von der Variablen t abhangen (d.h. zeitabhangige Funktionen). Die Perioden-dauer wird mit T bezeichnet, weiterhin sei: ω =

Tdie Kreisfrequenz.

Definition 5.4: Die Fourier-Reihe einer periodischen Funktion f(t) mit der Periode T ist gegeben durch:

a02

+

∞∑k=1

(ak cos(kωt) + bk sin(kωt)) , mit ω =2π

T. (88)

Die Fourier-Koeffizienten ak und bk aus (88) werden nach den folgenden Formeln berechnet:

ak =2

T

T

0

f(t) cos(kωt) dt fur k = 0, 1, 2, . . .

(89)

bk =2

T

T

0

f(t) sin(kωt) dt fur k = 1, 2, 3, . . .

6zum Thema Symmetrieverhalten von Funktionen siehe auch: Abschnitt 3.2.2 im Skript Mathematik 1

22

6 Differentialrechnung fur Funktionen mehrerer reeller Variabler

6.1 Einfuhrung

In zahlreichen physikalischen und technischen Anwendungen treten Großen auf, die von mehr als einer Varia-blen abhangen. Das Ziel dieses Kapitels ist es, den Begriff der Funktion entsprechend zu erweitern sowie dieDifferentialrechnung fur Funktionen mehrerer Variabler kennenzulernen.

Beispiel 6.1:a) Wurfweite beim schragen Wurf

Ein Korper wird mit der Geschwindigkeit v0 unter einem Winkel α abgeworfen. Die Wurfweite sW hangtsowohl von der Abwurfgeschwindigkeit v0 als auch von dem Abwurfwinkel α ab. Es besteht der funktionaleZusammenhang:

sW = sW (v0, α) =v2

0 · sin(2α)

g(g : Erdbeschleunigung).

b) Gesamtwiderstand eines StromkreisesDer Gesamtwiderstand Rges des hier dargestellten Stromkreiseshangt von den drei Widerstanden R1, R2 und R3 ab. Es bestehtder funktionale Zusammenhang:

Rges = Rges(R1, R2, R3) = R1 +R2 ·R3

R2 +R3.

R1

R2

R3

c) Produktionsfunktionen7

Das Produktionsergebnis x (Output; hier zunachst bezogen auf eine Ein-Produkt-Fertigung) hangt von denEinsatzmengen verschiedener Produktionsfaktoren (Input; z.B. sind dies Werkstoffe, Betriebsmittel, Arbeits-leistung) ab. Dieser Zusammenhang kann durch die Gleichung

x = f(r1, r2, . . . , rn)

beschrieben werden, wobei f als Produktionsfunktion bezeichnet wird und r1, r2, . . . , rn die Einsatzmengender Produktionsfaktoren sind. Im Beispiel 6.3c) wird eine konkrete Produktionsfunktion betrachtet.

Definition 6.1:Funktionen von n reellen Variablen sind Abbildungen vom Raum Rn in die Menge der reellen Zahlen, d.h.einem Vektor ~x = (x1, x2, . . . , xn) wird in eindeutiger Weise eine Zahl y = f(~x) = f(x1, x2, . . . , xn)zugeordnet. Dabei gelten die folgenden Bezeichnungen:x1, x2, . . . , xn : unabhangige Variablef(x1, x2, . . . , xn) : Funktionswert

Es ist zu beachten, dass im Zusammenhang mit Funktionen mehrerer reeller Variabler die Vektoren aus demRaum Rn stets als Zeilenvektoren geschrieben werden (im Abschnitt 2.6, siehe Skript Mathematik 1, wurdenVektoren aus dem Raum Rn als Spaltenvektoren eingefuhrt).

Definitionsbereich und Wertebereich von Funktionen mehrerer reeller VariablerSei f(~x) = f(x1, x2, . . . , xn) eine Funktion mehrerer reeller Variabler.Der Definitionsbereich Df der Funktion f umfasst die Menge aller Vektoren ~x = (x1, x2, . . . , xn),denen durch f ein Funktionswert y zugeordnet werden kann (vgl. Definition 6.1).Unter dem Wertebereich Wf der Funktion f versteht man die Menge derjenigen Werte y ∈ R, fur diees (mindestens) ein ~x gibt mit y = f(~x).

Beispiel 6.2:7Quelle: J. TIETZE. Einfuhrung in die angewandte Wirtschaftsmathematik, 14. Auflage.

23

Von der bisher verwendeten Bezeichnungsweise: f(x1, x2, . . . , xn) fur eine Funktion von n reellen Variablenwird haufig abgewichen, wenn n = 2 oder n = 3 gilt.

Schreibweise fur Funktionen von zwei oder drei reellen Variablen (n = 2 oder n = 3)

Fur Funktionen mit zwei unabhangigen Variablen wird anstelle von y = f(x1, x2) haufig z = f(x, y)geschrieben.Fur Funktionen mit drei unabhangigen Variablen ist anstatt von y = f(x1, x2, x3) auch die Schreibweiseu = f(x, y, z) ublich.

Im weiteren sollen verschiedene Moglichkeiten zur Darstellung von Funktionen zweier reeller Variabler aufge-zeigt werden.

Darstellungsformen von Funktionen zweier unabhangiger Variabler:

1) FunktionsgleichungBei der Darstellung in Form einer Funktionsgleichung (siehe dazu Definition 6.1) wird noch die folgendeUnterscheidung getroffen:explizite Darstellung (d.h. aufgelost nach z): z = f(x, y),

z.B.: z = 2x+ y − 4 oder z = x2 − y2

implizite Darstellung: F (x, y, z) = 0,z.B.: x2 + y2 + z2 − 1 = 0 oder 6x+ y − z + 5 = 0

2) Funktionstabelle (Wertetabelle)Die Wertetabelle einer Funktion von zwei Variablen hat die Gestalt einer Matrix, da jeweils Paare (x, y)gebildet werden und dann der entsprechende Funktionswert zugeordnet wird. Als Beispiel wird die Werte-tabelle der Funktion z = 2x+ y − 4 fur x = 0, 1, 2 und y = 0, 1, 2 angegeben.

y 0 1 2x

0 -4 -3 -21 -2 -1 02 0 1 2

3) Darstellung als Flache im Raum R3

Wahrend die Veranschaulichung von Funktionen einer reellen Variablen in einem ebenen kartesischen Ko-ordinatensystem erfolgt, muss zur grafischen Darstellung von Funktionen zweier reeller Variabler ein raum-liches kartesisches Koordinatensystem verwendet werden. Der Funktionswert z besitzt dann die Bedeutungeiner Hohenkoordinate, und das Bild der Funktion ist eine Flache im Raum R3.

Beispiel 6.3:a) Der linearen Funktion ax+by+cz+d = 0 (a, b, c, d ∈ R) entspricht im raumlichen Koordinatensystem

eine Ebene.

b) Grafische Darstellung der Funktionz = f(x, y) = −16xy(1− x)(1− y)

fur 0 ≤ x ≤ 1, 0 ≤ y ≤ 1

xy

f(x, y)

24

c) Grafische Darstellung der Funktionz = f(x, y) = x0.25 · y0.75

fur 1 ≤ x ≤ 10, 1 ≤ y ≤ 10

xy

f(x, y)

Funktionen vom Typ f(x, y) = xα · yβ (oder mit anderen Bezeichnungen der Variablen) werden z.B. inder Produktionstheorie angewendet. Ein bekanntes Beispiel ist die Cobb-Douglas-Funktion:P = f(A,K) = c ·Aα ·Kβ mit geeigneten positiven Parametern c, α und β (meistens gilt:α + β = 1). Mit P wird das Produktionsergebnis (Output) bezeichnet, A bzw. K sind die Arbeitskraftebzw. das fur Produktionsmittel aufgewendete Kapital (Input).

4) Veranschaulichung mit Hilfe von NiveaulinienDie Menge der Punkte in der (x, y)-Ebene, an denen eine Funktion f(x, y) einen konstanten Wertf(x, y) = c hat, heißt Niveaulinie von f . Eine Niveaulinie entsteht als Projektion der Schnittkurve der Ebe-ne z = c mit der Flache z = f(x, y) in die (x, y)-Ebene.

Beispiel 6.4:Durch Rotation der Normalparabel z = x2 um die z-Achse entsteht ein Rotationsparaboloid (siehe Bild 6.1a)).Die Mantelflache dieses Rotationsparaboloids hat die Funktionsgleichungz = f(x, y) = x2 + y2.Die Niveaulinien dieses Rotationsparaboloids sind:

z = f(x, y) = const. = c , d.h. x2 + y2 = c .

⇒ Fur jeden positiven Wert des Parameters c erhalt man als Niveaulinie einen Kreis mit dem Radius√c

um den Koordinatenursprung. Bild 6.1b) zeigt einige Niveaulinien der Funktion z = f(x, y) = x2 + y2.

-)

yx

z6

qq

Schnittkurve der Ebenez = c mit der Flachez = x2 + y2

HHH

z = x2 + y2

-

6

x

y Niveaulinien fur z = 1,

z = 2, z = 3, z = 4, z = 5

Bild 6.1a) Bild 6.1b)

Bemerkung:Bei einer Funktion, die von 3 Variablen abhangt, sind durch die Gleichung f(x, y, z) = const. = c dieNiveauflachen gegeben.

25

6.2 Partielle Ableitungen

6.2.1 Grenzwert, Stetigkeit, partielle Ableitungen 1. Ordnung

Zunachst werden die Begriffe ”Grenzwert“ und ”Stetigkeit“ fur Funktionen mehrerer reeller Variabler formuliert.Dabei werden Funktionen von zwei reellen Variablen betrachtet, d.h. z = f(x, y). Die Aussagen lassen sichsinngemaß auf Funktionen von n Variablen (n ≥ 3) ubertragen.Bei der Untersuchung von Grenzwerten von einer Funktion einer reellen Variablen8 (d.h. y = f(x)) wurde dasVerhalten der Funktionswerte bei Annaherung an eine Stelle x0 des Definitionsbereiches von f(x) untersucht.Jetzt muss das Verhalten der Funktionswerte bei Annaherung an eine Stelle (x0, y0) ∈ Df fur z = f(x, y)betrachtet werden.

Es gilt: limn→∞(xn, yn) = (x0, y0), wenn zugleich die Zahlenfolge xn gegen x0 und die Zahlenfol-ge yn gegen y0 strebt. Dabei ist es nicht von Bedeutung, welche Folgen (xn, yn) das Variablenpaardurchlauft (anschaulich: eine Folge von Punkten mit den Koordinaten (xn, yn) in der (x, y)-Ebene kannsich entlang verschiedener Kurven dem Punkt (x0, y0) nahern).

Damit kann der Begriff des Grenzwertes fur eine Funktion zweier reeller Variabler eingefuhrt werden.

Definition 6.2: Eine Funktion z = f(x, y) sei in einer Umgebung der Stelle (x0, y0) definiert.Gilt dann fur jede Folge (xn, yn), (xn, yn) ∈ Df , mit limn→∞(xn, yn) = (x0, y0) :

limn→∞

f(xn, yn) = g ,

dann heißt g der Grenzwert von f an der Stelle (x0, y0).Schreibweise: lim(x,y)→(x0,y0) f(x, y) = g

Mit Hilfe des Grenzwertbegriffes kann nun auch die Stetigkeit einer Funktion zweier reeller Variabler definiertwerden.

Definition 6.3: Eine in (x0, y0) und in einer gewissen Umgebung von (x0, y0) definierte Funktionz = f(x, y) ist an der Stelle (x0, y0) stetig, wenn der Grenzwert lim(x,y)→(x0,y0) f(x, y) existiert undlim(x,y)→(x0,y0) f(x, y) = f(x0, y0) gilt. Eine Funktion, die an jeder Stelle ihres Definititionsbereichesstetig ist, wird als stetige Funktion bezeichnet.

Beispiel 6.5:Die bereits im Beispiel 6.4 betrachtete Funktion z = f(x, y) = x2 + y2 ist eine stetige Funktion.

Beispiel 6.6: (Beispiel fur eine Funktion, die an einer Stelle unstetig ist)

Sei f(x, y) =

4xy

x2 + y2fur (x, y) 6= (0, 0)

0 fur (x, y) = (0, 0) .

Diese Funktion ist in (0, 0) zwar definiert, abernicht stetig, da sie dort keinen Grenzwert hat.Um diese Aussage zu begrunden, wird die Funk-tion f(x, y) zunachst langs der x-Achse (d.h. fury = 0) betrachtet. Dort gilt:

f(x, 0) =4 · x · 0x2 + 02

= 0 fur x 6= 0 ⇒ limx→0

f(x, 0) = 0 .

Langs der Geraden x = y gilt jedoch:

f(x, x) =4 · x · xx2 + x2

= 2 fur x 6= 0 ⇒ limx→0

f(x, x) = 2 . y

x

f(x, y)

8siehe Abschnitt 3.3.1 im Skript Mathematik 126

Nun soll der Begriff der Ableitung auf Funktionen mehrerer reeller Variabler ubertragen werden. Dies fuhrt zurDefinition der partiellen Ableitung.

Definition 6.4: Unter den partiellen Ableitungen 1. Ordnung einer Funktion z = f(x, y) an der Stelle(x0, y0) versteht man die folgenden Grenzwerte (falls sie existieren):

∂f

∂x(x0, y0) = fx(x0, y0) = lim

∆x→0

f(x0 + ∆x, y0)− f(x0, y0)

∆x(90)

(partielle Ableitung 1. Ordnung nach x)

∂f

∂y(x0, y0) = fy(x0, y0) = lim

∆y→0

f(x0, y0 + ∆y)− f(x0, y0)

∆y(91)

(partielle Ableitung 1. Ordnung nach y).

Es sei darauf hingewiesen, dass bei Funktionen von mehreren reellen Variablen fur die Ableitungen niemals dasSymbol ”d“, sondern immer das Symbol ”∂ “ (wie in Definition 6.4) zu verwenden ist.Im Abschnitt 4.1.1 (siehe Skript Mathematik 1) wurde die erste Ableitung einer Funktion von einer reellenVariablen als Anstieg der Kurventangente in dem betreffenden Kurvenpunkt gedeutet. Auch die partiellen Ablei-tungen einer Funktion z = f(x, y) lassen eine geometrische Deutung zu. Die partielle Ableitung dieser Funktionnach der Variablen x (bzw. y) entspricht dem Anstieg der Flachentangente im Flachenpunkt P (x0, y0, z0) in derpositiven x- (bzw. y-) Richtung.

Berechnung der partiellen Ableitungen 1. Ordnung einer Funktion f(x, y)

Berechng. der Ableitung∂f

∂x: Die Variable y wird als Konstante betrachtet und dann werden (bzgl. x)

die Ableitungsregeln fur Funktionen einer reellen Variablen angewendet.

Berechng. der Ableitung∂f

∂y: Die Variable x wird als Konstante betrachtet und dann werden (bzgl. y)

die Ableitungsregeln fur Funktionen einer reellen Variablen angewendet.

Beispiel 6.7:

Vollig analog zu Definition 6.4 konnen die partiellen Ableitungen 1. Ordnung fur eine Funktion von n reellenVariablen (d.h. fur f(x1, x2, . . . , xn)) eingefuhrt werden. Bei der Berechnung der partiellen Ableitung fxi(i = 1, 2, . . . , n) werden alle Variablen außer xi als Konstante betrachtet, dann kommen wieder die Ableitungs-regeln fur Funktionen einer reellen Variablen zur Anwendung.

Beispiel 6.8:

Partielle DifferenzierbarkeitEine Funktion f(x1, x2, . . . , xn) heißt partiell differenzierbar, wenn alle partiellen Ableitungen fxi(i = 1, 2, . . . , n) existieren.

Erganzung zu Beispiel 6.8:Die in diesem Beispiel betrachteten Funktionen sind partiell differenzierbar, da jeweils die partiellen Ableitungennach allen Variablen existieren.

6.2.2 Partielle Ableitungen hoherer Ordnung

Falls die partiellen Ableitungen fxi einer Funktion f(x1, x2, . . . , xn) nochmals differenzierbar sind, kann manpartielle Ableitungen 2. Ordnung bilden (und, falls moglich, durch weitere Differentiation: partielle Ableitungenk-ter Ordnung, k ≥ 3).

27

Die partiellen Ableitungen 2. Ordnung einer Funktion f(x, y)

fxx =∂2f

∂x2=

∂x

(∂f

∂x

)fyy =

∂2f

∂y2=

∂y

(∂f

∂y

)

fxy =∂2f

∂x∂y=

∂y

(∂f

∂x

)fyx =

∂2f

∂y∂x=

∂x

(∂f

∂y

)

Fur Funktionen f(x1, x2, . . . , xn) gilt analog: fxixj =∂2f

∂xi∂xj=

∂xj

(∂f

∂xi

).

Beispiel 6.9:

Bei der Bildung partieller Ableitungen 3. Ordnung gibt es fur eine Funktion zweier Variabler bereits 23 = 8Moglichkeiten. Aus diesem Grund wird nur ein Beispiel fur eine partielle Ableitung 3. Ordnung aufgefuhrt:

fxxy =∂3f

∂x2∂y=

∂y

(∂2f

∂x2

)Nun soll noch eine weitere wichtige Eigenschaft von partiellen Ableitungen hoherer Ordnung behandelt werden.Die Ableitungen der im Beispiel 6.9 betrachteten Funktion besitzen offensichtlich die Eigenschaft: fxy = fyx .Dies ist kein Zufall, denn es gilt der folgende Satz.

Satz von Schwarz (Vertauschbarkeit der Differentiationsreihenfolge)Bei partiellen Ableitungen k-ter Ordnung (k ≥ 2) darf die Reihenfolge der einzelnen Differentiationsschrittevertauscht werden, wenn die partiellen Ableitungen stetige Funktionen sind.

Beispiel 6.10:Sei f(x, y) = x3 sin y + e2y cosx.

28

6.2.3 Differentiation nach einem Parameter (verallgemeinerte Kettenregel)

Sei z = f(x, y) eine Funktion der beiden unabhangigen Variablen x und y, die wiederum von einem reellenParameter abhangen: x = x(t), y = y(t) (t1 ≤ t ≤ t2). Durch Einsetzen dieser Parametergleichungen in dieFunktionsgleichung z = f(x, y) entsteht eine zusammengesetzte (verkettete) Funktion des Parameters t:

z = z(t) = f(x(t), y(t)) . (92)

Die Berechnung der Ableitung dieser Funktion nach der Variablen t erfolgt mit Hilfe der verallgemeinertenKettenregel.

Verallgemeinerte KettenregelDie Funktionen x(t) und y(t) seien stetig differenzierbar nach der Variablen t und die Funktion f(x, y)besitze stetige partielle Ableitungen nach den Variablen x und y. Dann ist die Funktion z aus (92) stetig

differenzierbar nach t und ihre Ableitung z =dz

dtwird wie folgt berechnet:

z =dz

dt=∂z

∂x· dxdt

+∂z

∂y· dydt

= zx · x+ zy · y (93)

Es ist zu beachten, dass in der Formel (93) die Ableitungen von z nach x bzw. y als partielle Ableitungengeschrieben werden, die Ableitungen von x bzw. y nach t jedoch als ”gewohnliche“ Ableitungen (da die Funk-tionen x und y jeweils nur von einer Variablen, namlich t, abhangen).Die verallgemeinerte Kettenregel wird z.B. dann angewendet, wenn die Ableitung einer Funktion langs einer inParameterdarstellung gegebenen Kurve zu berechnen ist.

Beispiel 6.11:Sei z = f(x, y) = x · ln y mit x = x(t) = sin t, y = y(t) = cos t, wobei 3π

2 < t ≤ 2π gelte (dann gilt:y = cos t > 0, so dass ln y definiert und somit auch differenzierbar ist).Nach Formel (93) erhalt man fur die Ableitung der Funktion z = z(t) = sin t · ln(cos t):

z =dz

dt= zx · x+ zy · y = ln y · cos t+ x · 1

y· (− sin t) = ln(cos t) · cos t+ sin t · 1

cos t· (− sin t)

= ln(cos t) · cos t− tan t · sin t.

Bemerkung:Die Aussage von Formel (93) kann auf Funktionen von n reellen Variablen verallgemeinert werden. Die Varia-

blen x1, x2, . . . , xn seien selbst wieder Funktionen des reellen Parameters t. Dann gilt fur die AbleitungdF

dtder Funktion F (t) = f(x1(t), x2(t), . . . , xn(t)):

dF

dt=

∂f

∂x1· dx1

dt+

∂f

∂x2· dx2

dt+ . . . +

∂f

∂xn· dxndt

.

6.3 Das totale Differential einer Funktion

6.3.1 Definition und Anwendung in der Fehlerrechnung

Definition 6.5: Unter dem totalen (oder vollstandigen) Differential einer partiell differenzierbaren Funk-tion f(x1, x2, . . . , xn) versteht man den Ausdruck

df =∂f

∂x1dx1 +

∂f

∂x2dx2 + . . . +

∂f

∂xndxn = fx1 dx1 + fx2 dx2 + . . . + fxn dxn . (94)

Mit Hilfe des totalen Differentials kann geschatzt werden, wie sich eine geringfugige Anderung der unabhangi-gen Variablen x1, x2, . . . , xn auf eine daraus abgeleitete Große auswirkt. Seien ∆x1, ∆x2, . . . , ∆xn die(sehr kleinen) Anderungen der Argumente x1, x2, . . . , xn der Funktion f , dann kann ∆x1 = dx1,∆x2 = dx2, . . . , ∆xn = dxn gewahlt werden, und es gilt: ∆f ≈ df , wobei ∆f die Anderung des Funktions-wertes von f bezeichnet.

Beispiel 6.12:29

Die soeben beschriebene Eigenschaft des totalen Differentials begrundet dessen Anwendung in der Fehlerrech-nung, da die ”geringfugigen Anderungen“ der Argumente x1, x2, . . . , xn auch Messfehler sein konnen. Es giltdie folgende Aussage:

Lineares FehlerfortpflanzungsgesetzWird eine Große y berechnet aus y = f(x1, x2, . . . , xn) und sind die Eingangsgroßen x1, x2, . . . , xnmit den Fehlern ∆x1, ∆x2, . . . , ∆xn behaftet, so lasst sich der Fehler ∆y der abgeleiteten Große ywie folgt schatzen:

|∆y| ≈ |fx1 | · |∆x1|+ |fx2 | · |∆x2|+ . . . + |fxn | · |∆xn| . (95)

Beispiel 6.13:

Bemerkung:Mit Hilfe der Ungleichung (95) wird der maximale absolute Fehler berechnet (rechte Seite dieser Ungleichung).Es ist aber auch moglich, den mittleren absoluten Fehler zu ermitteln. Dieser sei mit ∆ym bezeichnet, dann gilt:

|∆ym| =√

(fx1 ·∆x1)2 + . . . + (fxn ·∆xn)2 .

6.3.2 Implizite Differentiation

Eine Funktionskurve sei in der impliziten Darstellung F (x, y) = 0 gegeben (vgl. Abschnitt 6.1). Unter denVoraussetzungen, dass in der Umgebung eines Punktes P (x, y) stetige partielle Ableitungen Fx und Fy existierensowie Fy(x, y) 6= 0 gilt, kann die Ableitung y′ in diesem Punkt nach der folgenden Formel berechnet werden:

dy

dx= y′ = −Fx(x, y)

Fy(x, y). (96)

Begrundung fur die Formel (96):Unter den gegebenen Voraussetzungen beschreibt die implizite Darstellung F (x, y) = 0 in der Umgebung desbetrachteten Punktes P (x, y) tatsachlich eine differenzierbare Funktion f : y = f(x). Die FunktionsgleichungF (x, y) = 0 wird nun als Sonderfall der Funktionsgleichung z = F (x, y) mit z = 0 betrachtet. Fur das totaleDifferential dz gilt dann einerseits dz = 0 und andererseits (vgl. Formel (94)): dz = Fx(x, y)dx+ Fy(x, y)dy.Nach Gleichsetzen und Umstellen ergibt sich die Beziehung (96).

Die Bedeutung der Formel (96) liegt darin, dass die Differentiation einer Funktion auch dann moglich ist, wenndiese nicht in der expliziten Form y = f(x) darstellbar ist bzw. die Auflosung nach y sehr aufwandig ware.So kann z.B. der Anstieg einer Kurventangente auch dann berechnet werden, wenn die Funktion nicht in derexpliziten Darstellung vorliegt. Eine solche Situation wird in dem folgenden Beispiel betrachtet.

Beispiel 6.14:

-

6

x

y

30

6.4 Extrema von Funktionen mehrerer Variabler

6.4.1 Begriff des Extremums

Definition 6.6: Eine Funktion f(x1, x2, . . . , xn) besitzt an der Stelle (x∗1, x∗2, . . . , x

∗n) ein lokales

Maximum (bzw. ein lokales Minimum), wenn in einer gewissen Umgebung dieser Stelle stets gilt:

f(x∗1, x∗2, . . . , x

∗n) > f(x1, x2, . . . , xn) (bzw. f(x∗1, x

∗2, . . . , x

∗n) < f(x1, x2, . . . , xn)), (97)

wobei (x1, x2, . . . , xn) 6= (x∗1, x∗2, . . . , x

∗n).

Wenn die Ungleichung (97) an jeder Stelle (x1, x2, . . . , xn) des Definitionsbereiches Df erfullt ist, dannliegt ein globales Maximum (bzw. ein globales Minimum) vor.

Maxima und Minima werden unter dem Begriff ”Extrema“ zusammengefasst.Fur eine Funktion zweier Variabler (d.h. z = f(x, y)), welche als Flache im Raum R3 dargestellt werden kann,ist die folgende anschauliche Interpretation moglich: einem lokalen Maximum (bzw. Minimum) entspricht einPunkt dieser Flache, welcher ”hoher“ (bzw. ”tiefer“) liegt als alle anderen in der Umgebung befindlichen Punkteder Flache.Beispielsweise besitzt die im Bild 6.1a) (siehe Abschnitt 6.1) dargestellte Funktion z = x2 + y2 an der Stel-le (0, 0) ein lokales Minimum mit dem Funktionswert z = 0. Die Uberlegung, dass x2 + y2 ≥ 0 fur alle(x, y) ∈ R2 gilt und insbesondere x2 + y2 = 0 nur fur x = y = 0 moglich ist, fuhrt zu der Aussage, dass an derStelle (0, 0) sogar ein globales Minimum der betrachteten Funktion vorhanden ist.Allgemeine Verfahren zur Berechnung lokaler Extrema werden in den nachfolgenden Abschnitten erlautert.Dabei werden ausschließlich Funktionen zweier Variabler, d.h. z = f(x, y), betrachtet.

6.4.2 Extrema ohne Nebenbedingungen

Wie auch bei Funktionen einer reellen Variablen (siehe Abschnitt 4.2.2 im Skript Mathematik 1) werden not-wendige und hinreichende Bedingungen fur das Vorhandensein lokaler Extrema bei Funktionen mehrerer reellerVariabler formuliert.

Notwendige Bedingungen fur das Vorliegen eines lokalen ExtremumsDie notwendigen Bedingungen fur das Vorliegen eines lokalen Extremums einer partiell differenzierbarenFunktion f(x, y) an der Stelle (x∗, y∗) lauten:

fx(x∗, y∗) = 0 und fy(x∗, y∗) = 0 . (98)

Eine Stelle, fur die die Bedingungen (98) erfullt sind, wird als stationare Stelle bezeichnet.

Die Bedingungen (98) konnen wie folgt anschaulich interpretiert werden: ein lokales Extremum einer Funktionzweier Variabler kann nur dort vorliegen, wo die Tangentialebene9 an die Flache z = f(x, y) parallel zur (x, y)-Ebene verlauft. Die genannten Bedingungen sind jedoch nicht hinreichend, wie das folgende Beispiel zeigt.Beispiel 6.15:Fur die Funktion z = f(x, y) = x2 − y2 (siehe Bild 6.2)gilt zwar: fx(0, 0) = fy(0, 0) = 0, aber an der Stelle (0, 0)liegt kein lokales Extremum vor.Begrundung: Es werden die Werte der Funktion f in derUmgebung der Stelle (0, 0) betrachtet, und zwar speziell:f(0, y) (d.h. x = 0 fest, y 6= 0 variabel). Es gilt:f(0, y) = 02 − y2 = −y2 < 0 ⇒ wegen f(0, 0) = 0kann an der Stelle (0, 0) kein lokales Minimum vorliegen.Andererseits ist f(x, 0) = x2 − 02 = x2 > 0 ⇒ an derStelle (0, 0) kann somit auch kein lokales Maximum vor-liegen. An der Stelle (0, 0) liegt eine Sattelstelle vor. DieFlache z = x2 − y2 besitzt die Form eines Sattels undwird daher auch als Sattelflache bezeichnet. Bild 6.2

9Die Tangentialebene an die Flache z = f(x, y) im Punkt P0(x0, y0, f(x0, y0)) beruhrt diese Flache in P0 und enthalt alle Tangen-ten, die in P0 an diese Flache gelegt werden konnen.

31

Zur Formulierung hinreichender Bedingungen fur das Vorliegen eines lokalen Extremums wird noch die Hesse-Matrix der Funktion f benotigt. Diese wird aus den partiellen Ableitungen 2. Ordnung gebildet.

Definition 6.7: Unter der Voraussetzung, dass die partiellen Ableitungen zweiter Ordnung der Funktionf(x, y) existieren, lautet die Hesse-Matrix Hf (x, y) dieser Funktion:

Hf (x, y) =

(fxx(x, y) fxy(x, y)

fyx(x, y) fyy(x, y)

).

Hinreichende Bedingungen fur das Vorliegen eines lokalen ExtremumsDie hinreichenden Bedingungen fur das Vorliegen eines lokalen Extremums der Funktion f(x, y)an der Stelle (x∗, y∗) lauten:

(I) Die Bedingung (98) ist erfullt, d.h. (x∗, y∗) ist eine stationare Stelle.

(II) Die Determinante der Hesse-Matrix Hf (x, y) hat an der Stelle (x∗, y∗) einen positiven Wert,d.h. es gilt: ∆ = detHf (x∗, y∗) > 0.

Die Entscheidung, ob es sich um ein lokales Maximum oder ein lokales Minimum handelt, kann mit Hilfe derAbleitung fxx an der Stelle (x∗, y∗) getroffen werden. Es gilt die folgende Aussage:

Entscheidung uber die Art des lokalen ExtremumsDie hinreichenden Bedingungen fur ein lokales Extremum der Funktion f(x, y) seien an einer Stelle (x∗, y∗)erfullt.Gilt dann: fxx(x∗, y∗) < 0 , so liegt in (x∗, y∗) ein lokales Maximum vor.In dem Fall fxx(x∗, y∗) > 0 liegt in (x∗, y∗) ein lokales Minimum vor.

Wenn an einer Stelle (x∗, y∗) nur die o.g. Bedingung (I) erfullt ist, aber ∆ < 0 gilt, dann handelt es sich umeine Sattelstelle. Dies bedeutet, dass die betrachtete Funktion an dieser Stelle einen Sattelpunkt besitzt.Wenn an einer Stelle (x∗, y∗) die o.g. Bedingung (I) erfullt ist sowie ∆ = 0 gilt, kann noch keine Entscheidungbzgl. des Vorhandenseins eines lokalen Extremums getroffen werden. Auf diesen Fall wird hier nicht nahereingegangen.

Bei der Berechnung lokaler Extrema ist zu beachten, dass das Aufstellen der Bedingung (98) haufig auf einnichtlineares Gleichungssystem mit den beiden Variablen x und y fuhrt, dessen Auflosung sich moglicherweiseschwierig gestaltet (ggf. kann der solve-Befehl des Taschenrechners genutzt werden).

Beispiel 6.16:a) Das Vorhandensein eines lokalen Minimums der Funktion z = f(x, y) = x2 + y2 an der Stelle (0, 0)

wurde im Abschnitt 6.4.1 anschaulich begrundet. Nun soll diese Funktion rechnerisch auf lokale Extremaund Sattelpunkte untersucht werden.Uberprufung der Bedingung (I): wegen fx = 2x und fy = 2y liegt genau eine stationare Stelle vor, namlich(x∗, y∗) = (0, 0).Uberprufung der Bedingung (II): die noch benotigten Ableitungen lauten: fxx = 2, fxy = fyx = 0 sowiefyy = 2. Damit lautet die Hesse-Matrix:

Hf (x, y) =

(2 0

0 2

). (In diesem speziellen Fall besitzt Hf fur alle (x, y) ∈ R2 den gleichen Wert!)

Somit gilt ∆ = detHf (0, 0) = 4 > 0, d.h. in (0, 0) liegt tatsachlich ein lokales Extremum vor. Wegenfxx = 2 > 0 handelt es sich um ein lokales Minimum, der zugehorige Funktionswert istf(0, 0) = 02 + 02 = 0.Aus den obigen Uberlegungen folgt weiterhin, dass die betrachtete Funktion kein lokales Maximum undkeinen Sattelpunkt besitzt.

b) Berechnung der lokalen Extrema der Funktion z = f(x, y) = 3xy − x3 − y3

32

6.4.3 Extrema mit Nebenbedingungen

Bei den bisherigen Betrachtungen wurden die lokalen Extrema im gesamten Definitionsbereich der Funktiongesucht, d.h. die unabhangigen Variablen x und y unterlagen keinen zusatzlichen Einschrankungen (Neben-bedingungen).Die Modellierung von Praxisproblemen fuhrt jedoch haufig auf Funktionen, bei denen die unabhangigen Varia-blen durch eine Neben- oder Kopplungsbedingung miteinander verbunden sind, d.h. zusatzlich zur Funktions-gleichung liegt eine weitere Gleichung vor. Bei der Losung derartiger Problemstellungen sind zwei verschiede-ne Herangehensweisen moglich: die Eliminationsmethode (siehe Abschnitt 6.4.3.1) und die Lagrange-Methode(siehe Abschnitt 6.4.3.2).

6.4.3.1 Die Eliminationsmethode

Bei der Eliminationsmethode wird - wie der Name schon vermuten lasst - eine der vorkommenden Variablenaus der Funktion ”beseitigt“. Dies geschieht, indem die gegebene Nebenbedingung (NB) nach einer Variablenaufgelost wird. Anschließend wird diese Variable in der Funktion, deren Extrema gesucht sind, ersetzt (d.h. dieAnzahl der Variablen wird um 1 verringert). Die Durchfuhrung dieser Methode wird anhand der beiden nachfol-genden Beispiele verdeutlicht.

Beispiel 6.17:

In diesem Beispiel konnte die Berechnung eines Extremums einer Funktion mit zwei Variablen auf Grund derzu erfullenden NB auf die Ermittlung eines Extremums einer Funktion mit einer Variablen (vgl. auch Ab-schnitt 4.2.2 im Skript Mathematik 1) zuruckgefuhrt werden.In dem nun folgenden Beispiel ist ein Extremum einer Funktion mit drei Variablen unter einer NB gesucht. DieElimination einer dieser Variablen fuhrt auf die Bestimmung eines Extremums einer Funktion mit zwei Variablen(vgl. Abschnitt 6.4.2).

Beispiel 6.18:Bei der Herstellung quaderformiger, nach oben offener Behalter miteinem Fassungsvermogen von V = 4 l soll moglichst wenig Mate-rial verbraucht werden, d.h. die Oberflache AO eines Quaders ohneDeckflache bei fest vorgegebenem Volumen ist zu minimieren.

x

yz

33

6.4.3.2 Die Lagrange-Methode (Lagrangesche Multiplikatorenmethode)

Die Lagrange-Methode kommt zur Anwendung, wenn die Eliminationsmethode nicht durchfuhrbar ist, d.h. wenn

- die Auflosung der NB nach einer Variablen nicht moglich oder zu aufwandig ist oder

- die Elimination einer Variablen zu einer sehr komplizierten Funktion fuhrt.

Das Grundprinzip der Lagrange-Methode besteht in der Einfuhrung einer zusatzlichen Variablen λ, Lagrange-scher Multiplikator genannt. Diese wird in eine Hilfsfunktion eingebracht, deren Extrema bestimmt werden.

Durchfuhrung der Lagrange-MethodeGegeben sei die Funktion z = f(x, y).Zu ermitteln sind die Extrema dieser Funktion unter der NB: ϕ(x, y) = 0.Dazu wird wie folgt vorgegangen:

1) Einfuhrung der Hilfsvariablen λ (Lagrangescher Multiplikator) und Aufstellen der Hilfsfunktion

F (x, y, λ) = f(x, y) + λϕ(x, y)

2) Berechnung der Koordinaten (x, y) der extremwertverdachtigen Stellen aus dem (i.allg. nichtlinearen)Gleichungssystem

Fx(x, y, λ) = fx(x, y) + λϕx(x, y) = 0

Fy(x, y, λ) = fy(x, y) + λϕy(x, y) = 0 (99)

Fλ(x, y, λ) = ϕ(x, y) = 0

Um dann zu entscheiden, ob tatsachlich ein Extremum vorliegt (und um ggf. die Art des Extremums festzustel-len), kommen die folgenden Moglichkeiten in Frage:

- In manchen Fallen kann aus der Problemstellung heraus entschieden werden, ob ein Extremum vorliegt.

- Die Frage, ob es sich um ein Minimum oder um ein Maximum handelt, kann ggf. anschaulich mit Hilfe einesNiveauliniendiagramms (siehe Abschnitt 6.1) geklart werden.

- Wenn gilt: Fxxϕ2y − 2Fxyϕxϕy + Fyyϕ

2x < 0 , dann liegt ein Maximum vor.

In dem Fall Fxxϕ2y − 2Fxyϕxϕy + Fyyϕ

2x > 0 liegt ein Minimum vor.

34

Beispiel 6.19:

Beispiel 6.20: Berechnung der maximalen Beleuchtungsstarke10

Ein fester Punkt A einer ebenen Buhne wird durch einepunktformige, in der Hohe h verstellbare Lichtquelle mit derkonstanten Lichtstarke I0 beleuchtet. Die im Punkt A erzeugteBeleuchtungsstarke B genugt dem Lambertschen Gesetz:

B = B(α, r) =I0 cosα

r2

(α: Einfallswinkel des Lichtes, r: Abstand zwischenLichtquelle und Punkt A).

a (fest) QQQ

QQQ

QQQ

QQQ

QQ

tBuhne

A

x Lichtquelle

α

0

h r

Bild 6.3

Die Fragestellung lautet: Unter welchem Winkel α wird der Punkt A maximal beleuchtet?

Zur Beantwortung dieser Frage wird der Sachverhalt wie folgt mathematisch formuliert:Gesucht ist das Maximum der Funktion B(α, r) unter der Nebenbedingung ϕ(α, r) = r sinα− a = 0

(Beziehungen im rechtwinkligen Dreieck: sinα =a

r, siehe Bild 6.3).

Bei Anwendung der Lagrange-Methode wird zunachst die Hilfsfunktion F (r, α, λ) gebildet:

F (r, α, λ) = B(α, r) + λ · ϕ(α, r) =I0 cosα

r2+ λ · (r sinα− a) .

Analog zu (99) wird das Gleichungssystem aufgestellt:

Fr = −2I0 cosα

r3+ λ sinα = 0 (I)

Fα = −I0 sinα

r2+ λr cosα = 0 (II)

Fλ = r sinα− a = 0 (III)

Die Gleichungen (I) und (II) werden jeweils nach λ umgestellt und gleichgesetzt:

2I0 cosα

r3 sinα=I0 sinα

r3 cosα⇒ 2 cos2 α = sin2 α ⇒ 2 = tan2 α .

Die letztgenannte Gleichung hat die beiden Losungen α1 = arctan(√

2) = 0.955und α2 = arctan(−

√2) = −0.955 , wobei α2 (wegen α2 < 0) sofort entfallt. Nach Umwandlung von α1 in

das Gradmaß erhalt man: α1 = 54.74.Fur α1 kann gezeigt werden, dass tatsachlich ein Maximum der Funktion B(α, r) vorliegt.⇒ Ergebnis: Bei einem Winkel von α = 54.74 wird der Punkt A maximal beleuchtet, die Beleuchtungsstarke

betragt in diesem Fall Bmax =0.385I0a2

.

10Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 257-258

35

Bemerkungen:

- Der Wert der Hilfsvariablen λ wird fur die Berechnung der Extrema selbst nicht benotigt. Aus diesem Grundkann es sinnvoll sein, diese Variable bei der Auflosung des Gleichungssystems (99) zu eliminieren (wie imBeispiel 6.20).

- Bei Berechnungen mit betriebswirtschaftlichem Hintergrund kann mit Hilfe des Lagrangeschen Multiplika-tors λ naherungsweise beschrieben werden, wie sich Anderungen der Nebenbedingungen auf den Extremwertauswirken (fur detailliertere Informationen sei auf die folgende Literaturstelle verwiesen:B. LUDERER, U. WURKER. Einstieg in die Wirtschaftsmathematik, 6. Auflage, S. 370-372).

- Die Lagrange-Methode ist sinngemaß auch anwendbar fur Funktionen von n Variablen x1, x2, . . . , xn mitm Nebenbedingungen ϕi(x1, x2, . . . , xn) = 0, i = 1, 2, . . . ,m, wobei m < n. Dann mussen insgesamt mHilfsvariable λ1, λ2, . . . , λm eingefuhrt werden. Analog zu (99) sind dann die Ableitungen der HilfsfunktionF (x1, x2, . . . , xn, λ1, λ2, . . . , λm) nach samtlichen Variablen, von denen sie abhangt, zu bilden und gleichNull zusetzen.

6.5 Ausgleichsrechnung

In der Praxis tritt haufig die folgende Problemstellung auf: mit n verschiedenen Eingangsdaten xi (i = 1, 2, . . . , n)wird ein Versuch durchgefuhrt, wodurch die Versuchsergebnisse yi (i = 1, 2, . . . , n) entstehen. Gesucht ist derfunktionale Zusammenhang y = f(x) zwischen den Großen x und y, d.h. eine Funktion f ist so zu bestimmen,dass die Versuchsergebnisse moglichst gut wiedergegeben werden. Ein solches Experiment konnte z.B. die Mes-sung der Langenanderung eines Stabes in Abhangigkeit von der Temperatur sein.Nur selten wird die Situation eintreten, dass alle n Punkte mit den Koordinaten (xi, yi) (i = 1, 2, . . . , n) exaktauf einer Funktionskurve im ebenen kartesischen Koordinatensystem liegen11. Aus diesem Grund bedient mansich zur Losung der beschriebenen Problemstellung der Ausgleichsrechnung. Ein klassisches Verfahren der Aus-gleichsrechnung ist die Methode des Gaußschen Fehlerquadratminimums. Diese Methode wird im folgendenbeschrieben am Beispiel des Ausgleichs durch eine Gerade.Gegeben seien n Punkte mit den kartesischen Koordinaten (xi, yi), i = 1, 2, . . . , n, mit n ≥ 3 sowie xi 6= xjfur i 6= j. Nun soll eine Gerade y = f(x) = a1x + a0 so in diese Punktmenge eingepasst werden, dass der

”Trend“ in der Anordnung der Punkte moglichst gut wiedergegeben wird (siehe Bild 6.4a)). Diese Gerade wirdals Ausgleichsgerade bezeichnet. Als Kriterium fur die Gute dieser Ausgleichsgeraden dient die Summe allerFehlerquadrate d2

i (i = 1, 2, . . . , n) mit d2i = [f(xi) − yi]2 (zur Veranschaulichung siehe Bild 6.4b)), d.h. die

unbekannten Großen a1 und a0 sind so zu bestimmen, dass diese Summe minimal wird.Fur die Summe S der Fehlerquadrate gilt:

S = S(a1, a0) =

n∑i=1

d2i =

n∑i=1

[f(xi)− yi]2 =

n∑i=1

[a1xi + a0 − yi]2 . (100)

In die Berechnung von S gehen die Werte a1, a0, xi und yi (i = 1, 2, . . . , n ) ein, wobei xi und yi jeweils ausdem Versuch bekannt sind. Lediglich die Werte von a1 und a0 sind bislang unbekannt, d.h. S ist eine Funktionnur von diesen beiden Variablen.

-

6

x

y

0

r r r r r r r r r r rf(x) = a1x+ a0

-

6

x

y

0

ryif(xi)

f(x) = a1x+ a0

xi

Bild 6.4a) Bild 6.4b)

11Wenn z.B. zwischen zwei physikalischen Großen ein linearer Zusammenhang besteht, dann wird die grafische Darstellung derVersuchsdaten in der Regel nur annahernd eine Gerade ergeben.

36

Die notwendigen Bedingungen fur das Vorhandensein eines Extremums der Funktion S(a1, a0) sind

(vgl. Abschnitt 6.4.2): ∂S

∂a1= 0 sowie ∂S

∂a0= 0. Unter Einbeziehung von (100) erhalt man:

∂S

∂a1= 2

n∑i=1

[a1xi + a0 − yi] · xi = 0 ⇒ a1

n∑i=1

x2i + a0

n∑i=1

xi =n∑i=1

xiyi

(101)∂S

∂a0= 2

n∑i=1

[a1xi + a0 − yi] = 0 ⇒ a1

n∑i=1

xi + a0n =

n∑i=1

yi ,

d.h. es ist ein lineares Gleichungssystem zur Berechnung von a1 und a0 entstanden.In Matrizenschreibweise lautet dieses lineare Gleichungssystem:

n∑i=1

x2i

n∑i=1

xi

n∑i=1

xi n

( a1

a0

)=

n∑i=1

xiyi

n∑i=1

yi

. (102)

Zur Losung von (102) kann z.B. die Cramersche Regel (siehe Abschnitt 2.12.3 im Skript Mathematik 1) oderder rref-Befehl des Taschenrechners verwendet werden.

Berechnung einer Ausgleichsgeradena

Gegeben seien n Punkte mit den Koordinaten (xi, yi), i = 1, 2, . . . , n, wobei n ≥ 3 sowie xi 6= xjfur i 6= j gilt. Die Werte von a1 und a0 fur die Ausgleichsgerade y = f(x) = a1x+ a0 werdenals Losung des linearen Gleichungssystems (101) bzw. (102) berechnet.Unter den genannten Voraussetzungen ist das lineare Gleichungssystem stets eindeutig losbar.

aAnstelle des Begriffs ”Ausgleichsgerade“ sind auch die Begriffe ”Regressionsgerade“ oder ”empirische Ausgleichsgerade“gebrauchlich.

Zudem kann nachgewiesen werden, dass fur die aus (101) bzw. (102) berechneten Werte von a1 und a0 tatsachlichein Minimum der Funktion S(a1, a0) (siehe (100)) vorliegt.

Beispiel 6.21:Der Widerstand eines metallischen Leiters in Abhangigkeit von der Temperatur T wird durch die folgende Glei-chung beschrieben:

RT = R0 +R0 · β · T(RT : Widerstand bei der Temperatur T , R0: Widerstand bei der Temperatur 0C, β: Temperaturkoeffizient).Um eine Berechnung der unbekannten GroßenR0 und β vornehmen zu konnen, wurden die folgenden Messwer-te aufgenommen:

T [C] 20 40 60 80

RT [Ω] 1.66 1.76 1.86 2.00

Gesucht ist die zugehorige Ausgleichsgerade.

37

Es ist nicht in jedem Fall sinnvoll, nach einem linearen Zusammenhang zwischen den Großen x und y zu suchen(nach Einzeichnen der Punkte mit den Koordinaten (xi, yi), i = 1, . . . , n, in ein ebenes Koordinatensystemkonnte anhand der Lage dieser Punkte z.B. auch ein quadratischer Zusammenhang zwischen x und y vermutetwerden). Allgemein gilt:Wenn anstelle der Ausgleichsgeraden ein Ausgleichspolynom m-ten Grades (m ≥ 2) berechnet werden soll, istein Ansatz der Form

y = f(x) = amxm + am−1x

m−1 + . . . + a1x+ a0

mit unbekannten Koeffizienten am, . . . , a0 zu wahlen. Die weiteren Arbeitsschritte verlaufen ahnlich wie beider Berechnung der Ausgleichsgeraden: Zunachst muss eine zu (100) analoge Beziehung, jetzt mitS = S(a0, . . . , am), aufgestellt werden. Dann sind die notwendigen Bedingungen fur ein Minimum dieserFunktion zu formulieren, was auf ein lineares Gleichungssystem zur Berechnung dermUnbekannten a0, . . . , amfuhrt.Fur detailliertere Ausfuhrungen zur Berechnung von Ausgleichspolynomen vom Grad m = 2 (Ausgleichs-parabeln) sei auf die folgende Literaturstelle verwiesen:

L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 710-714.

6.6 Weitere raumliche Koordinatensysteme

Fur die Darstellung von Funktionen zweier unabhangiger Variabler (siehe Abschnitt 6.1) wurde bisher stets einraumliches kartesisches Koordinatensystem verwendet. Besitzt die zu beschreibende Funktion bzw. Punktmen-ge gewisse Symmetrieeigenschaften, kann eine Darstellung mittels krummliniger Koordinaten (Zylinderkoordi-naten oder Kugelkoordinaten) vorteilhaft sein.

1) ZylinderkoordinatenWenn eine rotationssymmetrische Punktmenge (z.B. ein gerader Kreiszylinder) dargestellt werden soll, emp-fiehlt sich der Ubergang zu Zylinderkoordinaten.Der Zusammenhang zwischen kartesischen Koordinaten (x, y, z) und Zylinderkoordinaten (r, ϕ, z) ist gege-ben durch:

x = r · cosϕ , y = r · sinϕ , z = z (r ≥ 0, 0 ≤ ϕ < 2π). (103)

Die Koordinaten r und ϕ konnen wie folgt anschaulich interpretiert werden (siehe dazu auch Bild 6.5a)):Durch orthogonale Projektion der Strecke OP auf die (x, y)-Ebene entsteht die Strecke OP ′ . Dann bezeich-net r die Lange der Strecke OP ′ (d.h. den Abstand des Punktes P ′ vom Koordinatenursprung) und ϕ den(mathematisch positiv orientierten) Winkel zwischen der x-Achse und der Strecke OP ′.

jx

6z

* y

6

r

rP (x, y, z)

P ′(x, y, 0)

z

ϕr

O

jx

6z

* y

6

r

rP (x, y, z)

P ′(x, y, 0)jϑ

ϕ

r

O

Bild 6.5a) Bild 6.5b)

Beispiel 6.22:

38

2) KugelkoordinatenDer Ubergang zu Kugelkoordinaten ist z.B. dann zweckmaßig, wenn die betrachtete Punktmenge eine Kugeloder ein Kugelausschnitt ist. Der Zusammenhang zwischen kartesischen Koordinaten (x, y, z) und Kugel-koordinaten (r, ϕ, ϑ) wird durch die folgenden Gleichungen beschrieben:

x = r · cosϕ · sinϑ , y = r · sinϕ · sinϑ , z = r · cosϑ (r ≥ 0, 0 ≤ ϕ < 2π, 0 ≤ ϑ ≤ π). (104)

Die Koordinaten r, ϕ und ϑ konnen wie folgt anschaulich interpretiert werden (siehe dazu auch Bild 6.5b)):Sei OP ′ wiederum die Strecke, welche durch orthogonale Projektion der Strecke OP auf die (x, y)-Ebeneentsteht . Dann bezeichnet r die Lange der Strecke OP (d.h. den Abstand des Punktes P vom Koordinaten-ursprung) und ϕ den (mathematisch positiv orientierten) Winkel zwischen der x-Achse und der Strecke OP ′.Der Winkel zwischen der z-Achse und der Strecke OP heißt ϑ.

Beispiel 6.23:

6.7 Weitere Anwendungen der Differentialrechnung fur Funktionen mehrerer reeller Varia-bler: Vektoranalysis (Einblick)

Die Vektoranalysis (Feldtheorie) wird z.B. bei der Beschreibung von elektrischen Feldern, Gravitationsfeldernund Stromungsfeldern angewendet. Ein zentraler Begriff in der Vektoranalysis ist der Begriff des Feldes. Dieserund weitere Grundbegriffe werden im nachfolgenden Abschnitt eingefuhrt.

6.7.1 Einige Grundbegriffe

Ortsvektor: Der Ortsvektor ~r des Raumpunktes mit den Koordinaten (x, y, z) ist: ~r =

xyz

.

Skalarfeld: Ein Skalarfeld ist eine Abbildung von R3 nach R.Jedem Raumpunkt wird eine reelle Zahl U = U(x, y, z) = U(~r) zugeordnet.U(~r) wird als skalare Feldfunktion bezeichnet.

Vektorfeld: Ein Vektorfeld ist eine Abbildung von R3 nach R3.Jedem Raumpunkt wird ein Vektor ~V = ~V (x, y, z) = ~V (~r) zugeordnet.

~V (~r) wird vektorielle Feldfunktion genannt; Schreibweise: ~V (~r) =

V1(~r)V2(~r)V3(~r)

Bei praktischen Anwendungen entspricht U einer skalaren physikalischen Große und ~V einer vektoriellen phy-sikalischen Große.

Beispiel 6.24:

39

Definition 6.8:

Der Vektor grad U =∂U

∂x~ex +

∂U

∂y~ey +

∂U

∂z~ez =

∂U

∂x

∂U

∂y

∂U

∂z

heißt Gradient des Skalarfeldes U = U(~r).

Eine andere Schreibweise fur grad U ist: ∇U oder ~∇U (∇: Nabla-Operator).

Der Gradient eines Skalarfeldes U = U(~r) gibt die Richtung der maximalen Anderung von U an.

Beispiel 6.25:

Beispiel 6.26:Die Temperatur eines Materials sei durch T = T0(1 + ax + by)ecz gegeben, wobei a, b, c und T0 Konstantesind (T0 > 0). Zu bestimmen ist im Koordinatenursprung die Richtung, in der sich die Temperatur am starkstenandert.

Im weiteren werden einige Rechenregeln fur den Gradienten angegeben.

Rechenregeln fur den Gradienten von SkalarfeldernSeien U , U1 und U2 Skalarfelder, dann gilt:

1) grad (cU) = c grad U (c: reelle Konstante)

2) grad (U1 + U2) = grad U1 + grad U2

3) grad (U1 · U2) = U1 grad U2 + U2 grad U1

4) grad f(U) =∂f(U)

∂Ugrad U

Bemerkungen:

- Bei einem ebenen Skalarfeld U(x, y) besitzt der Gradient nur zwei Komponenten: grad U =

∂U

∂x

∂U

∂y

.

- Die Darstellungen des Gradienten in Polar-, Zylinder- oder Kugelkoordinaten sind z.B. in:G. MERZIGER, G. MUHLBACH, D. WILLE, TH. WIRTH. Formeln + Hilfen Hohere Mathematik, 7. Auflage,S. 154 zu finden.

6.7.2 Divergenz eines Vektorfeldes

Zunachst soll eine physikalische Deutung12 der Divergenz eines Vektorfeldes gegeben werden.Als Beispiel wird das Vektorfeld (Geschwindigkeitsfeld) ~v = ~v(~r) einer stationaren stromenden Flussigkeit mit

12Quelle: W. LEUPOLD (Hrsg.). Mathematik - ein Studienbuch fur Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysisfur mehrere Variable - Stochastik), 2. Auflage, S. 254-255

40

konstanter Dichte gewahlt.Betrachtet man einen Raumteil mit dem Volumen ∆V , dann stellt sich die Frage, wie groß die Differenz zwi-schen der in diesen Raumteil einstromenden und der aus diesem Raumteil ausstromenden Flussigkeit (bezogenauf eine Zeiteinheit) ist. Fließt mehr Flussigkeit hinein als heraus, dann muss in dem Raumteil Flussigkeit ver-schwinden, d.h. es existieren Senken. Fließt umgekehrt mehr Flussigkeit heraus als hinein, dann mussen indiesem Raumteil Quellen vorhanden sein.Der Uberschuss der austretenden uber die eintretende Flussigkeit wird Ergiebigkeit E der Quelle genannt.

Fur Senken ist E < 0. Fur das Volumen ∆V ist die mittlere Quelldichte gleichE

∆V.

Die Quelldichte in einem Punkt des Vektorfeldes ~v = ~v(~r) wird als Divergenz des Vektorfeldes bezeichnet:

div~v = lim∆V→0E

∆V(E: Ergiebigkeit der Quelle, ∆V : Volumen des betrachteten Raumteils).

Die Divergenz eines Vektorfeldes ~V lasst sich wie folgt mit Hilfe der partiellen Ableitungen der Komponentenvon ~V ausdrucken13.

Berechnung der Divergenz eines Vektorfeldes

Die Divergenz des Vektorfeldes ~V = ~V (~r) =

V1(~r)V2(~r)V3(~r)

=

V1(x, y, z)V2(x, y, z)V3(x, y, z)

wird nach der folgenden Formel berechnet:

div ~V =∂V1

∂x+∂V2

∂y+∂V3

∂z. (105)

Unter Verwendung des Nabla-Operators (siehe Definition 6.8) ist auch die folgende Schreibweise moglich:div ~V = ∇ · ~V .

Beispiel 6.27:

Wenn in allen Punkten eines Vektorfeldes ~V gilt: div ~V = 0, dann nennt man dieses Vektorfeld quellenfrei.

Beispiel 6.28:

13Eine Herleitung dieser Formel findet man z.B. in: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3,5. Auflage, S. 71-74.

41

Fur das Rechnen mit der Divergenz von Vektorfeldern gelten die nachstehend aufgefuhrten Regeln.

Rechenregeln fur die Divergenz von VektorfeldernSeien ~V , ~V1 und ~V2 Vektorfelder, U ein Skalarfeld sowie ~a ein konstanter Vektor. Dann gilt:

1) div~a = 0

2) div (c~V ) = cdiv ~V (c: reelle Konstante)

3) div (~V1 + ~V2) = div ~V1 + div ~V2

4) div (U ~V ) = Udiv ~V + ~V · gradU

Bemerkungen:

- In einem elektrischen Feld mit ruhender Punktladung ist diese Ladung eine Quelle oder eine Senke(in Abhangigkeit davon, ob es sich um eine positive oder eine negative Ladung handelt).

- Im Fall eines ebenen Vektorfeldes besitzt ~V nur die Komponenten V1 und V2. Bei der Berechnung von div ~Ventfallt dann der letzte Summand auf der rechten Seite von (105).

- Die Darstellungen der Divergenz in Polar-, Zylinder- oder Kugelkoordinaten sind z.B. in:G. MERZIGER, G. MUHLBACH, D. WILLE, TH. WIRTH. Formeln + Hilfen Hohere Mathematik, 7. Auflage,S. 155 zu finden.

6.7.3 Rotation eines Vektorfeldes

Auch hier wird zunachst eine physikalische Deutung14 angegeben.Es wird das Geschwindigkeitsfeld einer stationaren Stromung be-trachtet, z.B. fließendes Wasser in einem Kanal. Die Stromungs-geschwindigkeit ist dabei in der Kanalmitte am großten undnimmt (bedingt durch Reibungskrafte) zum Ufer hin ab. Kleine,in die Stromung gebrachte Kugeln rotieren in Ufernahe infolgedes dortigen Geschwindigkeitsgefalles um ihre Achsen.

I

--

---

Diese Rotation lasst sich in geeigneter Weise durch einen Vektor mit der Bezeichnung ”Rotation des Geschwin-digkeitsfeldes“ beschreiben, wobei

Richtung dieses Vektors: Drehachse der rotierenden Kugel (bzw. des Wasserteilchens)Betrag dieses Vektors: doppelte Winkelgeschwindigkeit der Drehung (Maß fur die ”Starke“ der

Flussigkeitswirbel)

Die Rotation eines Vektorfeldes ~V lasst sich wie folgt mit Hilfe der partiellen Ableitungen der Komponentenvon ~V ausdrucken (siehe nachste Seite).

14Quellen: W. LEUPOLD (Hrsg.). Mathematik - ein Studienbuch fur Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysisfur mehrere Variable - Stochastik), 2. Auflage, S. 258 sowie L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3,5. Auflage, S. 79-80

42

Berechnung der Rotation eines Vektorfeldes

Die Rotation des Vektorfeldes ~V = ~V (~r) =

V1(~r)V2(~r)V3(~r)

=

V1(x, y, z)V2(x, y, z)V3(x, y, z)

wird nach der folgenden Formel berechnet:

rot ~V =

∣∣∣∣∣∣∣∣~ex ~ey ~ez∂

∂x

∂y

∂z

V1 V2 V3

∣∣∣∣∣∣∣∣ =

∂V3

∂y− ∂V2

∂z

∂V1

∂z− ∂V3

∂x

∂V2

∂x− ∂V1

∂y

. (106)

Unter Verwendung des Nabla-Operators ist auch die folgende Schreibweise moglich: rot ~V = ∇× ~V .

In der englischsprachigen Literatur ist die Bezeichnung curl ~V anstelle von rot ~V ublich.

Man beachte, dass bei der Berechnung der Rotation (im Gegensatz zur Divergenz) wieder ein Vektorfeld entsteht.Das Vektorfeld rot ~V wird auch als Wirbelfeld zu ~V oder als Wirbeldichte von ~V bezeichnet.

Falls in allen Punkten eines Vektorfeldes ~V gilt: rot ~V = ~0, dann nennt man dieses Vektorfeld wirbelfrei.

Beispiel 6.29:

Rechenregeln fur die Rotation von VektorfeldernSeien V , V1 und V2 Vektorfelder, U ein Skalarfeld sowie ~a ein konstanter Vektor, dann gilt:

1) rot~a = ~0

2) rot (c~V ) = c rot ~V (c: reelle Konstante)

3) rot (~V1 + ~V2) = rot ~V1 + rot ~V2

4) rot (U ~V ) = Urot ~V + gradU × ~V

Bemerkungen:

- Im Fall eines ebenen Vektorfeldes ~V (~r) = ~V (x, y) =

(V1(x, y)

V2(x, y)

)gilt: rot ~V =

0

0∂V2

∂x− ∂V1

∂y

,

denn sowohl V3 und dessen partielle Ableitungen als auch die partiellen Ableitungen von V1 und V2 nach zverschwinden.

- Die Darstellungen der Rotation in Zylinder- oder Kugelkoordinaten findet man z.B. in:G. MERZIGER, G. MUHLBACH, D. WILLE, TH. WIRTH. Formeln + Hilfen Hohere Mathematik, 7. Auflage,S. 155.

43

6.8 Integralrechnung fur Funktionen zweier reeller Variabler

Der Integralbegriff soll nun auf Funktionen mehrerer reeller Variabler ausgedehnt werden. Dabei werden (jenachdem, von wievielen Variablen die zu integrierende Funktion abhangt) zweidimensionale und dreidimen-sionale Bereichsintegrale unterschieden. Derartige Integrale finden Anwendung z.B. bei der Berechnung vonSchwerpunkten und Tragheitsmomenten von Flachen oder Korpern. Im Rahmen dieser Lehrveranstaltung wirdnur auf zweidimensionale Bereichsintegrale eingegangen.

6.8.1 Zweidimensionale Bereichsintegrale: Definition und Berechnung

Definition 6.9: Die Funktion f(x, y) sei auf dem zweidimensionalen Bereich B definiert und stetig.Weiterhin sei der Bereich B in n Teilbereiche mit den Flacheninhalten ∆B1, ∆B2, . . . , ∆Bn zerlegt.Dann wird der Grenzwert

limn→∞

(∆Bk→0)

n∑k=1

f(xk, yk) ∆Bk

(falls er existiert) als zweidimensionales Bereichsintegral bezeichnet.

Fur ein solches Integral wird die folgende Schreibweise verwendet:¨

B

f(x, y) dB. Dabei sind:

B - Integrationsbereichf(x, y) - IntegranddB - Flachendifferential (oder Flachenelement)

Das zweidimensionale Bereichsintegral kann auf folgende Weise geometrisch gedeutet werden.15

Fur die Funktion f(x, y) seien die in der Definition 6.9 genannten Voraussetzungen erfullt. Des weiteren wirdein raumlicher, zylindrischer Bereich betrachtet, der die folgenden Eigenschaften hat (siehe auch Bild 6.6):

- ”Boden“ des Zylinders: Bereich B der (x, y)-Ebene

- ”Deckel“ des Zylinders: die Bildflache von z = f(x, y)

- Die auf dem Rand des Bereiches B errichteten Mantellinienverlaufen parallel zur z-Achse.

6

-

x

z

y

Bereich B

PPZylinder

QQ

Flache z = f(x, y)

Mantellinien

Bild 6.6

Wenn das Volumen dieses Zylinders bestimmt werden soll, kann wie folgt vorgegangen werden:

- Zerlegung des Bereiches B in n Teilbereiche mit den Flacheninhalten ∆B1, ∆B2, . . . ,∆Bn(Zylinder wird dadurch aufgeteilt in n ”Saulen”)

- Volumen ∆Vk der k-ten Saule: ∆Vk ≈ ∆Bkzk = f(xk, yk)∆Bk (Inhalt der Grundflache: ∆Bk ,Naherungswert fur die Hohe: Hohenkoordinate zk = f(xk, yk) des Flachenpunktes Pk = (xk, yk))

- Naherungswert fur das Volumen V durch Aufsummieren der Saulenvolumina:

V =

n∑k=1

∆Vk ≈n∑k=1

f(xk, yk)∆Bk

- Verbesserung des Naherungswertes, indem Anzahl der Saulen vergroßert wird (n→∞, wobei: ∆Bk → 0),Grenzwert fuhrt zum zweidimensionalen Bereichsintegral (s. oben)

15Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 266-268

44

Die Berechnung eines zweidimensionalen Bereichsintegrals kann auf zwei nacheinander auszufuhrende Integra-tionen nach einer reellen Variablen zuruckgefuhrt werden, d.h. es erfolgt die Berechnung eines Doppelintegrals(siehe auch unten: Formeln (107) und (108)). Dabei konnen sowohl kartesische Koordinaten als auch Polarkoor-dinaten verwendet werden.1) Zweidimensionale Bereichsintegrale in kartesischen Koordinaten

Um die Vorgehensweise bei der Berechnung zweidimensionaler Bereichsintegrale in kartesischen Koordi-naten beschreiben zu konnen, wird zunachst der Begriff des ebenen kartesischen Normalbereiches benotigt.Ein ebener Bereich B wird als kartesischer Normalbereich bezeichnet, wenn er durch

B = (x, y) | a ≤ x ≤ b, f1(x) ≤ y ≤ f2(x) (f1(x), f2(x) : im Intervall [a, b] stetige Funktionen)

oder

B = (x, y) | g1(y) ≤ x ≤ g2(y), a ≤ y ≤ b (g1(y), g2(y) : im Intervall [a, b] stetige Funktionen)

beschrieben werden kann. Bild 6.7a) zeigt einen ebenen kartesischen Normalbereich, welcher in x-Richtungdurch die Geraden x = a und x = b sowie in y-Richtung durch die Kurven y = f1(x) und y = f2(x)begrenzt wird. Bei dem in Bild 6.7b) dargestellten ebenen kartesischen Normalbereich ist die Begrenzungin x-Richtung durch die Kurven x = g1(y) und x = g2(y) sowie die Begrenzung in y-Richtung durch dieGeraden y = a und y = b gegeben.

6

-x

y

y = f2(x)

y = f1(x)

a b

6

-x

y

x = g1(y) x = g2(y)

B B

a

b

Bild 6.7a) Bild 6.7b)

Berechnung eines Integrals uber einem ebenen kartesischen NormalbereichBDer ebene kartesische NormalbereichB sei gegeben durch:B = (x, y)|a ≤ x ≤ b, f1(x) ≤ y ≤ f2(x)mit stetigen Funktionen f1(x) und f2(x) (siehe Bild 6.7a)). Dann gilt:

¨

B

f(x, y) dB =

x=a

f2(x)ˆ

y=f1(x)

f(x, y) dy dx . (107)

Der Ausdruck auf der rechten Seite von (107) heißt Doppelintegral. Bei der Berechnung dieses Integralserfolgt zuerst die innere Integration (nach der Variablen y; dabei wird x wie eine Konstante betrachtet).Danach wird die außere Integration (nach der Variablen x) durchgefuhrt.Wenn der ebene kartesische Normalbereich in der Form B = (x, y) | a ≤ y ≤ b, g1(y) ≤ x ≤ g2(y)mit stetigen Funktionen g1(y) und g2(y) (siehe Bild 6.7b)) vorliegt, dann gilt:

¨

B

f(x, y) dB =

y=a

g2(y)ˆ

x=g1(y)

f(x, y) dx dy , (108)

d.h. es wird zuerst nach x und anschließend nach y integriert.

Außer der soeben genannten Integrationsvorschrift, namlich dass die Integration stets von innen nach außendurchgefuhrt werden muss16, sind weitere wichtige Regeln bei der Berechnung von Doppelintegralen zubeachten. Diese werden im folgenden angegeben (siehe nachste Seite).

16D.h. die Reihenfolge der Differentiale im Doppelintegral legt die Reihenfolge der Integrationen fest.

45

Weitere Regeln fur die Berechnung von Doppelintegralen1) Bei Vertauschung der Integrationsreihenfolge mussen die Integrationsgrenzen neu bestimmt werden

(Ausnahme: alle Integrationsgrenzen sind konstant, d.h. der Integrationsbereich ist ein achsenparallelesRechteck: B = (x, y) | a1 ≤ x ≤ b1 , a2 ≤ y ≤ b2).

2) Die im Abschn. 5.1.2 genannten Integrationsregeln gelten in analoger Weise auch fur Doppelintegrale.

Beispiel 6.30:

Beispiel 6.31:

2) Zweidimensionale Bereichsintegrale in PolarkoordinatenIn manchen Fallen (z.B. wenn der Integrationsbereich ein Kreis, ein Kreisring oder ein Kreissektor ist) ver-einfacht sich die Berechnung des Integrals, wenn Polarkoordinaten verwendet werden. Der Zusammenhangzwischen kartesischen Koordinaten und Polarkoordinaten ist gegeben durch:

x = r · cosϕ , y = r · sinϕ (r ≥ 0, 0 ≤ ϕ < 2π) (109)

(siehe dazu auch Abschnitt 3.2.1 im Skript zur Vorlesung Mathematik 1).

Um nun die Berechnung des Integrals¨

B

f(x, y) dB in Polar-

koordinaten durchfuhren zu konnen, mussen sowohl die Grenzendes Bereiches B als auch der Integrand mit Hilfe der Variablen rund ϕ ausgedruckt werden. Des weiteren ist eine Transformationdes Flachendifferentials dB in Polarkoordinaten vorzunehmen.Man erhalt: dB ≈ r drdϕ (siehe dazu auch Bild 6.8: der Inhaltder grau unterlegten Flache ist annahernd gleich dem Flachenin-halt eines Rechtecks mit den Seitenlangen rdϕ und dr).

6

-

I

x

y

rdϕ dr

r r + dr

ϕ

ϕ+ dϕ

dB ≈ rdrdϕ

0

Bild 6.8

Berechnung zweidimensionaler Bereichsintegrale in PolarkoordinatenDer Integrationsbereich B sei in Polarkoordinaten gegeben durch:B = (r, ϕ) | ϕ1 ≤ ϕ ≤ ϕ2, r1(ϕ) ≤ r ≤ r2(ϕ) (mit stetigen Funktionen r1(ϕ) und r2(ϕ)). Dann gilt:

¨

B

f(x, y) dB =

ϕ2ˆ

ϕ=ϕ1

r2(ϕ)ˆ

r=r1(ϕ)

f(r · cosϕ, r · sinϕ) rdrdϕ . (110)

Bei dem Doppelintegral auf der rechten Seite von (110) ist zuerst die innere Integration (nach der Varia-blen r; dabei wird ϕ wie eine Konstante betrachtet) vorzunehmen. Danach wird die außere Integration(nach der Variablen ϕ) durchgefuhrt.Wenn der Integrationsbereich in der Form B = (r, ϕ) | r1 ≤ r ≤ r2, ϕ1(r) ≤ ϕ ≤ ϕ2(r)(mit stetigen Funktionen ϕ1(r) und ϕ2(r)) vorliegt, dann gilt:

¨

B

f(x, y) dB =

r2ˆ

r=r1

ϕ2(r)ˆ

ϕ=ϕ1(r)

f(r · cosϕ, r · sinϕ) rdϕdr , (111)

d.h. zuerst wird nach ϕ und anschließend nach r integriert.

Beispiel 6.32:

46

6.8.2 Anwendungen des zweidimensionalen Bereichsintegrals

1) Berechnung des Flacheninhaltes eines ebenen kartesischen Normalbereiches

FlacheninhaltA eines ebenen NormalbereichesB

A =

¨

B

1 dB =

¨

B

dB

Berechnung in kartesischen KoordinatenDer Normalbereich sei gegeben durch: B = (x, y) | a ≤ x ≤ b , f1(x) ≤ y ≤ f2(x)(mit stetigen Funktionen f1(x) und f2(x); vgl. auch Bild 6.7a)). Dann gilt gemaß Formel (107):

A =

x=a

f2(x)ˆ

y=f1(x)

dy dx .

Berechnung in PolarkoordinatenDer Normalbereich sei gegeben durch: B = (r, ϕ) | ϕ1 ≤ ϕ ≤ ϕ2 , r1(ϕ) ≤ r ≤ r2(ϕ)(mit stetigen Funktionen r1(ϕ) und r2(ϕ)). Dann gilt gemaß Formel (110):

A =

ϕ2ˆ

ϕ=ϕ1

r2(ϕ)ˆ

r=r1(ϕ)

rdrdϕ .

Soll bei der Berechnung in kartesischen Koordinaten zuerst nach x, dann nach y integriert werden (Integra-tionsgrenzen beachten!), kommt Formel (108) anstelle von Formel (107) zur Anwendung (analog bei Polar-koordinaten: Formel (111) statt (110), wenn die Integration nach ϕ zuerst erfolgen soll).Im Fall der Flachenberechnung in kartesischen Koordinaten kann sehr leicht der Zusammenhang zur In-tegration von Funktionen einer reellen Variablen (siehe Abschnitt 5.3.1) hergestellt werden. Wenn bei derBerechnung des o.g. Doppelintegrals nur die innere Integration (d.h. die Integration nach y) vorgenommenwird, dann erhalt man:

A =

x=a

f2(x)ˆ

y=f1(x)

dy dx =

x=a

[y]f2(x)

y=f1(x)dx =

a

(f2(x)− f1(x)) dx .

Das entspricht aber genau der Formel (75) aus Abschnitt 5.3.1.

Beispiel 6.33:

47

2) Berechnung der Masse und des Massenschwerpunktes eines ebenen Bereiches

Masse eines ebenen BereichesB

m =

¨

B

%(x, y) dB (% : auf B gegebene, stetige Massendichte)

Koordinaten des Massenschwerpunktes eines ebenen BereichesB

xS =1

m·¨

B

x%(x, y) dB , yS =1

m·¨

B

y%(x, y) dB

(m: Masse des Bereiches, %: auf B gegebene, stetige Massendichte)

Wenn es sich um einen homogenen ebenen Bereich handelt (d.h. die Massendichte ist auf B konstant), falltder Massenschwerpunkt mit dem geometrischen Schwerpunkt (Flachenschwerpunkt) zusammen. In denFormeln fur xS und yS kann dann der Faktor 1

m durch den Faktor 1A ersetzt und %(x, y) ≡ 1 gesetzt werden.

Beispiel 6.34:

3) Berechnung von Flachentragheitsmomenten (Flachenmomenten 2. Grades)

Das Flachentragheitsmoment ist ein Maß fur die Steifigkeit eines ebenen Querschnitts gegen Biegung undTorsion. Es werden die (axialen) Flachentragheitsmomente bzgl. der x- und der y-Achse (Bezeichnung: Ixund Iy) sowie das polare Flachentragheitsmoment Ip (bzgl. des Koordinatenursprungs) unterschieden.

Flachentragheitsmomente bezuglich der x- und der y-Achse sowie polares Flachentragheitsmoment

Ix =

¨

B

y2%(x, y) dB , Iy =

¨

B

x2%(x, y) dB , Ip =

¨

B

(x2 + y2)%(x, y) dB = Ix + Iy

(%: auf gegebene, stetige Massendichte)

Bemerkungen:

- Die Berechnung der unter 2) und 3) genannten Integrale kann - je nach Art des Integrationsbereiches -unter Verwendung von kartesischen Koordinaten oder von Polarkoordinaten erfolgen. Im Fall kartesischerKoordinaten kommen die Formeln (107) oder (108) (je nach Integrationsreihenfolge), bei Polarkoordinatenentsprechend die Formeln (110) oder (111) zur Anwendung.

- Die Berechnung dreidimensionaler Bereichsintegrale kann auf drei nacheinander auszufuhrende Integratio-nen nach einer reellen Variablen zuruckgefuhrt werden, d.h. es erfolgt die Berechnung eines Dreifachinte-grals. Auch hier wird von innen nach außen integriert. Zur Berechnung dreidimensionaler Bereichsintegralekonnen- je nach Art des Integrationsbereiches - kartesische Koordinaten oder Zylinderkoordinaten bzw. Ku-gelkoordinaten (siehe Abschnitt 6.6) verwendet werden.

48

7 Gewohnliche Differentialgleichungen (Grundlagen)

7.1 Einfuhrung

Definition 7.1: Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-tenOrdnung auftreten, heißt gewohnliche Differentialgleichung n-ter Ordnung. Man unterscheidet dabei noch:implizite Form: F (x, y, y′, . . . , y(n)) = 0

explizite Form: y(n) = f(x, y, y′, . . . , y(n−1)).

Beispiel 7.1:

Definition 7.2: Eine Funktion y = y(x) heißt Losung der Differentialgleichung, wenn sie mit ihrenAbleitungen die Differentialgleichung identisch erfullt.

Bezuglich der Losungen einer Differentialgleichung wird noch die folgende Unterscheidung getroffen:

(1) allgemeine Losung einer Differentialgleichung n-ter Ordnung:Diese enthalt noch n voneinander unabhangige, frei wahlbare Parameter (Konstante).Es handelt sich hier nicht um eine einzelne Funktion, welche die Differentialgleichung lost, sondern um eineSchar von Losungen (bei der grafischen Darstellung der Losungsmenge: eine Schar von Losungskurven).

(2) partikulare (spezielle) Losung einer Differentialgleichung n-ter Ordnung:Eine solche Losung wird durch eine spezielle Wahl der Parameter aus der allgemeinen Losung gewonnen.Die Werte dieser Parameter ergeben sich dadurch, dass die Losungsfunktion zusatzliche Bedingungen erful-len soll, siehe dazu Beispiel 7.12 im Abschnitt 7.3.

(3) singulare Losung einer Differentialgleichung n-ter Ordnung:Das ist eine Losung der Differentialgleichung, die nicht aus der allgemeinen Losung gewonnen werdenkann.

Beispiel 7.2:

Bemerkung:

Neben gewohnlichen Differentialgleichungen gibt es noch partielle Differentialgleichungen. Diese enthaltenpartielle Ableitungen (siehe Kapitel 6) einer unbekannten Funktion von mehreren Variablen.

49

Zahlreiche Problemstellungen in Physik und Technik lassen sich mit Hilfe gewohnlicher Differentialgleichungenmodellieren und losen. Im weiteren werden zwei Beispiele dazu betrachtet.

Beispiel 7.3: Harmonische Schwingung eines Feder-Masse-Schwingers (Federpendels)17

Dieses einfache Modell eines schwingungsfahigenSystems laßt sich durch eine Differentialgleichungbeschreiben.

m

elast. Feder

Bei der Modellierung werden die folgenden Krafte berucksichtigt:- Ruckstellkraft der Feder: F1 = −cx (c: Federkonstante, x: Auslenkung der Feder zur Zeit t)

- Reibungskraft: F2 = −kv (k: Reibungskoeffizient, v: Geschwindigkeit).Nach dem zweiten Newtonschen Gesetz gilt:

ma = F = F1 + F2 = −cx− kv ,wobei a die Beschleunigung bezeichnet. Auf Grund der Beziehungen v = x und a = x (vgl. dazu auch: Ab-schnitt 4.2.1 im Skript zur Vorlesung Mathematik 1) entsteht daraus die folgende Differentialgleichung 2. Ord-nung (Schwingungsgleichung der Mechanik):

mx = −cx− kx bzw. mx+ kx+ cx = 0 .

Wichtiger Spezialfall: k = 0 (d.h. es treten keine Reibungskrafte auf)

mx+ cx = 0 oder x+ ω20 x = 0 (mit ω2

0 =c

m)

Beispiel 7.4:Die Differentialgleichung der Bewegung eines Fadenpendels lautet:

ml2 α+mg l sinα = 0 bzw. α+g

lsinα = 0 ,

wobei die folgenden Bezeichnungen gelten: m: Masse, l: Lange des Fadens, α = α(t): Auslenkwinkel.

7.2 Losungsmethoden fur lineare Differentialgleichungen 1. und 2. Ordnung

Allgemein werden lineare und nichtlineare Differentialgleichungen unterschieden. Im Rahmen dieser Lehrver-anstaltung werden ausschließlich lineare Differentialgleichungen 1. und 2. Ordnung behandelt.

7.2.1 Lineare Differentialgleichungen 1. Ordnung

Definition 7.3:Eine Differentialgleichung 1. Ordnung heißt linear, wenn sie in der folgenden Form darstellbar ist:

y′ + f(x) · y = g(x) . (112)

Die Funktion g(x) wird Storfunktion oder Storglied genannt.Falls g(x) = 0 gilt, wird die Differentialgleichung als homogene lineare Differentialgleichung bezeichnet.Anderenfalls handelt es sich um eine inhomogene lineare Differentialgleichung.

Beispiel 7.5:

Bei der Erlauterung der Methoden zur Losung linearer Differentialgleichungen wird zunachst der Fall einerhomogenen Gleichung betrachtet (d.h. Gleichung (112) mit g(x) = 0).

17Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 348-349

50

Losung einer homogenen linearen Differentialgleichung 1. OrdnungDie Differentialgleichung y′ + f(x) · y = 0 hat die allgemeine Losung:

y = C · e−´f(x) dx (C ∈ R) . (113)

Beispiel 7.6:

Bezuglich der Losungsmenge von linearen inhomogenen Differentialgleichungen 1. Ordnung gilt allgemein diefolgende Aussage.

Darstellung der Losung einer inhomogenen linearen Differentialgleichung 1. OrdnungDie allgemeine Losung y = y(x) der Differentialgleichung y′ + f(x) · y = g(x) (mit g(x) 6= 0 )ist stets in der Form

y(x) = yh(x) + yp(x) (114)

darstellbar, wobei die folgenden Bezeichnungen geltenyh(x): allgemeine Losung der zugehorigen homogenen Differentialgleichung y′ + f(x) · y = 0,yp(x): (beliebige) partikulare Losung der inhomogenen Differentialgleichung.

Zur Berechnung von yh(x) aus (114) kann die Formel (113) verwendet werden. Um eine partikulare Losung yp(x)zu ermitteln, konnen (wenn weitere Voraussetzungen erfullt sind) spezielle Ansatze genutzt werden. Diese Vor-gehensweise wird im folgenden erlautert.

Eine lineare Differentialgleichung 1. Ordnung mit konstanten Koeffizienten hat die Gestalt:

y′ + a · y = g(x) mit a ∈ R. (115)

Es handelt sich um einen Spezialfall der bisher betrachteten Differentialgleichungen vom Typ (112), und zwargilt hier: f(x) = a, a ∈ R.Wenn die Storfunktion g(x) von einem speziellen Funktionstyp (z.B. Exponentialfunktion, Polynom oder tri-gonometrische Funktion) ist, bietet sich die Losung mit Hilfe eines speziellen Ansatzes an18. Zunachst wirddie Vorgehensweise bei einem solchen Losungsweg beschrieben und anschließend werden mogliche Ansatzevorgestellt.

Berechnung der allgemeinen Losung linearer Differentialgleichungen 1. Ordnungmit konstanten Koeffizienten bei Vorliegen spezieller Storfunktionen

1) Die allgemeine Losung der zugehorigen homogenen Differentialgleichung y′+a ·y = 0 wird berechnet.

Diese Losung lautet gemaß (113): yh = C · e−´a dx = C · e−ax (C ∈ R).

2) Um eine partikulare Losung yp der inhomogenen Differentialgleichung (115) zu finden, wird ein Ansatzin Form einer Funktion, die im Wesentlichen dem Typ der Storfunktion entspricht, verwendet(haufig verwendete Ansatze: siehe nachste Seite).

3) Die allgemeine Losung y von (115) ergibt sich gemaß (114) als: y = yh + yp .

18Dafur wird haufig auch die Bezeichnung ”Storgliedansatz“ verwendet.

51

Ubersicht uber Ansatze fur die partikulare Losung yp der inhomogenen Differentialgleichungy′ + a · y = g(x) (a 6= 0)

Storfunktion g(x) Losungsansatz fur yp(x)

konstante Funktion konstante Funktion yp = a0, Parameter: a0

lineare Funktion lineare Funktion yp = a1x+ a0

(Polynom 1. Grades) Parameter: a0, a1

quadratische Funktion quadratische Funktion yp = a2x2 + a1x+ a0

(Polynom 2. Grades) Parameter: a0, a1, a2

Polynom n-ten Grades Polynom n-ten Grades yp = anxn + . . .+ a1x+ a0

Parameter: a0, a1, . . . , an

g(x) = b · ecx yp = A · ecx fur c 6= −a(b, c ∈ R) yp = A · x · ecx fur c = −a

Parameter: A

g(x) = c · sin(ωx) yp = A · sin(ωx) +B · cos(ωx)

g(x) = c · cos(ωx) Parameter: A, Bg(x) = c1 · sin(ωx) + c2 · cos(ωx)

(c, c1, c2, ω ∈ R)

Hinweise zur Tabelle:

- Die in der Tabelle (rechte Spalte) genannten Parameter sind zunachst unbekannt. Nach Einsetzen des gewahl-ten Ansatzes fur yp sowie dessen Ableitung y′p in die zu losende Differentialgleichung kann ein Koeffizienten-vergleich durchgefuhrt werden. Dieser liefert Bedingungen (in Form linearer Gleichungen) fur die gesuchtenParameter, aus denen diese Parameter berechnet werden konnen. Die Beispiele 7.7 und 7.8 verdeutlichen dieseVorgehensweise.

- Besteht die Storfunktion g(x) aus mehreren additiven Storgliedern, so erhalt man den Losungsansatz fur ypals Summe der Losungsansatze fur die Einzelglieder.

Beispiel 7.7:

Beispiel 7.8:

Bemerkungen:

- Zur Losung inhomogener linearer Differentialgleichungen 1. Ordnung, deren Koeffizient bei y (vgl. For-mel (112)) nicht konstant ist, kann die Methode der Variation der Konstanten angewendet werden. Dafur seiauf die folgende Literaturstelle verwiesen: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler,Band 2, 12. Auflage (2009), S. 373-376.

- Die Methode der Variation der Konstanten ist ebenfalls geeignet zur Losung linearer Differentialgleichungen1. Ordnung, bei denen der Koeffizient bei y zwar konstant ist, aber die Storfunktion g(x) (vgl. Formel (112))nicht in der obigen Tabelle aufgefuhrt ist.

52

7.2.2 Lineare Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten

Definition 7.4:Eine Differentialgleichung der Form

y′′ + ay′ + by = g(x) (a, b ∈ R) (116)

heißt lineare Differentialgleichung 2. Ordnung mit konstanten Koeffizienten.

Beispiel 7.9:

Ahnlich wie im Abschnitt 7.2.1 wird zunachst die zu der inhomogenen Differentialgleichung (116) gehorigehomogene Differentialgleichung, d.h. die Differentialgleichung y′′ + ay′ + by = 0, gelost. Dazu wird die cha-rakteristische Gleichung

λ2 + aλ+ b = 0 (117)

(d.h. eine quadratische Gleichung bzgl. der Variablen λ) aufgestellt. Deren Losungen fuhren zu einem Fun-damentalsystem der homogenen Differentialgleichung . Dieses besteht aus zwei linear unabhangigen Losun-gen y1(x) und y2(x) dieser Differentialgleichung.Die allgemeine Losung der Differentialgleichung y′′ + ay′ + by = 0 besitzt dann die Darstellung

y(x) = C1 y1(x) + C2 y2(x) (C1, C2 ∈ R). (118)

Bezuglich der Losungsmenge der Gleichung (117) sind die folgenden Falle zu unterscheiden:

1. Fall: zwei verschiedene reelle Losungen λ1, λ2 der charakteristischen Gleichung⇒ y1 = eλ1x und y2 = eλ2x bilden ein Fundamentalsystem der Differentialgleichung.

2. Fall: zwei gleiche reelle Losungen λ1 = λ2 = −a2

der charakteristischen Gleichung

⇒ y1 = eλ1x und y2 = x · eλ1x erfullen die Differentialgleichung und bilden ein Fundamental-system der Differentialgleichung.

3. Fall: zwei konjugiert-komplexe Losungen λ1 = α+ jβ , λ2 = α− jβ der charakteristischen Gleichung(α, β ∈ R, β 6= 0):Zunachst konnen die (komplexwertigen) Losungen: e(α+jβ)x und e(α−jβ)x gebildet werden.Mit e(α+jβ)x = eαx · e jβx = eαx · [cos(βx) + j sin(βx)] (und analog fur e(α−jβ)x) erhalt man diereellen Losungen y1 = eαx sin(βx) und y2 = eαx cos(βx). Diese bilden ein Fundamentalsystem derDifferentialgleichung.

Die Vorgehensweise beim Losen der homogenen Differentialgleichung lasst sich nun wie folgt beschreiben.

Berechnung der allgemeinen Losung der Differentialgleichung y′′ + ay′ + by = 0

1) Aufstellen der charakteristischen Gleichung λ2 + aλ+ b = 0

2) Losen der charakteristischen Gleichung und Aufstellen des Fundamentalsystems y1(x), y2(x)der Differentialgleichung entsprechend der Fallunterscheidung (siehe oben)

3) Bilden einer Linearkombination der Losungen y1(x) und y2(x) gemaß (118)

Beispiel 7.10:

53

Nun wird die inhomogene Differentialgleichung betrachtet, siehe (116) mit g(x) 6= 0. Die allgemeine Losungder Differentialgleichung (116) ist darstellbar in der Form

y(x) = yh(x) + yp(x)

(vgl. auch (114) im Fall einer linearen Differentialgleichung 1. Ordnung).Ahnlich wie bei linearen Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten kann zur Ermittlungeiner partikularen Losung der inhomogenen Differentialgleichung auf spezielle Ansatze zuruckgegriffen werden,wenn die Storfunktion z.B. eine Exponentialfunktion, ein Polynom oder eine trigonometrische Funktion ist.Zuerst wird die Vorgehensweise bei einem solchen Losungsweg beschrieben und anschließend werden moglicheAnsatze aufgezahlt.

Berechnung der allgemeinen Losung linearer Differentialgleichungen 2. Ordnungmit konstanten Koeffizienten bei Vorliegen spezieller Storfunktionen

1) Die allgemeine Losung yh der zugehorigen homogenen Differentialgleichung y′′ + ay′ + by = 0wird berechnet (Vorgehensweise: siehe oben).

2) Um eine partikulare Losung yp der inhomogenen Differentialgleichung (116) zu finden, wird ein Ansatzin Form einer Funktion, die im Wesentlichen dem Typ der Storfunktion entspricht, verwendet(haufig verwendete Ansatze: siehe nachste Seite).

3) Die allgemeine Losung y der Gleichung (116) ergibt sich als: y = yh + yp .

54

Ubersicht uber Ansatze fur die partikulare Losung yp der inhomogenen Differentialgleichungy′′ + ay′ + by = g(x)

Storfunktion g(x) Losungsansatz fur yp(x)

Polynom n-ten Grades yp = Qn(x) falls b 6= 0, d.h.: 0 ist keine Losung der charakteristischeng(x) = Pn(x) Gleichung

yp = x ·Qn(x) falls a 6= 0, b = 0, d.h.: 0 ist eine einfache Losungder charakteristischen Gleichung

yp = x2 ·Qn(x) falls a = b = 0, d.h.: 0 ist eine doppelte Losungder charakteristischen Gleichung

Qn(x): Polynom vom Grad nParameter: Koeffizienten des Polynoms Qn(x)

Exponentialfunktion yp = A · ecx falls c keine Losung der charakteristischen Gleichungg(x) = decx (c, d ∈ R) yp = Ax · ecx falls c eine einfache Losung der charakteristischen Gleichung

yp = Ax2 · ecx falls c eine doppelte Losung der charakteristischen GleichungParameter: jeweils A

Sinusfunktion Falls jβ keine Losung der charakteristischen Gleichung:g(x) = d1 sin(βx) (d1, β ∈ R) yp = A · sin(βx) +B · cos(βx)

Kosinusfunktion Falls jβ eine Losung der charakteristischen Gleichung:g(x) = d2 cos(βx) (d2, β ∈ R) yp = x [A · sin(βx) +B · cos(βx)]

Linearkombination Parameter: jeweils A,Baus beiden Funktionen

Hinweise zur obigen Tabelle:

- Besteht die Storfunktion g(x) aus mehreren additiven Storgliedern, so erhalt man den Losungsansatz fur ypals Summe der Losungsansatze fur die Einzelglieder.

- Die Falle, in denen c bzw. jβ eine Losung der charakteristischen Gleichung ist, entsprechen der Situation,dass die Storfunktion in der allgemeinen Losung der homogenen Differentialgleichung vorkommt. Manspricht in derartigen Fallen auch von Resonanz.

Beispiel 7.11:

55

7.3 Beschreibung mechanischer Schwingungen mit Hilfe von Differentialgleichungen

In dem Beispiel 7.3 wurde bereits die Schwingungsgleichung der Mechanik

mx+ kx+ cx = 0 (119)

betrachtet. Hierbei handelt es sich um eine homogene lineare Differentialgleichung 2. Ordnung mit konstantenKoeffizienten zur Berechnung der Auslenkung x(t). Zur Berechnung der allgemeinen Losung einer solchenDifferentialgleichung kann die im Abschnitt 7.2.2 beschriebene Methode angewendet werden.Die Gleichung (119) gilt, wenn das schwingungsfahige System keiner außeren Kraft unterliegt. Falls jedoch eine(zeitabhangige) außere Kraft F (t) auf das System wirkt, muss die inhomogene Differentialgleichung

mx+ kx+ cx = F (t)

zur Berechnung der Auslenkung x(t) berechnet werden. Wenn die außere Kraft durch eine periodische Funktion,z.B. durch F (t) = F0 ·sin(ωt) (F0: Konstante, ω: Erregerkreisfrequenz), beschrieben wird, kann eine partikulareLosung xp der entsprechenden Differentialgleichung mit Hilfe des Ansatzes xp(t) = A sin(ωt) + B cos(ωt)ermittelt werden19.Abschließend wird ein Beispiel betrachtet, bei dem zusatzlich zu der Schwingungsgleichung noch zwei An-fangsbedingungen vorgegeben sind, d.h. es werden die Werte der Funktion x(t) und deren Ableitung x(t) zumZeitpunkt t = 0 vorgeschrieben.

Beispiel 7.12:Das Anfangswertproblem20

x+ ω20 x = 0, x(0) = x0, x(0) = 0 (x0 > 0) (120)

beschreibt die harmonische Schwingung eines elastischen Federpendels bei Vernachlassigung der Reibungs-krafte (vgl. auch Beispiel 7.3) unter den folgenden Versuchsbedingungen (Anfangsbedingungen):

- Das Federpendel besitzt zu Beginn der Bewegung, d.h. zum Zeitpunkt t = 0, eine Auslenkung x0 in derpositiven Richtung.

- Die Bewegung erfolgt aus der Ruhe heraus (Anfangsgeschwindigkeit v0 = x(0) = 0).

Zunachst wird die Differentialgleichung aus (120) ohne Berucksichtigung der Anfangsbedingungen gelost, d.h.es wird eine allgemeine Losung dieser Gleichung berechnet. Es handelt sich um eine homogene Differential-gleichung , so dass die allgemeine Losung sofort mit Hilfe der charakteristischen Gleichung gefunden werdenkann. Die zu der Differentialgleichung x+ω2

0 x = 0 gehorige charakteristische Gleichung (siehe Formel (117))lautet: λ2 + ω2

0 = 0. Sie besitzt die konjgiert-komplexen Losungen λ1 = jω0 und λ2 = −jω0, so dass dieFunktionen x1(t) = e0·t · sin(ω0t) = sin(ω0t) und x2(t) = e0·t · cos(ω0t) = cos(ω0t) ein Fundamentalsystemder zu losenden Differentialgleichung bilden (siehe dazu: 3. Fall in der Fallunterscheidung im Abschnitt 7.2.2).Die allgemeine Losung der Differentialgleichung aus (120) ist somit:

x(t) = C1 sin(ω0t) + C2 cos(ω0t), C1, C2 ∈ R. (121)

Die Werte fur die Parameter C1 und C2 aus dieser Losungsdarstellung werden nun so bestimmt, dass die beidenAnfangsbedingungen aus (120) erfullt sind.Um die Bedingung x(0) = x0 zu erfullen, wird in der Gleichung (121) t = 0 gesetzt:

x(0) = C1 sin(ω0 · 0) + C2 cos(ω0 · 0) = C1 · 0 + C2 · cos 0 = C2.Da x(0) = x0 vorgeschrieben ist (siehe (120)), folgt daraus C2 = x0.Um die zweite Anfangsbedingung zu erfullen, muss zuerst die Ableitung der Funktion x(t) gebildet werden.Diese lautet: x(t) = C1 · ω0 · cos(ω0t)− C2 · ω0 · sin(ω0t).Wenn t = 0 gesetzt wird, erhalt man:

x(0) = C1 · ω0 · cos(ω0 · 0)− C2 · ω0 · sin(ω0 · 0) = C1 · ω0 · 1− C2 · ω0 · 0 = C1.Da x(0) = 0 vorgeschrieben ist (siehe (120)), folgt daraus C1 = 0.

Die Losung des Anfangswertproblems (120) entsteht, indem die fur C1 und C2 ermittelten Werte in die Losungs-darstellung (121) eingesetzt werden: x(t) = 0 · sin(ω0t) + x0 · cos(ω0t) = x0 · cos(ω0t).

19Im Resonanzfall, d.h. wenn ω eine Losung der zu (119) gehorigen charakteristischen Gleichung ist, muss der Ansatzxp(t) = t [A · sin(ωt) +B · cos(ωt)] werden, siehe Tabelle im Abschnitt 7.2.2.

20Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 2, 12. Auflage (2009), S. 352

56

8 Grundlagen der Wahrscheinlichkeitsrechnung

8.1 Hilfsmittel aus der Kombinatorik

Definition 8.1:Als Permutationen von n Elementen ohne Wiederholung bezeichnet man Anordnungen dieser n verschie-denen Elemente, die sich nur durch die Reihenfolge dieser Elemente unterscheiden.Eine Permutation von n Elementen mit Wiederholung liegt vor, wenn nicht alle n Elemente voneinanderverschieden sind.

Fur die Berechnung der Permutationen (d.h. die Anzahl der moglichen Anordnungen) gelten die folgendenFormeln.

Permutationen von n Elementen ohne Wiederholung: P (n) = n · (n− 1) · (n− 2) · . . . · 1 = n!

Permutationen von n Elementen, unter denensich jeweils n1, n2, . . . , nk einander gleiche befinden: P (n; n1, n2, . . . , nk) =

n!

n1! · n2! · . . . · nk!

mit n1 + n2 + . . . nk = n

Beispiel 8.1:

Definition 8.2:Unter Variationen von n Elementen zur k-ten Klasse ohne Wiederholung versteht man Teilmengen vonje k Elementen, die unter Berucksichtigung der Anordnung aus n gegebenen Elementen ausgewahlt werden(1 ≤ k ≤ n).Eine Variation von n Elementen zur k-ten Klasse mit Wiederholung liegt vor, wenn die ausgewahltenElemente mehrfach auftreten durfen.

Variationen von n Elementen zur k-ten Klasse

ohne Wiederholung: V (n; k) = n · (n− 1) · . . . · (n− (k − 1)) =n!

(n− k)!(mit 1 ≤ k ≤ n)

mit Wiederholung: VW (n; k) = nk

Beispiel 8.2:

57

Definition 8.3:Als Kombinationen von n Elementen zur k-ten Klasse ohne Wiederholung bezeichnet man Teilmengen vonje k Elementen, die ohne Berucksichtigung der Anordnung aus n gegebenen Elementen ausgewahlt werden(1 ≤ k ≤ n).Eine Kombination von n Elementen zur k-ten Klasse mit Wiederholung liegt vor, wenn die ausgewahltenElemente mehrfach auftreten durfen.

Kombinationen von n Elementen zur k-ten Klasse

ohne Wiederholung: C(n; k) =n!

k! · (n− k)!=

(nk

)(Binomialkoeffizient)

mit Wiederholung: CW (n; k) =

(n+ k − 1

k

)Bei den Kombinationen ohne Wiederholung muss gelten: 1 ≤ k ≤ n.

Beispiel 8.3:

8.2 Grundbegriffe der Wahrscheinlichkeitsrechnung

8.2.1 Das Zufallsexperiment und weitere Grundbegriffe

Definition 8.4:Das Zufallsexperiment ist ein Versuch, bei dem die folgenden Bedingungen (Voraussetzungen) erfullt sind:1) Der Versuch lasst sich unter den gleichen außeren Bedingungen beliebig oft wiederholen.

2) Bei der Durchfuhrung des Versuchs sind mehrere sich gegenseitig ausschließende Ergebnisse moglich.

3) Das Ergebnis einer konkreten Durchfuhrung des Versuchs lasst sich dabei nicht mit Sicherheit voraussa-gen, sondern ist zufallsbedingt.

Beispiel 8.4:

Definition 8.5:Die moglichen, sich gegenseitig ausschließenden Ergebnisse eines Zufallsexperiments heißenElementarereignisse.Schreibweise: ω1, ω2, ω3, . . . .

Die Menge aller Elementarereignisse heißt Ergebnismenge Ω.

58

Beispiel 8.5:

Die Teilmengen der Ergebnismenge Ω beschreiben Versuchsausgange, die bei der Durchfuhrung des Versuchseintreten konnen, aber nicht unbedingt eintreten mussen. Dies gibt Anlass zur Definition des Begriffes Ereignis.

Definition 8.6:Eine Teilmenge A der Ergebnismenge Ω eines Zufallsexperiments wird Ereignis genannt.Die Menge aller Ereignisse, die aus der Ergebnismenge eines Zufallsexperiments gebildet werden konnen,heißt Ereignisraum oder Ereignisfeld.

Nach den Gesetzmaßigkeiten der Mengenlehre sind sowohl die leere Menge ∅ als auch die Ergebnismenge Ωselbst Teilmengen von Ω. Sie stellen Ereignisse mit folgender Bedeutung dar:

∅ : unmogliches Ereignis (ein Ereignis, das nie eintreten kann)

Ω : sicheres Ereignis (ein Ereignis, das immer eintritt).

Ein Ereignis A ist somit entweder

- das unmogliche Ereignis ∅ (siehe oben; A enthalt dann kein Element von Ω) oder

- ein Elementarereignis (siehe Definition 8.5; A enthalt genau ein Element von Ω) oder

- eine Menge mehrerer Elementarereignisse (A enthalt mehrere Elemente von Ω) oder

- das sichere Ereignis Ω (siehe oben; A enthalt alle Elemente von Ω, d.h. A = Ω).

Beispiel 8.6:

8.2.2 Verknupfungen von Ereignissen

Gemaß Definition 8.6 sind Ereignisse als Teilmengen der Ergebnismenge Ω anzusehen, d.h. es handelt sichum Mengen. Somit kann man bei Ereignissen - ebenso wie bei Mengen - Verknupfungen betrachten. Auf dernachfolgenden Seite wird eine Ubersicht uber Verknupfungen von Ereignissen gegeben. Die Veranschaulichungerfolgt jeweils mit Hilfe von Mengendiagrammen.

59

Mit A und B sind Ereignisse im Sinne der Definition 8.6 bezeichnet.

Verknupfung Bedeutung Darstellung im Diagramm

Teilereignis: A ⊆ B A zieht B nach sichA B

Vereinigung (Summe): A ∪B mindestens eines der Ereignisse A, Btritt ein (d.h.: A oder B) A B

Durchschnitt (Produkt): A ∩B sowohl A als auch B tritt ein(d.h.: A und B) A B

Differenz: A \B A tritt ein, jedoch nicht gleichzeitig B A B

Fur die Verknupfungen von Ereignissen gelten - wie auch fur die Verknupfungen von Mengen - Gesetzmaßig-keiten wie Kommutativgesetze, Assoziativgesetze, Distributivgesetze sowie die DE MORGANschen Gesetze:

A ∪B = A ∩B, A ∩B = A ∪B(A und B sind wiederum Ereignisse im Sinne der Definition 8.6).

Das zu A komplementare Ereignis tritt genau dann ein, wenn A nicht eintritt.Bezeichnung: A; es gilt: Ω \A = A

Die Ereignisse A und B heißen disjunkt (oder unvereinbar), wenn gilt: A ∩B = ∅.

Beispiel 8.7:

Definition 8.7:Die Ereignisse Ai (i = 1, 2, . . . , n) heißen Zerlegung des Ereignisses A, wenn gilt:

n⋃i=1

Ai = A und Ai ∩Aj = ∅ fur alle i, j mit i 6= j .

Sie bilden ein vollstandiges System zufalliger Ereignisse, wenn gilt:n⋃i=1

Ai = Ω und Ai ∩Aj = ∅ fur alle i, j mit i 6= j (Zerlegung des sicheren Ereignisses).

Ein vollstandiges System zufalliger Ereignisse A1, A2, . . . , An besitzt die folgende Eigenschaft: als Ergebniseines zufalligen Versuches muss genau eines von ihnen eintreten.

Beispiel 8.8:

60

8.3 Der Begriff der Wahrscheinlichkeit

8.3.1 Laplace-Experimente, absolute und relative Haufigkeit

Definition 8.8:Ein Zufallsexperiment mit der endlichen Ergebnismenge Ω = ω1, ω2, . . . , ωm heißtLaplace-Experiment, wenn alle Elementarereignisse ωi die gleiche Wahrscheinlichkeit besitzen:

P (ωi) = p(ωi) =1

m(i = 1, 2, . . . ,m).

Die Wahrscheinlichkeit eines Ereignisses A ist dann gegeben durch:

P (A) =g(A)

m,

wobei g(A) : Anzahl der fur das Ereignis A gunstigen Falle (d.h. der Falle, in denen das Ereignis A eintritt)

m : Anzahl der insges. moglichen Falle (Anzahl der gleichwahrscheinlichen Elementarereignisse)

Hinweis: Dies wird auch als klassische Definition der Wahrscheinlichkeit bezeichnet (nur anwendbar fur Laplace-Experimente !).

Beispiel 8.9:Bei dem Zufallsexperiment ”Wurf eines homogenen Wurfels“ treten alle 6 moglichen Augenzahlen (Elementar-ereignisse) mit der gleichen Wahrscheinlichkeit auf:

p(i) =g(i)

m=

1

6fur i = 1, 2, . . . , 6.

Beispiel 8.10:

Fur die Festlegung unbekannter Wahrscheinlichkeiten in der Praxis (siehe Abschnitt 8.3.2) werden noch dieBegriffe der absoluten und relativen Haufigkeit benotigt.

Definition 8.9:Wird ein Zufallsexperiment n-mal durchgefuhrt und tritt dabei das Ereignis A genau n(A)-mal ein, so wird

n(A) als absolute Haufigkeit des Ereignisses A und

hn(A) =n(A)

nals relative Haufigkeit des Ereignisses A

bezeichnet.

Die absolute Haufigkeit eines Ereignisses kann somit durch einfaches ”Abzahlen“ ermittelt werden.

8.3.2 Wahrscheinlichkeitsaxiome und Schlussfolgerungen

Wie im vorigen Abschnitt bereits ausgefuhrt wurde, ist der klassische Wahrscheinlichkeitsbegriff ausschließ-lich auf Laplace-Experimente anwendbar. In der modernen Wahrscheinlichkeitsrechnung wird der Begriff der

”Wahrscheinlichkeit eines zufalligen Ereignisses“ mit Hilfe gewisser Axiome21 eingefuhrt. Diese heißen (nachihrem Begrunder) Wahrscheinlichkeitsaxiome von Kolmogoroff und werden im folgenden aufgefuhrt.22

21Ein Axiom ist ein nicht aus anderen Aussagen abgeleiteter Grundsatz, welcher nicht bewiesen wird. Aus Axiomen werden weitereSatze eines Wissensgebietes hergeleitet.

22Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 282-283

61

Wahrscheinlichkeitsaxiome von KolmogoroffJedem Ereignis A eines Zufallsexperiments mit der Ergebnismenge Ω wird eine reelle Zahl P (A),genannt: Wahrscheinlichkeit des Ereignisses A, so zugeordnet, dass die folgenden Axiome erfullt sind:

Axiom 1:P (A) ist eine nichtnegative Zahl, die hochstens gleich 1 ist: 0 ≤ P (A) ≤ 1 .

Axiom 2:Fur das sichere Ereignis (Ergebnismenge) Ω gilt: P (Ω) = 1.

Axiom 3:Fur paarweise sich gegenseitig ausschließende Ereignisse A1, A2, A3, . . . gilt:

P (A1 ∪A2 ∪A3 ∪ . . .) = P (A1) + P (A2) + P (A3) + . . . .

Man beachte: Die Wahrscheinlichkeitsaxiome beinhalten keinerlei Aussagen daruber, wie man bei einem kon-kreten Zufallsexperiment die Wahrscheinlichkeiten der auftretenden Ereignisse ermitteln kann. Sie stellen aberin gewisser Hinsicht Rechenregeln fur Wahrscheinlichkeiten dar.

Folgerungen aus den Wahrscheinlichkeitsaxiomen von Kolmogoroff1) Fur das unmogliche Ereignis gilt: P (∅) = 0 .

2) Fur das zum Ereignis A komplementare Ereignis gilt: P (A) = 1− P (A) .

3) Fur zwei sich gegenseitig ausschließende Ereignisse A und B folgt aus Axiom 3:P (A ∪B) = P (A) + P (B) .

Bei praktischen Sachverhalten ist es haufig so, dass die Zufallsexperimente nicht als Laplace-Experimente ange-sehen werden konnen und die Wahrscheinlichkeiten von Elementarereignissen nicht von vornherein bekannt oderberechenbar sind. In solchen Fallen bedient man sich statistischer (oder empirischer) Wahrscheinlichkeitswerte.Dazu sei n die (hinreichend große!) Anzahl der Einzelversuche einer Versuchsreihe und A ein zufalliges Ereig-nis, welches als Versuchsergebnis auftreten kann. Dann wird die relative Haufigkeit hn(A) (vgl. Definition 8.9)des Ereignisses A festgestellt und

P (A) ≈ hn(A)

fur die unbekannte Wahrscheinlichkeit P (A) angenommen (d.h. die ermittelte relative Haufigkeit von A dientals Schatzwert fur die unbekannte Wahrscheinlichkeit P (A)).

Beispiel 8.11:Statistische Wahrscheinlichkeitswerte konnen z.B. angewendet werden fur

- die Wahrscheinlichkeit fur eine Jungen- oder Madchengeburt

- die Wahrscheinlichkeit des Ausfalls eines Maschinenelementes wahrend einer vorgegebenen Laufzeit.

8.3.3 Additionssatz, bedingte Wahrscheinlichkeit und Multiplikationssatz

Wenn A und B disjunkte Ereignisse sind (d.h.: A ∩ B = ∅), dann gilt nach dem Wahrscheinlichkeitsaxiom 3(siehe Abschnitt 8.3.2): P (A∪B) = P (A) +P (B). Falls die Voraussetzung, dass die Ereignisse disjunkt sind,nicht erfullt ist, ist der folgende Satz anzuwenden:

Additionssatz fur beliebige EreignisseSeien A und B zwei beliebige Ereignisse eines Ereignisraumes, dann gilt:

P (A ∪B) = P (A) + P (B)− P (A ∩B) . (122)

Beispiel 8.12:In einem Betrieb werden Antriebswellen hergestellt. Das Sollmaß fur den außeren Durchmesser der Antriebs-wellen betragt: DS = 35.0 mm. Der tatsachliche außere Durchmesser einer zufallig ausgewahlten Welle wirdmit D bezeichnet. Die Toleranzgrenzen fur den außeren Durchmesser D der Antriebswellen betragen:

62

Du = 34.995 mm und Do = 35.011 mm.Bei der Qualitatskontrolle fur diese Antriebswellen wird jeweils deren Durchmesser festgestellt.Wenn dieser außerhalb der Toleranzgrenzen liegt, wird wie folgt weiter verfahren:Falls D < Du gilt: die Welle ist unbrauchbar, d.h. Ausschuss.Falls D > Do gilt: es wird eine Nachbearbeitung durchgefuhrt, so dass die Welle anschließend brauchbar ist.Nun werden die folgenden Ereignisse betrachtet:A: Du ≤ D ≤ Do (Durchmesser innerhalb der Toleranzgrenzen, d.h. die Welle ist sofort brauchbar)B: D ≥ DS (Durchmesser mindestens gleich dem Sollmaß)Die Kontrolle eines Postens von 10000 Antriebswellen ergab:9200 Stuck innerhalb der Toleranzgrenzen: Du ≤ D ≤ Do,5200 Stuck mit: D ≥ 35.0 mm,4700 Stuck mit: 35.0 mm ≤ D ≤ 35.011 mmMan berechne die Wahrscheinlichkeit P (A ∪B).

Wenn A und B Ereignisse ein und desselben Ereignisraumes sind, kann man bedingte Wahrscheinlichkeitenbetrachten, und zwar:

- die bedingte Wahrscheinlichkeit von A unter der Bedingung B(d.h. es wird vorausgesetzt, dass das Ereignis B bereits eingetreten ist) oder

- die bedingte Wahrscheinlichkeit von B unter der Bedingung A(es wird vorausgesetzt, dass A bereits eingetreten ist).

Die Schreibweise fur die genannten Wahrscheinlichkeiten ist: P (A |B) bzw. P (B |A) .Die Berechnung bedingter Wahrscheinlichkeiten wird mit Hilfe der nachfolgenden Formeln durchgefuhrt.

Berechnung bedingter WahrscheinlichkeitenBedingte Wahrscheinlichkeit von A unter der Bedingung B:

P (A |B) =P (A ∩B)

P (B)(wobei P (B) 6= 0 gelten muss) (123)

Bedingte Wahrscheinlichkeit von B unter der Bedingung A:

P (B |A) =P (A ∩B)

P (A)(wobei P (A) 6= 0 gelten muss) (124)

Beispiel 8.13:

63

Als unmittelbare Schlussfolgerung aus den Formeln fur die bedingte Wahrscheinlichkeit erhalt man die folgendeAussage.

Multiplikationssatz (fur beliebige Ereignisse)Die Wahrscheinlichkeit fur das gleichzeitige Eintreten der beiden Ereignisse A und B wird berechnetnach der Formel:

P (A ∩B) = P (A) · P (B |A). (125)

Hinweis: In (125) bedeutet P (A) die Wahrscheinlichkeit fur das Eintreten von A (ohne jede Bedingung!) undP (B |A) die Wahrscheinlichkeit fur das Eintreten von B unter der Bedingung, dass A bereits eingetreten ist.

Beispiel 8.14:

Ausgehend von den bedingten Wahrscheinlichkeiten konnen aber auch die Falle:

P (A |B) = P (A) bzw. P (B |A) = P (B)

in Betracht gezogen werden.In dem ersten Fall gilt: Die Wahrscheinlichkeit des Eintretens von A unter der Bedingung B ist gleich der Wahr-scheinlichkeit des Eintretens von A (ohne Bedingung). Dies kann so interpretiert werden, dass das Eintreten desEreignissesB keinen Einfluss auf das Eintreten des EreignissesA hat. Oder, anders ausgedruckt: Das EreignisAist (stochastisch) unabhangig von dem Ereignis B.Analog dazu bedeutet der zweite der o.g. Falle, dass das Ereignis B (stochastisch) unabhangig von dem Ereig-nis A ist.In dem speziellen Fall stochastisch unabhangiger Ereignisse kann der o.g. Multiplikationssatz wie folgt formu-liert werden.

Multiplikationssatz fur stochastisch unabhangige EreignisseWenn die Ereignisse A und B stochastisch unabhangig sind, dann gilt:

P (A ∩B) = P (A) · P (B). (126)

Die Formel (126) entsteht aus (125), indem dort P (B |A) = P (B) gesetzt wird. Diese Beziehung ist auf Grundder vorausgesetzten Unabhangigkeit der Ereignisse A und B stets gultig.

Die Formel (126) kann auch auf den Fall von n Ereignissen verallgemeinert werden. Wenn die EreignisseA1, A2, . . . , An ein vollstandiges System stochastisch unabhangiger Ereignisse bilden, dann gilt:

P

(n⋂i=1

Ai

)= P (A1) · P (A2) · . . . · P (An) =

n∏i=1

P (Ai). (127)

Mit dieser Formel lasst sich die Wahrscheinlichkeit fur das gleichzeitige Eintreten von n stochastisch unabhangi-gen Ereignissen berechnen, falls die Wahrscheinlichkeiten fur das Eintreten jedes einzelnen Ereignisses bekanntsind.

Beispiel 8.15:

64

Bemerkungen:

- Wenn die Ereignisse A und B stochastisch unabhangig sind, dann sind auch die Ereignisse A und B stocha-stisch unabhangig, ebenso die Ereignisse A und B sowie die Ereignisse A und B.

- Fur drei beliebige Ereignisse A,B,C lautet der Additionssatz:

P (A ∪B ∪ C) = P (A) + P (B) + P (C)− P (A ∩B)− P (A ∩ C)− P (B ∩ C) + P (A ∩B ∩ C).

Fur eine Verallgemeinerung des Additionssatzes auf n beliebige Ereignisse sei auf die folgende Literaturstelleverwiesen: W. VOSS (Hrsg.): Taschenbuch der Statistik, 1. Auflage (2000), S. 305.

8.3.4 Baumdiagramme, totale Wahrscheinlichkeit von Ereignissen

Wenn mehrere gleichartige Zufallsexperimente nacheinander durchgefuhrt werden, spricht man auch von einemmehrstufigen Zufallsexperiment.

Erganzung zu Beispiel 8.14:Es wurde die Ziehung zweier Kugeln aus einer Urne ohne Zurucklegen betrachtet. Dies kann als 2-stufigesZufallsexperiment aufgefasst werden, wenn man die Ziehung einer Kugel als ”einfaches“ Zufallsexperimentansieht.

Zur Veranschaulichung mehrstufiger Zufallsexperimente werden haufig Baumdiagramme (Ereignisbaume) ver-wendet. Zunachst wird ein Beispiel angegeben und anschließend werden einige allgemeine Aussagen23 zuBaumdiagrammen getroffen.

Beispiel 8.16:Aus einer Urne mit 4 roten und 2 gelben Kugeln werden 2 Kugeln nacheinander ohne Zurucklegen entnommen(siehe auch Beispiel 8.14).Das vorliegende Baumdiagramm (siehe Bild 8.1) veranschaulicht die moglichen Ergebnisse dieses Experimentszusammen mit den Wahrscheinlichkeiten der ”Zwischenergebnisse“.

x0

23

13

35

25

45

15

Bild 8.1

Erlauterung:

Aufbau eines BaumdiagrammsDas Baumdiagramm setzt sich zusammen aus einer Wurzel (Ausgangspunkt) sowie Verzweigungspunktenund Zweigen.Die Verzweigungspunkte charakterisieren die moglichen Zwischenergebnisse nach einer bestimmten Stufedes Zufallsexperiments.Die Zweige fuhren zu den jeweils moglichen Ergebnissen der nachfolgenden Stufe.Ein mogliches Endergebnis des Zufallsexperiments erreicht man (ausgehend von der Wurzel)langs eines bestimmten Pfades.

Wenn die Berechnung der Wahrscheinlichkeit eines Ereignisses (das als Ergebnis eines mehrstufigen Zufalls-experiments auftreten kann) mit Hilfe eines Baumdiagramms erfolgen soll, konnen die folgenden Pfadregelnangewendet werden.

23Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 301-302

65

Regeln bei der Berechnung von Wahrscheinlichkeiten mit Hilfe eines BaumdiagrammsEs gelten die folgenden Pfadregeln:

1) Die Wahrscheinlichkeiten langs eines Pfades werden miteinander multipliziert.

2) Wenn mehrere Pfade zum gleichen Endergebnis fuhren, dann addieren sich ihre Wahrscheinlichkeiten.

Fortsetzung zu Beispiel 8.16:

Um den Begriff der totalen Wahrscheinlichkeit einfuhren zu konnen, werden folgende Ereignisse betrachtet:

Ai (i = 1, 2, . . . , n): disjunkte Ereignisse mit P (Ai) 6= 0 fur alle i,B : ein Ereignis, das stets zusammen mit einem der EreignisseAi eintritt.Das Diagramm in Bild 8.2 veranschaulicht eine solche Situationfur den Fall n = 4.

A1A2

A3

A4

B

Bild 8.2

Formel fur die totale Wahrscheinlichkeit eines EreignissesUnter den o.g. Voraussetzungen gilt fur die Wahrscheinlichkeit des Ereignisses B:

P (B) =

n∑i=1

P (B ∩Ai) =

n∑i=1

P (Ai) · P (B |Ai) . (128)

Hinweis: Der Summand P (Ai) · P (B |Ai) in (128) ist die Wahrscheinlichkeit dafur, dass das Ereignis B uberdie ”Zwischenstation“ Ai (fur das jeweilige i) erreicht wurde.

Begrundung fur die Formel (128):Es gilt (siehe dazu auch Bild 8.2): B = (B ∩A1) ∪ (B ∩A2) ∪ . . . ∪ (B ∩An).Da die Ereignisse Ai (i = 1, 2, . . . , n) als disjunkt vorausgesetzt wurden, sind auch die Ereignisse (B ∩ Ai) furi = 1, 2, . . . , n disjunkt. Durch Anwendung des Wahrscheinlichkeitsaxioms 3 (siehe Abschnitt 8.3.2) und derFormel (125) ergibt sich dann:

P (B) =

n∑i=1

P (B ∩Ai) =

n∑i=1

P (Ai ∩B) =

n∑i=1

P (Ai) · P (B |Ai) .

Beispiel 8.17:

66

Bayessche Formel:

P (Aj |B) =P (Aj) · P (B |Aj)n∑i=1

P (Ai) · P (B |Ai). (129)

Bedeutung dieser Formel:Jetzt wird vorausgesetzt, dass das Ereignis B bereits eingetreten ist. Dann ermoglicht die Bayessche Formel dieBerechnung der Wahrscheinlichkeit dafur, dass das Ereignis B uber die ”Zwischenstation“ Aj erreicht wurde.

Fortsetzung zu Beispiel 8.17:

67

9 Wahrscheinlichkeitsverteilungen

9.1 Stetige und diskrete Zufallsvariable (ZV)

Dem Begriff der Zufallsvariablen kommt in diesem Kapitel eine zentrale Rolle zu. Im folgenden wird fur denBegriff ”Zufallsvariable“ meistens die Abkurzung ZV verwendet. Man unterscheidet zwischen stetigen und dis-kreten Zufallsvariablen.

Definition 9.1:Unter einer Zufallsvariablen (oder Zufallsgroße) X versteht man eine Abbildung, die jedem Elementar-ereignis ω aus der Ergebnismenge Ω eines Zufallsexperiments genau eine reelle Zahl X(ω) zuordnet.Eine ZV heißt dabei diskret, wenn sie nur endlich viele oder abzahlbar unendlich viele reelle Werte anneh-men kann.Eine ZV heißt stetig, wenn sie jeden beliebigen Wert aus einem (reellen) endlichen oder unendlichenIntervall annehmen kann.

Die Werte, die eine Zufallsvariable annehmen kann, heißen Realisierungen. Sie werden ublicherweise mit klei-nen Buchstaben bezeichnet.

Beispiel 9.1:

9.2 Verteilungsfunktion einer ZV

Bei praktischen Anwendungen der Wahrscheinlichkeitsrechnung wird haufig die Frage gestellt, mit welcherWahrscheinlichkeit eine ZV einen bestimmten Wert annimmt bzw. der Wert der ZV kleiner (oder großer) als einebestimmte Zahl ist. Dies fuhrt auf den Begriff der Verteilungsfunktion.

Definition 9.2:Die Verteilungsfunktion einer ZV X ist gegeben durch:

F (x) = P (X ≤ x) , (130)

d.h. sie gibt an, mit welcher Wahrscheinlichkeit die ZV X einen Wert annimmt, der kleiner oder gleicheiner vorgegebenen reellen Zahl x ist.

Eine ZV X wird durch ihre zugehorige Verteilungsfunktion vollstandig beschrieben.Nachfolgend sind wichtige Eigenschaften von Verteilungsfunktionen zusammengestellt. Diese gelten allgemein,d.h. unabhangig von der konkreten ZV.

68

Eigenschaften von VerteilungsfunktionenSei X eine beliebige (diskrete oder stetige) Zufallsvariable und F (x) die zugehorige Verteilungsfunktion.Diese Funktion besitzt die folgenden Eigenschaften:

1) F (x) ist eine monoton wachsende Funktion und es gilt: 0 ≤ F (x) ≤ 1 fur alle x ∈ R.

2) limx→−∞ F (x) = 0

3) limx→∞ F (x) = 1

4) Die Wahrscheinlichkeit, dass a < X ≤ b gilt, lasst sich mit Hilfe der Verteilungsfunktionwie folgt berechnen: P (a < X ≤ b) = F (b)− F (a).

Die Eigenschaften 2) und 3) sind unmittelbare Schlussfolgerungen aus der Definition 9.2 und der Tatsache, dassdie Wahrscheinlichkeit des unmoglichen Ereignisses gleich 0, die des sicheren Ereignisses gleich 1 ist (siehedazu auch Abschnitt 8.3.2).Die Fragestellung, zu einem gegebenen Wert der Verteilungsfunktion das zugehorige Argument zu finden, fuhrtauf den Begriff des Quantils.

Definition 9.3:Sei X eine ZV mit der zugehorigen Verteilungsfunktion F (x) und p0 (mit p0 ∈ [0, 1]) eine vorgegebenereelle Zahl.Dann wird jede Zahl x0 mit der Eigenschaft: F (x0) = P (X ≤ x0) = p0 als p0-Quantil der Zufalls-variablen X bezeichnet.

Ein Quantil kann genau dann eindeutig bestimmt werden, wenn die entsprechende Verteilungsfunktion strengmonoton wachsend ist.

9.2.1 Verteilungsfunktion einer diskreten ZV (diskrete Verteilung)

Bei einer diskreten ZV X (vgl. Definition 9.1) gehort zu jeder Realisierung xi eine bestimmte Wahrschein-lichkeit: P (X = xi) = pi (Einzelwahrscheinlichkeit). Die Realisierungen der ZV konnen zusammen mit denzugehorigen Einzelwahrscheinlichkeiten in einer Verteilungstabelle dargestellt werden:

xi x1 x2 x3 . . . xm . . .

P (X = xi) p1 p2 p3 . . . pm . . .

Mit Hilfe dieser Tabelle kann die Verteilungsfunktion der diskreten ZV ermittelt werden.

Verteilungsfunktion F (x) einer diskreten ZVX:

F (x) = P (X ≤ x) =∑xi≤x

pi fur x ∈ R und mit pi = P (X = xi) (131)

Es wurden bereits einige Eigenschaften von Verteilungs-funktionen genannt (siehe oben). In dem hier vorliegendenFall einer diskreten ZV kommt noch die folgende Eigen-schaft hinzu:Die grafische Darstellung der Verteilungsfunktion einerdiskreten ZV ergibt eine stuckweise konstante Funktion(auch Treppenfunktion genannt), siehe dazu Bild 9.1. -

6

0 x

F (x)

x1 x2 x3 . . . xn

...

1

p1

p1 + p2

p1 + p2 + p3

r r rr

Bild 9.1

69

Beispiel 9.2:

9.2.2 Verteilungsfunktion einer stetigen ZV (stetige Verteilung)

Verteilungsfunktion F (x) einer stetigen ZVX:

F (x) = P (X ≤ x) =

−∞

f(t) dt (132)

fur x ∈ R, wobei die Funktion f als Wahrscheinlichkeitsdichte oder Dichtefunktion bezeichnet wird

(Hinweis: das Integral auf der rechten Seite von (132) wird als uneigentliches Integral bezeichnet, da die untereGrenze keine reelle Zahl, sondern ”−∞“ ist. Auf Besonderheiten bei der Berechnung uneigentlicher Integralewird hier nicht eingegangen.)

Die Dichtefunktion f(x) besitzt die folgenden Eigenschaften24

1) f(x) ≥ 0 fur alle x ∈ R

2) f(x) = F ′(x), d.h. die Dichtefunktion ist gleich der ersten Ableitung der Verteilungsfunktion

3)∞

−∞

f(x) dx = 1

Diese Eigenschaft wird auch als Normiertheit der Dichtefunktion bezeichnet.

4) Die Wahrscheinlichkeit, dass X einen Wert zwischen a und b annimmt, kann mit Hilfe der Dichtefunktionwie folgt berechnet werden:

P (a ≤ X ≤ b) = F (b)− F (a) =

−∞

f(x) dx−aˆ

−∞

f(x) dx =

a

f(x) dx

(vgl. dazu auch Formel (132)).

Die Eigenschaft 3) folgt aus:∞

−∞

f(x) dx = P (−∞ < X <∞) = 1 (Wahrscheinlichkeit des sicheren Ereignis-

ses).Die Eigenschaft 4) kann wie folgt veranschaulicht werden: die im Bild 9.2 grau unterlegte Flache entspricht derWahrscheinlichkeit, dass die ZV X einen Wert zwischen a und b annimmt.

-

6

x

f(x)

a b

Bild 9.224An dieser Stelle wird f als eine von der Variablen x abhangige Funktion betrachtet, wahrend in der Formel (132) auf Grund der

Bezeichnung der oberen Integrationsgrenze die Schreibweise f(t) verwendet wurde.

70

Beispiel 9.3:

9.3 Kennwerte einer Wahrscheinlichkeitsverteilung

Bei der Beschreibung von ZV ist (außer den bereits eingefuhrten Funktionen) auch die Angabe von Kennwer-ten hilfreich. In diesem Abschnitt werden die folgenden Kennwerte25 eingefuhrt: Erwartungswert, Varianz undStandardabweichung einer ZV. Bei der Berechnung dieser Kennwerte wird nach diskreten und stetigen ZV un-terschieden.

Definition 9.4:Sei X eine diskrete ZV mit den Realisierungen x1, x2, . . . , xn und den Einzelwahrscheinlichkeitenp1, p2, . . . , pn (mit pi = P (X = xi), siehe Abschnitt 9.2.1).Dann werden die Kennwerte von X wie folgt berechnet:

Erwartungswert: µ = E(X) =n∑i=1

xi · pi (133)

Varianz (Streuung): σ2 = D2(X) = Var(X) =

n∑i=1

(xi − µ)2 · pi (134)

Standardabweichung: σ = D(X) =√

Var(X) (135)

Wenn die ZV X abzahlbar unendlich viele Realisierungen besitzt, ist in (133) und (134) die obere Summa-tionsgrenze gleich ”∞“ zu setzen.

Die Varianz ist ein Maß fur die Variabilitat der Verteilung. Gemaß (133) ist die Varianz gleich dem Erwartungs-wert der Zufallsvariablen Z = (X − µ)2.Die Standardabweichung wird auch mittlere quadratische Abweichung genannt. Der Vorteil der Standardabwei-chung (im Vergleich zur Varianz) besteht darin, dass sie die gleiche Dimension und Maßeinheit wie die ZV Xbesitzt. Fur praktische Berechnungen ist die folgende Formel fur die Varianz:

σ2 = E(X2)− µ2 (136)

meistens leichter zu handhaben als die Formel (134). Der in (136) vorkommende Erwartungswert der Zufalls-variablen X2 kann ermittelt werden, indem in (133) anstelle von xi jeweils x2

i eingesetzt wird.

Beispiel 9.4:

25Weitere Kennwerte sind Variationskoeffizient, Schiefe und Exzess. Darauf wird hier nicht naher eingegangen, es sei auf die folgendeLiteraturstelle verwiesen: W. LEUPOLD (Hrsg.). Mathematik - ein Studienbuch fur Ingenieure (Band 2: Reihen - Differentialgleichungen- Analysis fur mehrere Variable - Stochastik), 2. Auflage, S. 368-369.

71

Definition 9.5:Sei X eine stetige ZV mit der Dichtefunktion f(x) (siehe (132)). Dann werden die Kennwerte von Xwie folgt berechnet:

Erwartungswert: µ = E(X) =

−∞

x · f(x) dx (137)

Varianz (Streuung): σ2 = D2(X) = Var(X) =

−∞

(x− µ)2 · f(x) dx (138)

Standardabweichung: σ = D(X) =√

Var(X) (139)

Die Berechnung der Varianz kann wiederum mittels der Formel (136) (anstatt von (138)) erfolgen. Um denbenotigten Erwartungswert E(X2) zu berechnen, ist in dem Integranden auf der rechten Seite von (137) derFaktor x2 anstelle des Faktors x zu nehmen.

Beispiel 9.5:

Bemerkungen:

- Nicht jede ZV besitzt einen Erwartungswert. Der Erwartungswert existiert fur eine stetige ZV nur dann, wenndas uneigentliche Integral in (137) konvergiert. Im Fall einer diskreten ZV mit abzahlbar unendlich vielen

Realisierungen muss die Summe∞∑i=1

xi · pi (vgl. Formel (133)) einen endlichen Wert besitzen, damit der

Erwartungswert existiert.

- Eine ZV X heißt

zentriert, wenn gilt: E(X) = 0.

normiert, wenn gilt: Var(X) = 1.

standardisiert, wenn sie zentriert und normiert ist.

72

9.4 Spezielle Wahrscheinlichkeitsverteilungen

In praktischen Anwendungssituationen der Wahrscheinlichkeitsrechnung werden spezielle Verteilungsfunktio-nen benotigt, welche den vorliegenden Sachverhalt moglichst gut beschreiben. Das Anliegen dieses Abschnittsbesteht darin, einige in der Praxis haufig vorkommende Wahrscheinlichkeitsverteilungen vorzustellen.

9.4.1 Binomialverteilung

Ausgangspunkt der Uberlegungen bei der Einfuhrung der Binomialverteilung ist das Bernoulli-Experiment26 .

Bernoulli-Experiment- Zufallsexperiment, bei dem ein Ereignis A mit der Wahrscheinlichkeit p und das zu A komplementare

Ereignis A mit der Wahrscheinlichkeit q = 1− p eintritt (d.h. es gibt nur zwei mogliche Ergebnisse)

- Dies gilt auch fur jede Wiederholung des Experiments.

- Beispiel: Beim Wurf einer homogenen Munze gibt es nur die Ereignisse:A: ”Zahl“ und A: ”Wappen“.Sie treten mit den Wahrscheinlichkeiten: p = P (A) = 1

2 und q = P (A) = 1− 12 = 1

2 auf.

Bernoulli-Experiment vom Umfang n- mehrstufiges Experiment: n-fache Ausfuhrung eines Bernoulli-Experiments mit den beiden

moglichen Ereignissen A und A

- Das Ereignis A tritt in jedem der n Teilexperimente mit der gleichen Wahrscheinlichkeit p auf.

- Die Ergebnisse der einzelnen Stufen sind voneinander unabhangig.

- Ein derartiges Experiment wird als Bernoulli-Experiment vom Umfang n bezeichnet.

- Zufallsvariable X: Anzahl der Versuche, in denen das Ereignis A bei einem Bernoulli-Experimentvom Umfang n auftritt⇒ X kann jeden der Werte 0, 1, 2, . . . n annehmen

- Die Fragestellung: Mit welcher Wahrscheinlichkeit nimmt die ZV X den Wert k an?(d.h.: Wie groß ist die Wahrscheinlichkeit, dass das Ereignis A genau k-mal eintritt?)fuhrt auf die Binomialverteilung.

Definition 9.6:Eine diskrete ZV X heißt binomialverteilt mit den Parametern n und p, falls sie die Werte 0, 1, . . . , nannehmen kann und diese mit den Einzelwahrscheinlichkeiten

pk = P (X = k) =

(nk

)pk(1− p)n−k (k = 0, 1, . . . , n) (140)

auftreten. Dabei gelten die folgenden Bezeichnungen:p: konstante Wahrscheinlichkeit fur das Ereignis A beim Einzelversuchn: Anzahl der Ausfuhrungen des Bernoulli-Experiments.

Um zum Ausdruck zu bringen, dass eine ZV X einer derartigen Verteilung unterliegt, kann auch die Schreib-weise: X ∼ B(n, p) verwendet werden.Zur weiteren Beschreibung der Binomialverteilung werden nachfolgend die Verteilungsfunktion sowie die Kenn-werte dieser Verteilung angegeben (siehe nachste Seite).

26Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 346-347

73

Verteilungsfunktion der BinomialverteilungB(n, p)

F (x) =

0 fur x < 0∑k≤x

(nk

)pk(1− p)n−k fur x ≥ 0

Insbesondere gilt: F (x) = 1 fur x ≥ n.

Kennwerte der BinomialverteilungB(n, p)

Erwartungswert: µ = np

Varianz: σ2 = np(1− p)

Beispiel 9.6:

9.4.2 Poisson-Verteilung und Poisson-Prozess

Bei Ereignissen, die mit einer geringen Wahrscheinlichkeit (d.h. sehr selten27) auftreten, wird haufig von einerPoisson-Verteilung ausgegangen. Beispielsweise kann die Anzahl der Ausfalle (pro Zeiteinheit) einer Produk-tionsanlage mit Hilfe der Poisson-Verteilung beschrieben werden.

Definition 9.7:Eine diskrete ZV X heißt Poisson-verteilt mit dem Parameter λ, falls sie die Werte 0, 1, 2, . . .annehmen kann und diese mit den Einzelwahrscheinlichkeiten

pk = P (X = k) =λk

k!e−λ (k ∈ N) (141)

auftreten.

Die symbolische Schreibweise X ∼ Π(λ) bedeutet, dass die ZV X Poisson-verteilt mit dem Parameter λ ist.Die Poisson-Verteilung wird vollstandig durch den Parameter λ charakterisiert.

Verteilungsfunktion der Poisson-Verteilung Π(λ)

F (x) =

0 fur x < 0∑k≤x

λk

k!e−λ fur x ≥ 0

Kennwerte der Poisson-Verteilung Π(λ)

Erwartungswert: µ = λ

Varianz: σ2 = λ

Beispiel 9.7:

27Die Poisson-Verteilung wird deshalb auch ”Verteilung der seltenen Ereignisse“ genannt.

74

Zwischen der Poisson-Verteilung und der Binomialverteilung (siehe Abschnitt 9.4.1) besteht ein wichtiger Zu-sammenhang. Die Poisson-Verteilung lasst sich namlich aus der Binomialverteilung fur den Grenzubergangn → ∞, p → 0 herleiten, und zwar unter der Voraussetzung, dass dabei der Erwartungswert µ = np konstantbleibt. Daraus ergibt sich die folgende Schlussfolgerung.

Zusammenhang zwischen Poisson-Verteilung und BinomialverteilungDie Binomialverteilung mit den Parametern n und p darf fur großes n und kleines p in guter Naherungdurch die rechnerisch bequemere Poisson-Verteilung mit dem Parameter (Erwartungswert) λ = npersetzt werden.Dabei gilt die folgende Faustregel:Falls die Bedingungen np < 10 und n > 1500 p erfullt sind, darf die o.g. Ersetzung vorgenommenwerden.

Beispiel 9.8:

In Technik und Naturwissenschaften hat man es haufig mit zufalligen Vorgangen zu tun, die in Abhangigkeit vonder Zeit analysiert werden sollen. In diesen Fallen spricht man auch von zufalligen Prozessen (oder: stochas-tischen Prozessen).In der Zuverlassigkeits- und Bedienungstheorie wird haufig der Poisson-Prozess verwendet. Dabei wird ein Ein-zelereignis A betrachtet, welches im Verlauf der Zeit wiederholt eintreten kann. Die Zeitpunkte, in denen diesesEreignis stattfindet, konnen durch zufallig verteilte Punkte auf der Zeit-Achse (t-Achse) veranschaulicht werden.Die Anzahl des Auftretens des Ereignisses A in einem Zeitintervall [t0, t0 + t) ist eine Zufallsvariable. Diesewird im weiteren mit Xt bezeichnet. Sie kann die Werte 0, 1, 2, . . . annehmen. Um nun die Wahrscheinlich-keit P (Xt = k) berechnen zu konnen, wird von den folgenden Voraussetzungen ausgegangen28:

- Die Wahrscheinlichkeit P (Xt = k) ist unabhangig von t0 und als Funktion von t > 0 stetig.

- Es besteht keine Nachwirkung, d.h. in Intervallen, die sich nicht uberschneiden, sind die Anzahlen der reali-sierten Einzelereignisse voneinander unabhangig.

- In sehr kurzen Zeitintervallen tritt praktisch hochstens ein Einzelereignis ein.

Poisson-Prozess mit der Intensitat λDie soeben genannten Voraussetzungen seien erfullt.Sei λt die Anzahl der in einem Zeitintervall der Lange t durchschnittlich zu beobachtenden Einzelereignisse(λ: Intensitat des Prozesses). Dann gilt:

P (Xt = k) =(λt)k

k!e−λt (k ∈ N).

Beispiel 9.9:

28idealisierte Bedingungen fur den Zufallsprozess; siehe dazu: G. MUHLBACH. Stochastik - Ein Zugang uber Beispiele, S. 78

75

Die Poisson-Verteilung und die Binomialverteilung sind Verteilungen diskreter Zufallsvariablen. Die restlichenBetrachtungen im Abschnitt 9.4 werden sich auf Verteilungen stetiger Zufallsvariablen beziehen. Es sei daranerinnert, dass in diesen Fallen die Charakterisierung der ZV mittels der zugehorigen Dichtefunktion (siehe Ab-schnitt 9.2.2) erfolgt - im Gegensatz zu den betrachteten diskreten ZV, bei denen Einzelwahrscheinlichkeitenangegeben werden konnten.

9.4.3 Stetige Gleichverteilung (Rechteckverteilung)

Das stetige Analogon zur diskreten Gleichverteilung (siehe Beispiel 9.2) ist die stetige Gleichverteilung.

Definition 9.8:Eine stetige ZVX heißt gleichverteilt uber dem Intervall [a, b], wenn ihre Dichtefunktion gegeben ist durch:

f(x) =

0 fur −∞ < x < a

1

b− afur a ≤ x ≤ b

0 fur b < x <∞ .

(142)

Auf Grund des Aussehens der Dichtefunktion (142) (siehe dazu auch Bild 9.3a) auf der nachsten Seite) wird diestetige Gleichverteilung uber [a, b] auch als Rechteckverteilung R(a, b) bezeichnet.

Verteilungsfunktion der stetigen Gleichverteilung (Rechteckverteilung)R(a, b)

F (x) =

0 fur −∞ < x < a

x− ab− a

fur a ≤ x ≤ b

1 fur b < x <∞ .

Kennwerte der stetigen Gleichverteilung (Rechteckverteilung)R(a, b)

Erwartungswert: µ =a+ b

2

Varianz: σ2 =(b− a)2

12

Zur Berechnung des Erwartungswertes und der Varianz:

76

Die Verteilungsfunktion F (x) der stetigen Gleichverteilung steigt in dem Intervall [a, b] von dem Wert 0 linearauf den Wert 1 an, siehe dazu auch Bild 9.3b).

-

6

x

f(x)

0 a b

1b−a

-

6

x

F (x)

0 a b

1

Bild 9.3a) Bild 9.3b)

Die stetige Gleichverteilung uber dem Intervall [0, 1] spielt bei der Simulation von Zufallszahlen eine Rolle.

Beispiel 9.10:

9.4.4 Exponentialverteilung

Wichtige Anwendungsgebiete der Exponentialverteilung sind Lebensdauerverteilungen oder Bedienzeitvertei-lungen.

Definition 9.9:Eine stetige ZV X heißt exponentialverteilt mit dem Parameter λ (λ > 0), wenn ihre Dichtefunktiongegeben ist durch

f(x) =

0 fur x < 0

λe−λx fur x ≥ 0 .(143)

Durch die symbolische Schreibweise X ∼ exp(λ) wird zum Ausdruck gebracht, dass die ZV X exponential-verteilt mit dem Parameter λ ist.

Verteilungsfunktion der Exponentialverteilung mit dem Parameter λ

F (x) =

0 fur x < 0

1− e−λx fur x ≥ 0 .

Zur Berechnung der Verteilungsfunktion der Exponentialverteilung:

In den Bildern 9.4a) und 9.4b) sind die Dichtefunktion und die Verteilungsfunktion einer Exponentialverteilungfur verschiedene Werte des Parameters λ dargestellt.

77

-

6

x

f(x)

0 2 4 6 8

0.1

0.2

0.3

0.4

0.5 λ = 2

λ = 0.5

-

6

x

F (x)

0 2 4 6 8

0.2

0.4

0.6

0.8

1λ = 2

λ = 0.5

Bild 9.4a) Bild 9.4b)

Kennwerte der Exponentialverteilung exp(λ)

Erwartungswert: µ =1

λ

Varianz: σ2 =1

λ2

Ein besonderes Merkmal der Exponentialverteilung besteht also darin, dass ihr Erwartungswert und ihre Stan-dardabweichung ubereinstimmen (d.h. die Abweichungen der Realisierungen der ZV vom Erwartungswert sindim Mittel genau so groß wie der Erwartungswert selbst).

Beispiel 9.11:

Zwischen der Exponentialverteilung und dem Poisson-Prozess (siehe Abschnitt 9.4.2) besteht der folgendeZusammenhang29.

Zusammenhang zwischen Exponentialverteilung und Poisson-Prozess (Zeitluckenverteilung)Wenn Punkte auf der Zeit-Achse (t-Achse) nach dem Poisson-Prozess mit der Intensitat λ verteilt sind,dann unterliegt die ZV X: ”Lange punktfreier Strecken“ (Zeitlucken) einer Exponentialverteilungmit dem Parameter λ.Die Wahrscheinlichkeit, dass eine Zeitlucke mindestens der Große x auftritt, kann als P (X ≥ x) = e−λx

berechnet werden.

Beispiel 9.12:

29Quelle: G. MUHLBACH. Stochastik - Ein Zugang uber Beispiele, S. 82

78

9.4.5 Weibull-Verteilung

Die Weibull-Verteilung wird haufig zur Beschreibung von Ermudungserscheinungen bei Werkstoffen sowie inder Zuverlassigkeitstheorie verwendet.Diese Wahrscheinlichkeitsverteilung wird (im Gegensatz zur Exponentialverteilung, welche vollstandig durchden Parameter λ bestimmt ist) durch zwei Parameter charakterisiert.30

Definition 9.10:Eine stetige ZV X unterliegt einer Weibull-Verteilung mit den Parametern α und β, wenn ihre Dichte-funktion folgendermaßen lautet:

f(x) =

0 fur x < 0

α

β

(x

β

)α−1e−( x

β)α fur x ≥ 0 .

(144)

Die symbolische Schreibweise X ∼ W (α, β) sagt aus, dass die ZV X Weibull-verteilt mit den Parametern αund β ist.

Verteilungsfunktion der Weibull-Verteilung mit den Parametern α und β

F (x) =

0 fur x < 0

1− e−( x

β)α fur x ≥ 0

In den Bildern 9.5a) und 9.5b) sind die Dichtefunktionen und die Verteilungsfunktionen von Weibull-Verteilungenfur verschiedene Werte der Parameter α und β dargestellt.

-

6

x

f(x)

0

1

1

α = 1/2, β = 1/3

α = 2, β = 1

-

6

x

F (x)

0

0.5

1

α = 1/2, β = 1/3

α = 2, β = 1

Bild 9.5a) Bild 9.5b)

Bei der Berechnung des Erwartungswertes der Weibull-Verteilung nach der Formel (137) tritt ein Integral auf, dasmit elementaren Mitteln nicht berechenbar ist, jedoch mit Hilfe einer speziellen Funktion ausgedruckt werdenkann. Diese Funktion wird Gamma-Funktion genannt und mit dem Symbol Γ(x) bezeichnet. Fur die Definitiondieser Funktion und einige Eigenschaften sei auf die folgende Literaturstelle verwiesen:H.-J. BARTSCH. Taschenbuch mathematischer Formeln fur Ingenieure und Naturwissensch., 21. Aufl., S. 588.Nachfolgend werden der Erwartungswert und die Varianz der Weibull-Verteilung angegeben, ohne auf die Her-leitung naher einzugehen.

Erwartungswert und Varianz der Weibull-VerteilungW (α, β)

Erwartungswert: µ = β · Γ(

1 +1

α

)Varianz: σ2 = β2

[Γ(

1 +2

α

)−(

Γ(

1 +1

α

))2]

Um diese Formeln anwenden zu konnen, mussen die entsprechenden Werte der Gamma-Funktion bekanntsein. Diese Funktionswerte sind jedoch nur in speziellen Fallen einfach zu bestimmen; im allgemeinen Fall

30Im vorliegenden Skript werden die Parameter mit α und β bezeichnet; in der Literatur findet man aber auch Darstellungen derWeibull-Verteilung mit den Parametern γ und r, siehe z.B.: W. PREUSS, G. WENISCH (Hrsg.): Lehr- und Ubungsbuch Mathematik(Band 3: Lineare Algebra - Stochastik), Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, S. 172.

79

ist die Verwendung von Rekursionsformeln, Naherungsformeln, tabellierten Werten oder der entsprechendenTaschenrechner-Funktion erforderlich.Der nachfolgende Tabelle konnen die Funktionswerte Γ

(1 +

1

α

)sowie Γ

(1 +

2

α

)fur spezielle Werte des

Parameters α entnommen werden (jeweils auf vier Nachkommastellen gerundet).

α Γ(

1 +1

α

)Γ(

1 +2

α

)1.0 1.0000 2.0000

1.5 0.9027 1.1906

2.0 0.8862 1.0000

2.5 0.8873 0.9314

3.0 0.8930 0.9027

3.5 0.8997 0.8906

4.0 0.9064 0.8862

Beispiel 9.13:

Bemerkung:Die Exponentialverteilung (siehe Abschnitt 9.4.4) kann als ein Spezialfall der Weibull-Verteilung betrachtet

werden: setzt man namlich in der Formel (144) speziell α = 1 und β =1

λ(mit λ > 0), so entsteht eine Dichte-

funktion vom Typ (143).

9.4.6 Gaußsche Normalverteilung

Die Gaußsche Normalverteilung (kurz: Normalverteilung) ist eine der wichtigsten Wahrscheinlichkeitsvertei-lungen. Sie findet vielfach Anwendung in der Praxis. Wenn eine Zufallsvariable durch Uberlagerung vieler ein-zelner, relativ geringer Einflusse entsteht, kann die Normalverteilung verwendet werden (beispielsweise werdenAbweichungen von der Sollmenge bei der Abfullung von Flussigkeiten oder Messfehler haufig als normalverteiltangenommen). Die Normalverteilung wird mit Hilfe von zwei Parametern beschrieben.

Definition 9.11:Eine stetige ZV X genugt einer Normalverteilung mit den Parametern µ und σ2 (mit σ > 0),wenn sie die folgende Dichtefunktion besitzt:

f(x) =1√2π σ

e−(x−µ)2

2σ2 (x ∈ R). (145)

Die symbolische Schreibweise fur eine mit µ und σ2 normalverteilte ZV X ist: X ∼ N(µ, σ2).Die Parameter dieser Verteilung sind gleichzeitig auch Kennwerte: µ ist der Erwartungswert undσ2 die Varianz der genannten Normalverteilung.

80

Im Bild 9.6 ist die Dichtefunktion der Normalverteilung fur spezielle Werte der Parameter µ und σ2 (bzw. σ)dargestellt.

-

6

x

f(x)

0

0.8

0.53

3

Symmetrieachse

Dichtefunktion f(x) mit µ = 3, σ = 0.5

Dichtefunktion f(x) mit µ = 3, σ = 0.75

Bild 9.6

Die Dichtefunktion f(x) aus (145) besitzt die folgenden Eigenschaften31:

a) f(x) ist spiegelsymmetrisch bezuglich der Geraden x = µ.

b) Maximum: bei x1 = µ, Wendepunkte: bei x2,3 = µ± σc) Die Gestalt der Dichtefunktion f(x) erinnert an eine Glocke. Man spricht daher auch haufig von der Gauß-

schen Glockenkurve.

d) Der Parameter σ bestimmt Breite und Hohe der Glockenkurve. Es gilt:Je kleiner die Standardabweichung σ ist, umso hoher liegt das Maximum und umso steiler fallt die Dichte-kurve nach beiden Seiten hin ab (siehe auch Bild 9.6).

Die zu der Dichtefunktion (145) gehorige Verteilungsfunktion F (x) lautet (siehe dazu die Formeln (132) und(145)):

F (x) = P (X ≤ x) =

−∞

f(t) dt =1√2π σ

−∞

e−(t−µ)2

2σ2 dt . (146)

Das Integral auf der rechten Seite dieser Gleichung ist nicht in geschlossener Form losbar. Dieses Problem kannjedoch umgangen werden, indem eine Ruckfuhrung auf die standardisierte Normalverteilung mit den Parame-tern µ = 0 und σ2 = 1 vorgenommen wird. Die Dichtefunktion der standardisierten Normalverteilung wirdmit ϕ(x) bezeichnet. Durch Einsetzen der Parameter µ = 0 und σ2 = 1 in die Formel (145) erhalt man:

ϕ(x) =1√

2π · 1e−

(x−0)2

2·1 =1√2π· e−

x2

2 . (147)

Im Bild 9.7 ist die Dichtefunktion ϕ(x) der standardisierten Normalverteilung dargestellt.

-

6

x

ϕ(x)

0−1 1

q0.4

Bild 9.7

Die Dichtefunktion ϕ(x) hat folgende Eigenschaften:

a) ϕ(x) ist eine gerade Funktion, d.h. ϕ(x) = ϕ(−x) (da die Symmetrieachse mit der Geraden x = 0, d.h. mitder y-Achse zusammenfallt).

b) Maximum: bei x1 = 0, Wendepunkte: bei x2,3 = ±1

31Quelle: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler, Band 3, 5. Auflage, S. 369

81

Die zu der Funktion ϕ(x) gehorige Verteilungsfunktion wird mit dem Symbol Φ(x) bezeichnet. Aus (146), jetztspeziell mit f(t) = ϕ(t), sowie (147) ergibt sich:

Φ(x) = P (X ≤ x) =

−∞

f(t) dt =1√2π

−∞

e−t2

2 dt . (148)

Diese Funktion wird auch haufig Gaußsches Fehlerintegral genannt.

Zusammenhang zwischen den Verteilungsfunktionen F (x) und Φ(x)

Zwischen der Verteilungsfunktion F (x) einer Normalverteilung mit den Parametern µ und σ2 (sieheFormel (146)) und der Verteilungsfunktion Φ(x) der standardisierten Normalverteilung mit den Parameternµ = 0 und σ2 = 1 (siehe Formel (148)) besteht der folgende Zusammenhang:

F (x) = Φ

(x− µσ

). (149)

Die Verteilungsfunktion Φ(x) ist tabelliert (siehe z.B.: G. MERZIGER, G. MUHLBACH, D. WILLE, TH. WIRTH.Formeln + Hilfen Hohere Mathematik, 7. Auflage, S. 220-221). Daher muss, wenn der Funktionswert F (x) bei

vorgegebenen Parametern µ und σ2 zu ermitteln ist, lediglich der Wert x− µσ

ausgerechnet und dann Φ(x− µσ

)aus der Tabelle entnommen werden.Bei der Berechnung von x− µ

σkonnen auch negative Zahlen entstehen. Solche sind in der Tabelle nicht aufge-

fuhrt, aber es kann die folgende wichtige Beziehung zu Hilfe genommen werden:

Fur die Werte der Verteilungsfunktion Φ(x) der standardisierten Normalverteilung gilt allgemein:

Φ(−x) = 1− Φ(x) fur x > 0. (150)

Beispiel 9.14:

Bei Betrachtung der Funktionsbilder der Dichtefunktionen f(x) und ϕ(x) (siehe Bild 9.6 und Bild 9.7) bemerktman, dass fur solche x-Werte, die nahe bei µ liegen, die Werte dieser Dichtefunktionen relativ groß sind (imVergleich zu Werten von f(x) und ϕ(x), wenn x ”weit entfernt“ von µ ist). Mit anderen Worten: die Wahr-scheinlichkeit, dass eine normalverteilte ZV X Werte annimmt, die nahe bei dem Erwartungswert µ liegen, istrelativ hoch.Dies gibt Anlass zu der folgenden Fragestellung:

Mit welcher Wahrscheinlichkeit hat ein Wert einer normalverteilten ZV X vom Erwartungswert µeinen Abstand, der kleiner als ein vorgegebenes ε > 0 ist ?

Diese Frage kann wie folgt beantwortet werden32, wenn man fur ε bestimmte Vielfache der Standardabwei-chung σ nimmt.

Fur jede ZV X , die einer Normalverteilung mit den Parametern µ und σ2 genugt, gilt:

P (|X − µ| < σ) = 2Φ(1)− 1 = 0.6827

P (|X − µ| < 2σ) = 2Φ(2)− 1 = 0.9545 (151)

P (|X − µ| < 3σ) = 2Φ(3)− 1 = 0.9973 .

Daraus kann die folgende Schlussfolgerung gezogen werden: Bei einer normalverteilten Zufallsvariablenliegen 99.73 % aller Werte (d.h. fast alle Werte) innerhalb der 3σ-Grenzen.

Die letzte Gleichung in (151) wird auch ”3σ-Regel“ genannt. Sie spielt eine wichtige Rolle in der statistischenQualitatssicherung.

32Quelle: W. LEUPOLD (Hrsg.). Mathematik - ein Studienbuch fur Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysisfur mehrere Variable - Stochastik), 2. Auflage, S. 382

82

Begrundung zu (151):Es gelte: X ∼ N(µ, σ2). Um die Wahrscheinlichkeit P (|X −µ| < ε) zu berechnen, wird ε = kσ gesetzt, eineneue ZV Y eingefuhrt und der Zusammenhang mit der standardisierten Normalverteilung (vgl. (149)) genutzt:

P (|X − µ| < kσ) = P(|X − µ|

σ< k

)= P (|Y | < k) = P (−k < Y < k)

= P (Y < k)− P (Y < −k) = Φ(k)− Φ(−k) = Φ(k)− (1− Φ(k))

= 2Φ(k)− 1 .

Die obigen Aussagen ergeben sich nun, indem man in dieser Gleichung nacheinander k = 1, k = 2 und k = 3setzt und den entsprechenden Wert von Φ(k) ermittelt.

Erganzung zum Beispiel 9.14:

Im Abschnitt 9.4.2 wurde ausgefuhrt, dass die Binomialverteilung durch die rechnerisch bequemere Poisson-Verteilung angenahert werden kann. Zwischen der Binomialverteilung und der Normalverteilung besteht eben-falls ein Zusammenhang, der eine Approximation erlaubt.

Zusammenhang zwischen Binomialverteilung und NormalverteilungDie Binomialverteilung mit den Parametern n und p kann, falls die Bedingung

n · p · (1− p) > 9 (152)erfullt ist, durch die Normalverteilung mit den Parametern µ = np und σ2 = np(1− p)approximiert werden.

Die Besonderheit besteht darin, dass jetzt eine stetige Wahrscheinlichkeitsverteilung zur Approximation derBinomialverteilung (die ja bekanntlich eine diskrete Wahrscheinlichkeitsverteilung ist) verwendet wird. Dies istauch der Grund dafur, dass bei der Berechnung von Wahrscheinlichkeiten mit Hilfe dieser Approximation eineStetigkeitskorrektur vorgenommen werden muss. Es gilt die nachfolgend genannte Naherungsformel.

Naherungsformel zur Berechnung von Wahrscheinlichkeiten bei der BinomialverteilungDie ZV X sei binomialverteilt mit den Parametern n und p, wobei die Ungleichung (152) erfullt sein soll.Dann kann zur Berechnung der Wahrscheinlichkeit P (a ≤ X ≤ b) die Formel

P (a ≤ X ≤ b) ≈ Φ

(b+ 0.5− µ

σ

)− Φ

(a− 0.5− µ

σ

)(153)

verwendet werden (Φ: Verteilungsfunktion der standardisierten Normalverteilung, siehe (148)).

Die Stetigkeitskorrektur wird durch die Summanden +0.5 bzw. −0.5 in der Formel (153) realisiert.

Beispiel 9.15:

9.5 Aussagen uber Summen und Produkte von Zufallsvariablen

In den bisherigen Ausfuhrungen wurde stets von genau einer ZV ausgegangen. Bei praktischen Anwendungenliegt jedoch haufig die Situation vor, dass mehrere ZV auftreten, welche dann z.B. addiert oder multipliziertwerden. Zielstellung dieses Abschnittes ist es, die Kennzahlen von Summen oder Produkten von ZV anzugeben.Eine große Bedeutung kommt dabei auch dem Zentralen Grenzwertsatz (siehe Abschnitt 9.5.2) zu.

9.5.1 Kennwerte von Summen und Produkten von Zufallsvariablen

Zunachst sei bemerkt, dass die Summe bzw. das Produkt von Zufallsvariablen wiederum eine Zufallsvariable ist.Bevor Aussagen uber den Erwartungswert und die Varianz dieser ”neuen“ ZV getroffen werden, wird der Begriffder Unabhangigkeit zweier ZV eingefuhrt. Dazu ist es erforderlich, mehrdimensionale Verteilungsfunktionen(d.h. Verteilungsfunktionen, die von mehr als einer Variablen abhangen) zu betrachten.

83

SeienX und Y zwei ZV, so kann aus diesen ein zweidimensionaler Zufallsvektor (X,Y ) gebildet werden. Dieserkann vollstandig durch die Verteilungsfunktion

F (x, y) = P (X ≤ x, Y ≤ y) (154)

beschrieben werden33.

Definition 9.12:Seien X und Y Zufallsvariable mit den zugehorigen Verteilungsfunktionen FX(x) und FY (y).Weiterhin sei F (x, y) die Verteilungsfunktion des aus X und Y gebildeten zweidimensionalen Zufalls-vektors (X,Y ) (siehe (154)). Die Zufallsvariablen X und Y heißen (stochastisch) unabhangig, wenn furalle x und y die folgende Bedingung erfullt ist:

F (x, y) = FX(x) · FY (y) . (155)

Die Beziehung (155) ist das Analogen zur (stochastischen) Unabhangigkeit von Ereignissen (siehe dazu Ab-schnitt 8.3.3), denn sie sagt aus, dass die Ereignisse A : ”X ≤ x“ und B : ”Y ≤ y“ unabhangig sind.Die Aussage von Definition 9.12 lasst sich auf eine endliche Anzahl n von Zufallsvariablen ubertragen.

Fur die Summe von n Zufallsvariablen gelten die folgenden Aussagen.

Additionssatz fur ErwartungswerteSeien X1, X2, . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Erwartungswerten µ1 = E(X1),µ2 = E(X2), . . . , µn = E(Xn). Dann besitzt die Summe Z = X1 +X2 + . . .+Xn dieser Zufallsvariablenden Erwartungswert

E(Z) = E(X1 +X2 + . . .+Xn) = E(X1) + E(X2) + . . .+ E(Xn) (156)

(d.h. es gilt: E(Z) = µZ = µ1 + µ2 + . . .+ µn).

Additionssatz fur VarianzenSeien X1, X2, . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Varianzen σ2

1 = Var(X1),σ2

2 = Var(X2), . . . , σ2n = Var(Xn). Weiterhin wird vorausgesetzt, dass diese Zufallsvariablen stochastisch

unabhangig sind. Dann besitzt die Summe Z = X1 +X2 + . . .+Xn dieser Zufallsvariablen die Varianz

Var(Z) = Var(X1 +X2 + . . .+Xn) = Var(X1) + Var(X2) + . . .+ Var(Xn) (157)

(d.h. es gilt: Var(Z) = σ2Z = σ2

1 + σ22 + . . .+ σ2

n).

Man beachte, dass der Additionssatz fur Varianzen nur im Fall der Unabhangigkeit der ZV X1, X2, . . ., Xn gilt.Beispiel 9.16:

33Auf die allgemeinen Eigenschaften einer solchen Verteilungsfunktion sowie auf die zugehorige Dichtefunktion wird an dieser Stellenicht eingegangen. Es sei auf die folgende Literaturstelle verwiesen: L. PAPULA. Mathematik fur Ingenieure und Naturwissenschaftler,Band 3, 5. Auflage, Kapitel II, Abschnitt 7.2.

84

Multiplikationssatz fur ErwartungswerteSeien X1, X2, . . ., Xn (diskrete oder stetige) Zufallsvariable mit den Erwartungswerten µ1 = E(X1),µ2 = E(X2), . . . , µn = E(Xn). Außerdem wird vorausgesetzt, dass diese Zufallsvariablen stochastischunabhangig sind. Dann besitzt das ProduktZ = X1·X2·. . .·Xn dieser Zufallsvariablen den Erwartungswert

E(Z) = E(X1 ·X2 · . . . ·Xn) = E(X1) · E(X2) · . . . · E(Xn) (158)

(d.h. es gilt: E(Z) = µZ = µ1 · µ2 · . . . · µn).

Bisher wurden zwar Aussagen uber den Erwartungswert bzw. die Varianz einer Summe von ZV getroffen, aberdie genannten Satze gaben keine Auskunft uber die Wahrscheinlichkeitsverteilung (d.h. den Typ der Verteilungs-funktion) dieser Summe. Wenn weitere Voraussetzungen getroffen werden, kann ggf. auch die Wahrscheinlich-keitsverteilung einer Summe von ZV benannt werden. Der folgende Fall ist fur praktische Anwendungen vongroßer Bedeutung.

Aussagen uber die Summe von unabhangigen und normalverteilten ZVDie Zufallsvariablen X1, X2, . . ., Xn seien unabhangig und normalverteilt mit den Erwartungswertenµ1, µ2, . . . , µn und den Varianzen σ2

1 , σ22 , . . . , σ2

n. Die Summe Z = X1 +X2 + . . .+Xn dieser Zufalls-variablen unterliegt dann ebenfalls einer Normalverteilung. Die Parameter dieser Normalverteilung sind:µZ = µ1 + µ2 + . . .+ µn sowie σ2

Z = σ21 + σ2

2 + . . .+ σ2n .

Beispiel 9.17:

9.5.2 Zentraler Grenzwertsatz

Im folgenden wird die Voraussetzung, dass die ZV einer Normalverteilung unterliegen mussen, fallengelassen.Es wird nur verlangt, dass alle betrachteten ZV unabhangig sind und die gleiche (ggf. aber unbekannte!) Vertei-lungsfunktion besitzen.

Zentraler Grenzwertsatz der WahrscheinlichkeitsrechnungSeien X1, X2, . . ., Xn unabhangige Zufallsvariable, die alle der gleichen Verteilungsfunktion mit demErwartungswert µ und der Varianz σ2 genugen. Dann konvergiert die Verteilungsfunktion der standardisier-

ten Zufallsvariablen Zn =X1 +X2 + . . .+Xn − nµ√

nσfur n→∞ gegen die Verteilungsfunktion Φ

der standardisierten Normalverteilung.

Bei praktischen Anwendungen wird anstelle der Grenzwertbetrachtung n→∞ haufig die Faustregel angewen-det, dass fur die Anzahl n der ZV gelten soll: n ≥ 30. Dann kann davon ausgegangen werden, dass die SummeX1 +X2 + . . .+Xn der ZV annahernd einer Normalverteilung mit den Parametern nµ und nσ2 genugt.

Beispiel 9.18:

Bemerkung:Die im Zentralen Grenzwertsatz angegebenen Voraussetzungen konnen auch noch abgeschwacht werden;dazu sei auf die folgende Literaturstelle verwiesen: K. BOSCH. Statistik-Taschenbuch, 3. Auflage, S. 334-335.

85

Literaturverzeichnis

Das Vorlesungsskript wurde unter Verwendung der nachfolgend aufgefuhrten Literatur erstellt:

H.-J. BARTSCH: Taschenbuch Mathematischer Formeln fur Ingenieure und Naturwissenschaftler. Fachbuch-verlag Leipzig im Carl Hanser Verlag, 21. Auflage, 2007.

K. BOSCH: Großes Lehrbuch der Statistik. R. Oldenbourg Verlag, 1996.

K. BOSCH: Statistik-Taschenbuch. R. Oldenbourg Verlag, 3. Auflage, 1998.

K. DURRSCHNABEL: Mathematik fur Ingenieure - Eine Einfuhrung mit Anwendungs- und Alltagsbeispielen.B. G. Teubner Verlag, 1. Auflage, 2004.

G. ENGELN-MULLGES, W. SCHAFER, G. TRIPPLER: Kompaktkurs Ingenieurmathematik mit Wahrscheinlich-keitsrechnung und Statistik. Fachbuchverlag Leipzig im Carl Hanser Verlag, 3. Auflage, 2004.

A. FETZER, H. FRANKEL: Mathematik 2: Lehrbuch fur ingenieurwissenschaftliche Studiengange. Springer,6. Auflage, 2009.

W. LEUPOLD (Hrsg.): Mathematik - ein Studienbuch fur Ingenieure (Band 1: Algebra - Geometrie - Analysisfur eine Variable). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2011.

W. LEUPOLD (Hrsg.): Mathematik - ein Studienbuch fur Ingenieure (Band 2: Reihen - Differentialgleichungen- Analysis fur mehrere Variable - Stochastik). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2006.

B. LUDERER, U. WURKER: Einstieg in die Wirtschaftsmathematik. Teubner, 6. Auflage, 2005.

G. MERZIGER, G. MUHLBACH, D. WILLE, TH. WIRTH: Formeln + Hilfen Hohere Mathematik.Binomi Verlag, 7. Auflage, 2014.

K. MEYBERG, P. VACHENAUER: Hohere Mathematik 1 (Differential- und Integralrechnung, Vektor- undMatrizenrechnung). Springer, 5. Auflage, 1999.

G. MUHLBACH: Stochastik - Ein Zugang uber Beispiele. Binomi Verlag, 1. Auflage, 2011.

P.H. MULLER: Lexikon der Stochastik. Akademie Verlag, 5. Auflage, 1991.

L. PAPULA: Mathematik fur Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch fur das Grund-studium (Band 1). Vieweg+Teubner, 12. Auflage, 2009.

L. PAPULA: Mathematik fur Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch fur das Grund-studium (Band 2). Vieweg+Teubner, 12. Auflage, 2009.

L. PAPULA: Mathematik fur Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch fur das Grund-studium (Band 3). Vieweg+Teubner, 5. Auflage, 2008.

W. PREUSS, G. WENISCH (Hrsg.): Lehr- und Ubungsbuch Mathematik (Band 2: Analysis). FachbuchverlagLeipzig im Carl Hanser Verlag, 3. Auflage, 2003.

W. PREUSS, G. WENISCH (Hrsg.): Lehr- und Ubungsbuch Mathematik (Band 3: Lineare Algebra - Stochastik).Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2001.

M. RICHTER: Grundwissen Mathematik fur Ingenieure. Teubner, 2. Auflage, 2009.

P. STINGL: Mathematik fur Fachhochschulen. Hanser, 8. Auflage, 2009.

R. STORM: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitatskontrolle.Fachbuchverlag Leipzig im Carl Hanser Verlag, 12. Auflage, 2007.

J. TIETZE: Einfuhrung in die angewandte Wirtschaftsmathematik. Vieweg+Teubner, 14. Auflage, 2008.

86


Recommended