Ingo Rechenberg PowerPoint-Folien zur 4. Vorlesung Evolutionsstrategie I Auf dem Weg zu einer...

transcript

Ingo Rechenberg

PowerPoint-Folien zur 4. Vorlesung „Evolutionsstrategie I“

Auf dem Weg zu einer nichtlinearen Theorie

Korridormodell, Kugelmodell und die 1/5 - Erfolgsregel

Weiterverwendung nur unter Angabe der Quelle gestattet

Suchstrategie: Konstruktion einer additiven Einbahnstraße zum Optimum

10 klassische Optimierungsstrategien

1. Gauß-Seidel-Strategie

2. Strategie von Hooke und Jeeves

3. Rosenbrock-Strategie

4. Strategie von Davis, Swann und Campey (DSC)

5. Simplex-Strategie von Nelder/Mead

6. Complex-Strategie von Box

7. Powell-Strategie

8. Newton-Strategie

9. Strategie von Steward

10. Strategie von Davidon, Fletcher und Powell (DFP)

Aktuell: SQP-Verfahren

(Sequential Quadradic Approximation)

Elementare Gradientenstrategie

… Nach dem Arbeitschritt wird durch Testmessungen erneut die Richtung des steilsten Anstiegs ermittelt. In diese Richtung wird wie-derum mit der Arbeitsschritt-weite vorangegangen.

Extrapolierende Gradientenstrategie

Nachdem die Richtung steils-ten Anstiegs ermittelt wurde wird solange mit der Arbeits-schrittweite in diese Richtung vorangeschritten, bis die Qualität sich verschlechtert. Dort wird erneut die Richtung des steilsten Anstiegs durch Testsmessungen ermittelt.

Gauß-Seidel- oder Koordinatenstrategie

Es wird in die 1. Koordina-tenrichtung solange mit der Arbeitsschrittweite fortge-schritten, bis sich die Qua-lität verschlechtert. Dann wird die Prozedur in der 2. Koordinatenrichtung fortge-setzt usw.

Simplex-Strategie von Nelder/Mead

7 Konstruktion eines gleich-seitigen Tetraeders im Variablenraum. Der Punkt niedrigster Qualität wird gestrichen. An der verblei-benden Grundfläche wird die Spitze eines neuen Tetraeders gespiegelt.

Folgen eines zum Gipfel ausgerollten Ariadnefadens

Vernünftige Strategien folgen Wegen zum Optimum

100 Lose auf den Feldern der Ebene ausgelegt

Gewinn

Es gibt keinen Weg zum Gewinn, dem man folgen kann !!!

Lotterielose

zurückgelegter WegZahl der Mutationen

gggEN zxx

Algorithmus der (1 + 1) - ES

)() (für gggENN QQ xxx

sonst gEx

E nde der L inearität G loba le stochastische Suche

Suche nach dem maximalen Fortschritt

Wo ist das Optimum ???

Nichtlineare Modelle

Weitab vom Optimum

Nahe am Optimum

Parabelgrat

Kreiskuppe

Einkreisen des Optimums

Voranschreiten zum Optimum

Modellfunktion Rechteckgrat (Korridormodell)

2-dimensional 3-dimensional

Q steigt longitudinal monoton an

Modellfunktion Kreiskuppe (Kugelmodell)

Q steigt radial monoton an

Zur Trefferwahrscheinlichkeitsdichte

Ursprung der z-KoordinatenP

Gauss- oder Normalverteilung = Maß für die Länge der Mutationsschritte

Normalverteilte Zufallszahlen zi für die Mutation der Variablen xi

Wendepunkt der Kurve

y2,...n

Lokaler Fortschritt der (1 + 1)-ES am Korridormodell

222 nn ybybybyb

t yywyy PP dd 111 )()(

Lange elementare Zwischenrechnung

222 nn ybybybyb

Der örtliche Fortschritt im Korridor ist von der Lage des Punktes P ′ abhängig. Im Zentrum ist der Fortschritt groß, in den Ecken dagegen sehr klein. Wir müssen den Fortschritt über den Korridorquerschnitt mitteln:

ydyd22

Die lineare Mittelung ist erlaubt, weil - während des evolutiven Fortschreitens im Korridor - jede Position im Korridorquerschnitt (in der Mitte, am Rand und in der Ecke) die gleiche Aufenthaltshäufigkeit besitzt (Simulation oder lange Rechnung).

122/e1

212erf

y1y2,...n

122/e1

212erf

Mitueu

11)(erf

für u

Dies gilt für n >> 1, wie sich später zeigen wird

Wir suchen das Maximum von

durch Nullsetzen der 1. Ableitung: 0dd

nb 2opt

für n >> 1

Wir erinnern uns:

zurückgelegter Weg

Zahl der Mutationen

Wir konstruieren ein zweites Konvergenzmaß

erfolgreiche Mutationen

Gesamtzahl der MutationenWe

We nennen wir die Erfolgswahrscheinlichkeit

t yywyy PP dd 111 )()(

Es galt:

t yyw PPW dd 1)(1e

Wir setzen die Fortschrittsbewertung = 1

bW für / b << 1

11opt 11

e21 e W opt ( = 1 :

5,4 )für n >> 1

Lange elementare Zwischenrechnung Bekannter

Grenzwert e11lim

gggEN zxx

Algorithmus der (1 + 1) – ES mit Erfolgsregel

sonst gEx{

vergrößern für We > 1 /

2e verkleinern für We < 1 /

Korridormodell und optimale

Mutationsschrittweite

Modellfunktion Kreiskuppe (Kugelmodell)

Q steigt monoton an

y2,...n

Fortschrittsbewertung am Kugelmodell

zurückgelegter Weg als RadiendifferenzZahl der MutationenKugel

tn yywyyyr PP dd 122

221 )()(Kugel

zurückgelegter Weg als Radiendifferenz

Zahl der MutationenKugel

882erf1

Kugel8e

erf121

Kugele 1 für r

Korridor Kugel

e nr202,0

nr224,1

opteWe21 270,0

Ergebnisse der nichtlinearen Theorie

0 0,1 0,2 0,3 0,4 0,5W e

* Korridorm odell

Kugelm odell

(1 + 1) - Evolutionsstrategie: 1 / 5 - Erfolgsregel

1/6 1/5 1/4

gggEN zxx

Algorithmus der (1 + 1) – ES mit 1/5-Erfolgsregel

sonst gEx{

vergrößern für We > 1 /

5 verkleinern für We < 1 /

normiert 1 Länge die auf gz

Zur 1/5-Erfolgsregel

Die Menschheit hat bis jetzt 10 hoch 15 Bits an Information gespeichert. Bis zum Jahr 2000 wird sich die Menge etwa verdoppeln. Dabei gilt für die Infosintflut Folgendes: Etwa drei Fünftel sind Unsinn und vermischter Unsinn; den ich „Trübkunde“ nenne; ein Fünftel ist zwar sinnvoll, aber vergängliche Info, und kaum ein Fünftel besteht aus ernsten Denk-früchten. Sogar die Forschungsanstalten werden in der Flut versinken, weil sie nicht Information, sondern Selektion benötigen, um weiter agieren zu können.

Der Futurologe Stanislaw Lem schrieb in einem Essay im Spiegel:

www.bionik.tu-berlin.de

Der Minotaurus, ein mischgestaltiges Wesen (halb Mensch, halb Stier) haust in einem Labyrinth, das Dädalus im Auftrag des kretischen Königs Minos in Knossos erbaut hat. Sieben Jungen und sieben Mädchen mussten jährlich dem Minotaurus geopfert werden. Da beschließt der athenische Held Theseus, dem Minotaurus ein Ende zu bereiten. In Knossos auf Kreta ange-kommen verliebt er sich in Ariadne, der Tochter des Königs Minos. Bevor Theseus in das Labyrinth eindringt gib Ariadne ihm auf Anraten von Dädalus ein Garnknäuel. Theseus bindet ein Ende des Fadens an das bronzene Gitter des Eingangstores. Nach langem Umherirren im Labyrinth - das Garnknäuel hinter sich abwickelnd - stößt Theseus auf den Minotaurus und erschlägt ihn in einem fürchterlichen Kampf. Mit Hilfe des ausgerollten roten Fadens der Ariadne findet Theseus problemlos den Weg in die Freiheit zurück.

Auf diesen „Ariadnefaden“ geht unser Wort „Leitfaden“ zurück.

Zur Wahrscheinlichkeitsrechnung

Diskrete Wahrscheinlichkeit:

Die Wahrscheinlichkeit eine 4 zu würfeln ist gleich 1/6.

Die Wahrscheinlichkeit eine 4 oder eine 5 zu würfeln ist gleich 1/6 1/6 = 2/6.

Die Wahrscheinlichkeit eine 3 und nochmals eine 3 zu würfeln ist gleich 1/6 1/6 = 1/36.

Kontinuierliche Wahrscheinlichkeit:

Mit dem Befehl ran in Basic wird eine Zufallszahl zwischen 0 und 1 aufgerufen. Die Wahr-scheinlichkeit genau 0,60000… (mit unendlich vielen Nullen) aufzurufen ist = 0. Sinnvoll ist nur die Frage nach der Wahrscheinlichkeit, einen Wert zwischen 0,59000… und 0,61000… zu erwürfeln.

Der Wert (hier 0,02) dividiert durch das gesamte Intervall (hier gerade = 1) ergibt die Wahrscheinlichleitsdichte.

Die Wahrscheinlichkeitsdichte w ist also ein abstrakter Zahlenwert, der mit dem Linien-, Flächen- oder Volumenelement multipliziert die reale Wahrscheinlichkeit angibt, diesen Linien-, Flächen- oder Volumenbereich zu treffen.

Wir gehen alle Punkte (hier der Ebene) durch, multiplizieren den Fortschrittspfeil (falls vor-handen) mit der Trefferwahrscheinlichkeitsdichte und addieren alle positiven Pfeillängen zusammen. Da wir mit der Wahrscheinlichkeitsdichte operieren, erübrigt sich die Division durch die Zahl der aufgesuchten Punkte, die ja Unendlich wäre.

Die Summation der unendlich vielen differentiellen Punktmultiplikationen führt zu einem Inte-gral, das im Fall von n Dimensionen ein n-dimensionales Raumintegral ist. Da positive Pfeile nur im Erfolgsgebiet R+ auftreten, erstrecken wir das Raumintegral nur über den R+-Bereich.

Die Funktion erf(x) heißt Fehlerfunktion (error function). Erf(x) ist nicht anders zu behandeln als ein Sinus, Cosinus oder Tangenshyperbolikus. Will sagen, dass der Wert für ein gegebenes Argument x aus einer Tabelle abgelesen werden muss.

Erf(x) ist definiert als das Integral

xz dzex

22)(erf

und hat den grafischen Verlauf

-2 -1 1 20

erf( )x

Ingo Rechenberg PowerPoint-Folien zur 4. Vorlesung Evolutionsstrategie I Auf dem Weg zu einer...

Documents