+ All Categories
Home > Documents > Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche,...

Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche,...

Date post: 05-Apr-2015
Category:
Upload: marthe-gilgenbach
View: 104 times
Download: 2 times
Share this document with a friend
38
Konkurrentes Lernen AS-1
Transcript
Page 1: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Konkurrentes LernenAS-1

Page 2: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 2 -

Lernparadigmen

Das Plastizität vs. Stabilitäts-Dilemma

„weiche“, adaptierte Verbindungen Schnelle Anpassung auf veränderte Anforderungen bzw.Umgebung

Bessere Reaktion bei veränderter Umgebung

▼ Bilden unspezifischer, generalisierter Mittelwertsreaktionen

▼ Keine neue Reaktion (Klasse) möglich bei stark veränd. Umgebung

„harte“, inflexible, stabile Verbindungen einmal erlangte gute Reaktion bleibt erhalten trotz Ausreisser Bei schlechter Passung (Test!) Bildung neuer Klassen möglich▼ keine Anpassung bei leicht veränderter Umgebung möglich

Idee: Lernen + neue Klassen durch Konkurrenzsituation: der Bessere übernimmt und lernt die Klasse

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 3: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Selbstorganisierende Karten

Somatotopische Karten

Anwendung Robotersteuerung

Anwendung Sprachsynthese

- 3 -

Page 4: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Vorbild Gehirn

- 4 -Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 5: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Das Vorbild: Gehirnfunktionen

Unterteilung des Gehirns in funktionale Bereiche

Gehirn = 2-dim „Tuch“- 5 -Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 6: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 6 -

Somatotopie

Beobachtung: Abbilder, Karten

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 7: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 7 -

Lokale Wechselwirkungen

Aktivität in kontinuierlichen Neuronenfeldern

Wechselwirkungen

Eingabe X

+ +

– –

u(v,v’)

v v’

x

v

'd t ,''ut,sd t,t,,wt,zt,zt

VX

vvvvvxxxvvv

yx

Eingabe für Neuron v Schwelle + laterale Kopplungen Cohen-Grossberg 1983: Aktivität stabil bei symm. Gewichten uij, monoton wachs. y(.) und >0

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 8: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 8 -

Lokale Wechselwirkungen

Training: Hebb‘sches Lernen

t , t, t,,wt,,w t 11 xvxvxv xy

022 t, t,st,st

xy vvv

1,2 >>

Gewichte

Schwelle

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 9: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 9 -

Lokale Wechselwirkungen

Training

+ + + – – – – –

yc

zi(t) – zi(t-1) = – zi(t-1) + jwij(t) xj(t) + j uijyj(t)

Abklingen der Veränderung, diskrete Strukturen

yi(t) = S( jwij(t) xj(t) + j uijyj(t) )

wij(t) = wij(t-1) + [xjyi -B(yi)wij] mit B(.) zum Vergessen

z , t t ' t

v

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 10: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 10 -

Lokale Wechselwirkungen

Simulation der Aktivität: Populationskodierung

hohe Schwelle niedrige Schwelle

Abstraktion: Mittelpunkt einer „Blase“. Hier: B(y)=1

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 11: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Selbstorganisierende Karten

Somatotopische Karten

Anwendung Robotersteuerung

Anwendung Sprachsynthese

- 11 -

Page 12: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 12 -

Kohonennetze: Topologie

Eingabedimension n = 3

Ausgabedimension d = 2

Def. „Nachbarschaft“ von Neuronen

x1 x2 x3

yc

X= ( )

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 13: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 13 -

Lernalgorithmus Kohonenkarten

1. Suche Neuron (Gewichtsvektor) mit kleinstem Abstand zur Eingabe x

winner selection kk

c min wxwx

3. Adaptiere auch die nächsten Nachbarn

wk(t+1) = wk(t) + (t+1) h(t+1,c,k) [x - wk(t)]

z.B. mit

2. Adaptiere die Gewichte

wk(t+1) = wk(t) + (t+1) [x - wk(t)]

sonst 0

istaft vonNachbarschder aus Neuron wenn1:k,c,1th

c k

Winner Take All

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 14: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 14 -

Nachbarschaftsfunktionen

Binäre Funktion: zeitabhängig

Glockenfunktion

h(k,c,t)= exp(k-c,(t))

ck

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 15: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Topologie-Entwicklung

Eingabe: uniform-verteilte, 2-dim Zufallszahlen Zeichnung:

Verbindungsline vom Gewichtsvektorendpkt zum Nachbarn

t=0 t=20 t=100 t=10000

Zeichnung :

- 15 -Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 16: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 16 -

Topologie-Entwicklung

Beispiel Finger-Sensorikentwicklung

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 17: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 17 -

Topologie-Entwicklung

Beispiel Finger-Amputation

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 18: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 18 -

Topologie-Entwicklung

Tendenz zur Selbstordnung

Iteration für zwei Gewichtsvektoren w1 und w2 bei gleicher

Eingabe:

• Abstand verringert sich (Rechnung)

• Kein Nachbar überholt den Gewinner (Rechnung)

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 19: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 19 -

Pseudocode für Kohonenkarten

VAR x: ARRAY [1..n] OF REAL; (* Muster*) w: ARRAY [1..m,1..m] OF ARRAY [1..n] OF REAL; (* Gewichte*) vc: RECORD i,j : INTEGER END; (* sel. Neuron *) BEGIN := max ; (* initial: max. Nachbarschaft *) FOR t:=1 TO tmax

DO Read(PatternFile,x) (* Muster erzeugen oder einlesen *) (* Neuron selektieren *) Min:= ABS(x - w[1,1]); (* initialer Wert *) FOR i:=1 TO m DO (* In allen Spalten *) FOR j:= 1 TO m DO (* und Zeilen *) Abstand := ABS(x- w[i,j]); (* suche Minimum *) IF Abstand < Min THEN Min:=Abstand ; vc.i:=i; vc.j:=j; END END END (* Gewichte adaptieren *) FOR i:= vc.i- TO vc.i+ DO (* Evaluiere 2-dim. *) FOR j:= vc.j- TO vc.j+ DO (* Nachbarschaft um c*) IF i>0 AND i<= m AND j>0 AND j<=m THEN (* Vorsicht am Rand *) w[i,j] = w[i,j] + 1.0/FLOAT( t)*( x-w[i,j]) ENDIF END END (*i*) GrafikAnzeige (t,w) (* Visualisierung der Iteration *) upDate (,t) (* Verkleinerung des Nachbarschaftsradius *) END (*t*)

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 20: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 20 -

Überwachte adaptive Vektorquantisierung

Klasse bekannt: Lerne die Klassengrenzen

ck 0

Klasse Klassec,k 1-

Klasse Klassec,k 1

c

c

xw

xw

mit h(t,c,k) :=

wk(t+1) = wk(t) + (t+1) h(t,c,k)[x - wk(t)]

h(t,c,k) :=

c' c,k 0

Klasse Klasseund c' c,k 1-

Klasse Klasseund c' c,k 1

k

k

xw

xw2. Nachbar c‘ ebenfalls

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 21: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Selbstorganisierende Karten

Somatotopische Karten

Anwendung Robotersteuerung

Anwendung Sprachsynthese

- 21 -

Page 22: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 22 -

Spracherkennung

Beispiel: Neuronale Schreibmaschine

x1

x2

x3

x4

x5

x6

x7

x8 .

..

x15

Filter 1

Filter 6

Filter 7

Filter 8

. . .

Filter 15

Filter 2

Filter 3

Filter 4

Filter 5x(t)

Fouriertranformation 200 Hz-5KHz

Mer

kmal

svek

tor

x(t)

26 ms überlappende Intervalle, alle 10 ms

Finnisch: 21 vokal. Phoneme,

50 Trainingsmuster pro Phonem.

3 Konsonant. /k/, /p/, /t/ extra!

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 23: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 23 -

Spracherkennung

Erfolg: ähnliche Phoneme - ähnlicher Ort.

z.B. Dynamik des Wortes >>humppila<<

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 24: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 24 -

Spracherkennung

Implementierung: Hardware-Platine

Training: 10min/100Worte pro Sprecher

Erkennung: 250ms/Wort

Leistung92%-97% richtig erkannt

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 25: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 25 -

Spracherkennung

Implementierung

96kB64kB

512kB

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 26: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Selbstorganisierende Karten

Somatotopische Karten

Anwendg Robotersteuerung

Anwendg Sprachsynthese

- 26 -

Page 27: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 27 -

Robotersteuerung vs. Muskelkontrolle

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 28: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 28 -

Robotersteuerung

Beispiel Puma-Roboter Probleme

Kinematik Winkelkoord. Gelenke kartes. Koord. x

Inverse Kinematikkartes. Koord. x Winkelkoord.

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 29: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 29 -

Robotersteuerung

Kinematik durch homogene Koord.transformationen

Drehung Skalierung Shift

cossin

sincos

2

1

c0

0c 1 0

0 1

0 0 1

1

2

s

s

1 2 1

1 2 2

cos sin

sin cos

0 0 1

c c s

c c s

W = Wshift Wrot Wscal =

Inverse Kinematik Analytisch schwierig oder unmöglich!

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 30: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 30 -

Robotersteuerung

Inverse Kinematik beim PUMA-Roboterarm

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 31: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 31 -

Robotersteuerung

Inverse Kinematik beim PUMA-Roboterarm

Besser:

Lernen der inversen Kinematik!

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 32: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 32 -

Robotersteuerung

Probleme der Positionskontrolle

Änderungen der Armgeometrie sind nicht möglich,sonst Neu-Analyse und Reprogrammierung der Transformation nötig

Mehr Gelenke als Freiheitsgradenur Teilbewegungen möglich

Analytische Transformation Kart. KoordGelenk-Koord. langsamEchtzeitprobleme

Keine bessere Auflösung an kritischen Stellen

Keine automatische Bewegungsoptimierung (z.B. Energie)

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 33: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 33 -

Robotersteuerung

Grobe Positionierung

Suche Neuron mit Winner-take-all

Assoziiert ist k = (1,2,3)

Lernen von wk z.B. mit Kohonen-Netz,

oder fest initialisiert

| wk –x | = maxi | wi –x |

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 34: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 34 -

Robotersteuerung

Feine Positionierung

Aktivität grobe Pos. feine Pos.(x) = c + = c + Ac (x-wc) = Ucx

Lernen

Uc(t+1) = Uc(t) + h(.)(t+1)[Uc*-Uc(t)] SOM Lernregel

Widrow-Hoff Lernregel für Schätzung U*

Lehrervorgaben xI : beob. Position durch wc bzw. c

xF : beob. finale Position

c* = c + Ac(x-xF)

Ac* = Ac + Ac[ (x-wc) – (xF-xI) ] (xF-xI)

T/ |(xF-xI)|2

mit Uc = (Ac, c,), x = (x-wc,1)

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 35: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 35 -

Robotersteuerung

Konvergenzverhalten

Feinbewegung Ac

Grobbewegung c

t = 0 t = 500 t = 10.000

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 36: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 36 -

Robotersteuerung

Vorteile

• Schnelle Kontrolle, da tabellierte Funktion

• SOMs steuern auch sehr unkonventioneller Architekturen (Vielgelenksarme, benutzer-definierte Geometrie)

• Verbesserte Auflösung (Neuronendichte) der topologie-erhaltenden Abbildung in oft benutzten Gebieten : bedarfsabhängige Auflösung!

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 37: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 37 -

Robotersteuerung

Vorteile

• Nebenbedingungen sind einfacher zu integrieren (z.B. Energie)

• Lerngeschwindigkeit ist durch die Nachbarschaft deutlich beschleunigt (Fluch der Dimensionen gemildert!)

= 2

= 0

5000 10.000 15.000 Iterationen

Fehler

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009

Page 38: Konkurrentes Lernen AS-1. - 2 - Lernparadigmen Das Plastizität vs. Stabilitäts-Dilemma weiche, adaptierte Verbindungen Schnelle Anpassung auf veränderte.

- 38 -

Robotersteuerung

Nachteile

Die erlernten Transformationstabellen sind fest

Zeitsequenzen können nicht erlernt werden (Trajektorien)

Es gibt keine Generalisierung oder Abstraktion einer Bewegung; Skalierung der Bewegung ist nicht möglich!

Rüdiger Brause: Adaptive Systeme, Institut für Informatik, WS 2009


Recommended