Texturen & Objekte Seminar: Visuelle Wahrnehmung Dozent: Dr. Alexander Schütz Referent: Henrik...

Post on 06-Apr-2015

108 views 0 download

transcript

Texturen & Objekte

Seminar: Visuelle Wahrnehmung

Dozent: Dr. Alexander Schütz

Referent: Henrik Gummert

Datum: 23.06.2009

Merkmale und Gegenstände in der visuellen Verarbeitung

Gliederung

1. Einführung

2. Die erste Stufe des Sehens

3. Höhere Stufen des Sehens

4. Das Modell visueller Verarbeitung

5. Klausurfragen

6. Quellen

1. Einführung

• Beispiel für visuelle Aufmerksamkeit

• Sucht das Fahrrad im folgenden Bild

• Parallele Suche• Bild ist vollständig, zeigt eine alltägliche Szene• Erwartung über typische Position von Fahrrädern

in städtischer Umgebung erleichtert Suche• Sucht das Fahrrad erneut

• Serielle Suche

• Bildschnipsel müssen nacheinander durchsucht werden

• Dauert für gewöhnlich länger, als parallele Suche

• Wissen über die Welt beschleunigt Wahrnehmung, senkt Fehlerquote

Verarbeitungsstufen für die visuelle Aufmerksamkeit (David

C. Marr)1. Ein Lichtmuster wird in eine Codierung

umgewandelt

2. Repräsentation (Abbildung von Flächen und Körpern im Gehirn)

3. Identifikation von Objekten

2. Die erste Stufe des Sehens

Definition

• Voraufmerksame (präattentive) Ebene visueller Wahrnehmung

• Voraufmerksames Sehen zerlegt ein Bild in seine Merkmale

• Erkennt Form, Farbe, Orientierung, Krümmung, Parallelität, Verbindung und Bewegung

[1]

Beispiele zur präattentiven Wahrnehmung

• Wasserfalltäuschung: schaut man einige Minuten auf einen Wasserfall und dann auf das Ufer, meint man, es bewege sich in entgegengesetzter Richtung. Die visuellen Detektoren gewöhnen sich an eine bestimmte Bewegungsrichtung, unabhängig von dem sich bewegenden Objekt

• Grenzlinien: leicht zu ziehen, bei einfachen Unterschieden, schwer zu ziehen bei kombinierten Unterschieden

OOOVVV

OOOVVV

OOOVVV

OOOVVV

OVVOOV

VOOOOV

OVVVVO

VVOOVO

OOVOVV

VVOVOV OVOOOV

OOVVOV

Einfacher Unterschied: Form

Einfacher Unterschied: Farbe

Kombin. Unterschied: Farbe u. Form nicht einheitlich

Ein Versuch bei dem Leute gebeten wurden, Grenzlinien zwischen Bildbereichen zu bestimmen, um herauszufinden, was Menschen solche Grenzen ziehen lässt und was nicht.

Visuelle Suchaufgaben

• Ein Zielgegenstand (Target) soll möglichst schnell aus einer Häufung von Distraktoren (ablenkenden Gegenständen) auf einem Bild herausgesucht werden

• Parallele Suche: Gesamtes Bild wird simultan abgesucht, Anzahl der Distraktoren nicht relevant

• Serielle Suche: Dauer der Suche steigt linear an, je mehr Distraktoren verwendet werden

• Links: parallele Suche, Anzahl der Distraktoren nicht relevant (unten grafisch dargestellt)

• Rechts: serielle Suche, Dauer der Suche steigt linear an, je mehr Distraktoren verwendet werden (unten grafisch dargestellt)

[2]

Grundsätze

• Anfängliches Sehen codiert Schrägheit und Krümmung, jedoch nicht Vertikalität oder Geradheit. Vertikalen und geraden Zielen scheint ein Merkmal zu fehlen, das die benutzten Distraktoren besitzen

• Erhöhte Ähnlichkeit der Distraktoren verlängert die serielle Suche

• Ziel und Distraktoren sind nicht austauschbar die Suchdauer betreffend

• Fehlendes Element schwerer zu finden, als zusätzliches Element

• OOOQOO fällt eher auf

• QQQOQQ fällt später auf

[3]

Fällt eher auf Fällt später auf

Schlussfolgerung

• Präattentive Wahrnehmung kann einzelne Unterschiede erkennen, nicht aber Kombinationen von Unterschieden

3. Höhere Stufen des Sehens

Gerichtete Aufmerksamkeit

• Fügt Merkmale eines Bildteils zu einer Repräsentation zusammen

• Kann nur einen bestimmten Ort fokussieren• Areale unterschiedlicher Größe fokussierbar

(je kleiner der Fokus, desto genauer lässt sich lokalisieren)

• Nicht auf räumlich separate Areale aufteilbar

Verknüpfungs-Täuschungen

• Beweise für die Relevanz gerichteter Aufmerksamkeit

5 X S T 7

? ? ?

Welche Farbe hatten die Buchstaben?

Habt ihr ein Dollarzeichen gesehen? ($)

Bottom Up & Top Down

• 3 farbige Formen, Zahl als Distraktor• Danach Schwarz-Weiß-Maske und

Schrägstrich, der Position des Targets angibt

• Farben wurden häufig falsch zugeordnet, wenn nur willkürliche Formen erwartet wurden

• Weniger Fehler, wenn den Formen Namen zugewiesen wurden (Möhre, See, Reifen)

• Bei vorheriger Namensgebung spielt Farbe eine untergeordnete Rolle

• Verbindung der Merkmale Bottom-Up Prozess, erste Phase der Informationsverarbeitung, nicht durch gerichtete Aufmerksamkeit beeinflusst (geschieht unbewusst)

• Nach der Verbindung Top-Down Prozess; z.B. den Objekten Namen zuweisen (geschieht bewusst)

• Vorwissen und Erwartungen erleichtern den Einsatz der Aufmerksamkeit zur Merkmalsverknüpfung, rufen aber keine Verknüpfungs-Täuschungen hervor, diese werden scheinbar auf einer Verarbeitungsstufe gebildet, die nicht von vorhandenem Wissen beeinflusst wird.

Akten

• Für jedes wahrgenommene Objekt wird eine Akte mit allen Informationen darüber angelegt

• Vergleichbar mit Polizeiakte, wird immer auf den neuesten Stand gebracht, wenn sich das Objekt verändert. (Wenn man zum Beispiel einen Vogel betrachtet, der sich putzt oder die Flügel ausbreitet und somit seine Form und seine Größe verändert, bleibt er doch das gleiche Objekt und wird nicht ob der geänderten Form als ein neues Objekt wahrgenommen.)

• Nachgewiesen durch Test, bei dem Buchstaben kurz in der Mitte zweier rotierender Rahmen aufleuchteten (zeitl. Und räuml. Abstände dabei in einem Rahmen gleich bleibend)

• Neuer Buchstabe benötigt länger, um erkannt zu werden

Priming: präattentives Sehen erleichtert die Wiedererkennung eines bekannten Objektes, wenn alte und neue Repräsentation zueinander passen (Zeit zum Identifizieren kürzer, wenn Buchstabe gleich bleibend)

4. Das Modell visueller Verarbeitung

• Musterkarten codieren (präattentiv) einfache, zweckmäßige Eigenschaften

• Gerichtete Aufmerksamkeit wählt an bestimmten Positionen Merkmale aus, die an bestimmten Orten vorhanden sind

• Später werden Akten über die Objekte angelegt, welche die Wiedererkennungszeit verkürzen

• Akten werden mit gespeicherten Daten aus Wiedererkennungsnetzwerk verglichen

• Das Netzwerk vereinigt Merkmale, Verhalten, Namen und Bedeutung vertrauter Gegenstände

5. Klausurfragen

• Was erkennt präattentive Wahrnehmung und wo sind ihre Grenzen?

• Was ist der primäre Unterschied zwischen der ersten Ebene des Sehens und höheren Ebenen?

6. Quellen

[1] Preim, Bernhard; Bade, Ragnar: „Visual Perception“, Visualization Lecture SoSe 2007, University of Magdebourg

[2] Jochen Müsseler / Wolfgang Prinz (2002). Allgemeine Psychologie. Heidelberg: Spektrum Akademischer Verlag

[3] http://wwwpsy.uni-muenster.de/inst3/AEMortensen/Lehre/VisWahrnSS04/Handzettel/Ref5_Thesenpapier.pdf

[alle anderen Bilder] Treisman, A. (1992). Merkmale und Gegenstände in der visuellen Verarbeitung. In Wolf Singer,

Gehirn und Kognition. (S.134-144). Heidelberg:Spektrum Akademischer Verlag

Texturwahrnehmung

Gliederung

1. Einführung

2. Texturunterscheidung

3. Abschließende Frage

4. Klausurfragen

5. Quellen

1. Einführung

Forschungsansatz:• Grenzen der Texturwahrnehmung des

visuellen Systems aufdecken• Wahrnehmungsaufgaben, die die Potenz des

VS übersteigen, sollen diese Grenzen aufzeigen

• Nur reine Wahrnehmung untersucht, ohne Kognition

Reine Wahrnehmung, die nicht durch kognitive Prozesse unterstützt werden muss. (Dis-)Kontinuität sofort sichtbar.

Reine Wahrnehmung

Erste Figur besteht aus einer durchgehenden, in sich geschlossenen Linie, zweite Figur aus zwei getrennten Linien (nicht wahrnehmbar ohne besondere Aufmerksamkeit, keine reine Wahrnehmung)

Symmetrie

Wiederholung

Wiederholung & Symmetrie

Linkes Muster zufällig, mittleres Muster besteht aus 4 identischen Quadranten, rechtes Muster entsteht, wird einer der Quadranten des mittleren Musters an der Mittelsenkrechten gespiegelt und das so entstandene Bild erneut an der horizontalen Achse gespiegelt (Symmetrie wird sichtbar)

Wahrnehmung von Symmetrie und Wiederholung

• Ob Symmetrie wahrgenommen wird, ist von symmetrischen Zellpaaren entlang der Symmetrieachse abhängig

• Periodizität wird wahrgenommen, wenn der Abstand zwischen den Musterwiederholungen nicht zu groß ist

• größere Wiederholungsabstände / Komplexität Überlastung des visuellen Systems

Gründe für Beschränkung des vis. Wahrnehmungssystems

• Analyse einer Bildeigenschaft geht über die Verarbeitungsmöglichkeiten des Wahrnehmungssystems hinaus

• Wahrnehmung von Bildeigenschaften war evolutionär nicht relevant, hat nicht zum Überleben beigetragen

2. Texturunterscheidung

• Ein Minimum mehr an Komplexität, macht die Unterscheidung von Texturen unmöglich

• Statistik 1. Ordnung: Dichteschwankung (Menge)• Statistik 2. Ordnung: Schwankung der Körnigkeit

(Abstand)• Texturen, die in ihren Statistiken dritter und

höherer Ordnung (bspw. gespiegelte) voneinander abweichen, können nicht voneinander unterschieden werden

• Wahrscheinlichkeit, mit der ein Dipol (bspw. Nadel) mit beiden Enden auf einem schwarzen Punkt landet, bei Unterschied in 2. Ordnung höher

• Statistik dritter Ordnung könnte man beschreiben, indem man ein Dreieck auf eine Textur fallen lässt und die Häufigkeit ermittelt, mit der seine Eckpunkte auf Punkte einer bestimmten Leuchtdichte treffen

TexturdiskriminationZeigt man dieses Bild nur kurz, wird eher links als rechts die sich abhebende Fläche erkannt. Dies wird von Julesz als Texturdiskrimination bezeichnet.

Texturunterscheidung

Unterschied in Statistik 2. Ordnung

Gleiche Anzahl schwarzer Punkte (1.Ordnung), rechts Punkte mind. 10 Punktdurchmesser auseinander (2.Ordnung)

Markoff Prozess

Markoff-Prozesse nur eindimensional, benötigen mindestens 3 Leuchtdichtewerte (schwarz, grau, weiß), dienen der Erstellung solcher Muster, spezielle Klasse von stochastischen Prozessen

Links: Unterschied in Statistik 3.Ordnung, nur bei sehr genauer Betrachtung sind links Streifen gleicher Leuchtdichte erkennbar, rechte Hälfte praktisch streifenfrei

Rechts: Unterschied in Statistik 2.Ordnung

Merkmalsdetektoren

• Neurophysiologische Untersuchungen: visuelle Systeme von Katzen und Affen besitzen Detektoren für lokale Formen

• Merkmalsdetektoren: Neuronen, die nur dann feuern, wenn in einem begrenzten Netzhautbereich um sie herum Flecken und Liniensegmente mit bestimmten Eigenschaften auftreten

• Komplexe und hyperkomplexe Merkmalsdetektoren (höhere cortikale Regionen): ermöglichen komplexes Formensehen

Herstellung von Texturen ohne Markoff Prozess

• Modell ermöglicht Erstellung von Mikromustern mit identischen Statistiken 2. Ordnung, jeder Dipol der zwei Scheiben in a berührt, hat einen Dipol gleicher Länge, der zwei Scheiben in b berührt

• Mikromuster unterscheiden sich in Statistiken 3. Ordnung, weil ein Dreieck (bspw. KLQ) in a auf eine Weise platziert werden kann, wie in b nicht möglich

Texturpaare aus Mikromustern

Links: zufällig gedrehte, aber regelmäßig verteilte Mikrom.

Mitte: zufällig gedrehte, zufällig verteilte Mikromuster

Rechts: Anordnung wie links, unscharf gemacht, ändert Statistik 2. Ordnung, Texturunterscheidung leichter

Liniendetektoren

Weiteres Paar von Mikromustern, umgedrehtes T & Rechteck

Können laut Julesz wahrscheinlich „Liniendetektoren“ (wie im visuellen System von Katzen und Affen) im visuellen System des Menschen erregen

Mikromuster Liniendetektoren

Links: Muster regelmäßig verteilt, zufällig gedreht

Mitte: Muster zufällig verteilt, zufällig gedreht

Rechts: regelmäßig verteilt, nur 2 Rotationen zulässig (0° & 90°), Bildung langer Linien möglich

Mikromuster Liniendetektoren

Schlussfolgerung

• Schon bei regelmäßiger Anordnung von Mikromustern ist die Texturunterscheidung schwierig bis unmöglich, bei zufälliger Anordnung noch schwieriger

• Einfache Punkt- und Liniendetektoren im visuellen System des Menschen tragen wenig zur Texturunterscheidung bei

• Komplexe und hyperkomplexe Merkmalsdetektoren erleichtern die reine Wahrnehmung bei der Texturunterscheidung nicht

Modell für lokale & globale Texturunterscheidung

Links: genaues Betrachten und Erkennen lokaler Formen, Informationen von der Netzhaut durchlaufen eine Hierarchie von Detektoren, die das Erkennen möglich machen

Rechts: globale Texturunterscheidung, Einheit für Texturdiskrimination fasst Ausgänge einfacher Merkmalsdetektoren paarweise zusammen, wären mehr als 2 Einheiten mit der nächsten Stufe verbunden, könnten auch Statistiken höher als zweiter Ordnung verarbeitet werden

Vollständige Erfassung der Statistik 2. Ordnung möglicherweise nicht notwendig für Unterscheidung, relevant nur einige daraus ableitbare statistische Parameter. Obiges Bild macht Unterscheidung der Texturpaare nahezu unmöglich, obwohl verschiedene Statistiken 2. Ordnung

Mikromuster im türkisen Quadrat = Spiegelung des umgebenden Mikromusters, beide Mikromuster nicht zufällig in alle Richtungen gedreht verschiedene Statistiken 2. Ordnung (Dipol Statistiken), dennoch fast nicht zu unterscheiden

Modell für lokale & globale Texturunterscheidung

• Der Mechanismus der Texturdiskrimination kann die Ausgänge von höchstens zwei einfachen Merkmalsdetektoreinheiten vergleichen

• Möglicherweise gehen in den Prozess nur Statistiken erster Ordnung von versch. einfachen Merkmalsdetektoren ein, die hinsichtlich Durchmesser, Breite, Länge oder Orientierung zusammengefasst werden können

3. Abschließende Frage

• Warum haben sich während der Evolution für das Sehen zwei Systeme entwickelt, eines für das lokale Erkennen von Formen, ein anderes für die globale Wahrnehmung?

• Antwort: Aufgrund der fundamentalen Dichotomie der Wahrnehmung, Dinge in Figur und Grund zu zerlegen – jedes Objekt kann entweder als Figur oder als Grund gesehen werden, nie beides auf einmal

Die globale Texturwahrnehmung ist als allgemeiner Prozess zu betrachten, der die Wahrnehmung aller Dinge umfasst, die nicht im Zentrum unserer Aufmerksamkeit liegen.

4. Klausurfragen

• Worin unterscheiden sich Statistiken 1. und 2. Ordnung?

• Was sind Merkmalsdetektoren?

5. Quellen

Alle Bilder aus:

Julesz, B.: Texturwahrnehmung. In: Spektrum der Wissenschaft: Wahrnehmung und visuelles System. (S. 48-57) Heidelberg, 1986

Vielen Dank für eure Aufmerksamkeit!