+ All Categories
Home > Documents > LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den...

Date post: 06-Apr-2016
Category:
Upload: meta-goldschmidt
View: 216 times
Download: 3 times
Share this document with a friend
21
LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003
Transcript
Page 1: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

LFG als Interlingua in der maschinellen Übersetzung

Referat von Zuzana Pesselováam Mittwoch, den 05.02.2003

Page 2: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Interlingua• Ziel

Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen.

• gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig

von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes).

• NachteileAnalyse und Generierung müssen streng getrennt

seinWährend der Generierung ist es nicht möglich, auf

den Originaltext zurückzugreifen.

Page 3: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

strukturelle Repräsentation in den Interlingua-Systemen

• Propositionale Logik• Any government is dependent on its supporters.

– All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T)

• Wertung– Problemlose Analyse, Generierung beinahe unmöglich, da

keine syntaktische Information vorhanden.• Lösungen: „multilingual paraphrasing“

– Every governmet has supporters which it depends on.– People who support all governments are depended on by

them.– All governments depend on people who support them.

Page 4: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

strukturelle Repräsentation in den Interlingua-Systemen

• LFG• Zusammenfassung mehrerer Sprachen beim

gleichzeitigen Ausgleich deren Unterschiede.

Page 5: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

lexikalische Repräsentation in den Interlingua-Systemen

• Konzepte

• sprachunabhängige lexikalische Einheiten

• „meanings derived from the process of understanding of texts“

• Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)

Page 6: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Definition von Interlingua

• Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur).

• Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.

Page 7: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Die Interlingua-Grammatiken• Generative Transformationsgrammatik

(Chomsky, seit 1955)– 50.-90. Jahre– Oberflächenstruktur vs. Tiefenstruktur– Transformationen, die eine TS in eine OS

überführen– Die Annahme, dass es sich um eine sprach-

unabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.

Page 8: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Die Interlingua-Grammatiken• 2. Kasusgrammatik

(Fillmore, 1968)– Vermutung, dass die Repräsentationen der

Kasusstruktur die Syntaxuniversalien abbilden

– oft benutzt worden in bilingualen transfer-basierten Systemen (z.B. Japanisch)

– Problem: Kasusrollen nicht standardisiert(„no widely agreed set of case relations“)

Page 9: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Maschinelle Übersetzung mit LFG

• 70. Jahre (Bresnan, Kaplan)• als Kritik an GTG• zwei Ebenen der syntaktischen Repräsentation

– C-Struktur (constituent-structure)– F-Struktur (functional-structure)

• werden erzeugt über die Phrasenstrukturregeln• zusätzlich

– Funktionen (als Grundbegriffe)– Lexikoneinträge (mit lexikalischen Regeln)

Page 10: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

C-Struktur und F-Struktur• Beispiel

Page 11: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

C-Struktur und F-Struktur• C-Struktur

– Phrasenstrukturbaum– geordnete Aufstellung der Wörter und Phrasen des

Satzes– kontextfreie Notation

• F-Struktur– hierarchische Funktion– enspricht den grammatischen Funktionen (S, O,

etc.)– umfaßt auch morphosyntaktische Merkmale (Case,

Num, Tense)

Page 12: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Transfer mit F-Strukturen• Einlesen des Quellsprachensatzes (Parser)• Ergebnis ist/sind F-Struktur(en) der

Quellsprache• Übersetzung der F-Struktur(en) mithilfe von

– Transfer-Lexikon (inkl. Subkategorisierung)– Top-Down-Verfahren

• Ergebnis ist/sind F-Struktur(en) der Zielsprache

• Generieren der Oberfläche (Generator)

Page 13: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Top down beim Transfer mit F-Strukturen

• Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED)

• Überfprüfung der Valenz in der vorliegenden F-Struktur

• Suche vom Eintrag mit der gleichen Valenz• Eintrag = Grundlage für die F-Struktur der

Zeilsprache• anschl. PRED der nächste niedrigen Stufe wird

gesucht

Page 14: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Transfer mit F-Strukturen• Beispiel

Page 15: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Funktionen in der LFG• Description-by-analysis

– Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde.

• Codescription– Diese Beschreibungen lassen zu, dass die

endgültige Struktur Eigenschaften hat, die in der F-Struktur nicht vorhanden sein können.

Page 16: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Funktionen in der LFG• Funktionen signalisieren das Überführen der

Strukturen in andere Strukturen (z.B. von C-Strukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).

Page 17: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Vorgehensweise bei der MÜ mit LFG (Stufe 2)

• Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet.

• Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht.

• Dies dient als Input für die Generierung der zielsprachigen Version.

Page 18: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Beispiel für die Leistungsfähigkeit

• The student is likely to work.• Il est probable que l´etudiant travaillera.

Page 19: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Beispiel für die Leistungsfähigkeit

• Berücksichtigung der Tempuskonkordanz

Page 20: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Fazit des Ansatzes von Kaplan • „an approach to machine translation that

exploits the potential of simultaneous correspondences between different levels of linguistic representation“

• it allows „partial specification“ and „multi-level-transfer“

Page 21: LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003.

Kommerzielle Nutzung• XLE (Xerox Linguistic Environment)

– Xerox Palo Alto Research Center in California

– Xerox Research Center in Europe (Grenoble)– Institut für maschinelle Sprachverarbeitung

(Stuttgart)• FUJITSU (Japan)• NEC (Japan)


Recommended