Topologische Dependenzgrammatik fürs Arabische fileTopologische Dependenzgrammatik fürs Arabische...

Post on 10-Sep-2019

19 views 0 download

transcript

TopologischeDependenzgrammatik fürsArabische

Vortrag vonMarwan OdehBetreut von Ralph DebusmannnUnter der Aufsicht von Prof. Gert Smolka

ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration

ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration

AufgabeModellierung des Arabischen mit Extensible Dependency Grammar (XDG) (Debusmann, Duchier, Koller, Kuhlmann, Smolka, Thater2004)Phänomen-orientiert: viele Phänomene, kleines LexikonProof-of-concept: XDG geeignet zurBehandlung des Arabischen?

ArabischSemitische Sprache (wie Hebräisch, Aramäisch)Sprache des KoransEigenes AlphabetSchreibweise von rechts nach linksReiche MorphologieFreie Wortstellung auf SatzebeneEinzigartige grammatische Kategorien

Extensible Dependency Grammar (XDG)

Meta-Grammatikformalismus zurBeschreibung natürlicher SpracheBasiert auf Dependenzgrammatik (Tesniere1959, Melcuk 1988)Grammatische Beschreibung auf mehrerenDimensionenHier benutzt: Immediate Dominance (ID) und Linear Precedence (LP) wie in TDG (Duchierund Debusmann 2001, Debusmann 2001)

ID-Dimension (Immediate Dominance)

Beschreibt grammatische FunktionenKnoten entsprechen 1:1 WörternUngeordneter BaumKantenmarkierungen: Subjekt, Objekt…

ID-Beispielanalyse

LP-Dimension (Linear Precedence)

Beschreibt WortstellungGleiche Knoten wie ID-DimensionGeordneter, projektiver BaumKanten- und Knotenmarkierungen: topologische Felder

LP-Beispielanalyse

ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration

PhänomeneReiche MorphologieFreie Wortstellung auf SatzebeneMafool MotlakWeitere Phänomene in der Ausarbeitung

Reiche MorphologieFinites Verb bestimmt sogar Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:

Mohammedlachtضحكُ يمحمد

mohammedyadhak-u

Reiche MorphologieVerbform bestimmt Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:

Mohammedlachtضحكُ يمحمد

mohammedyadhak-u

Mohammedlachtتضحكُ محمد

mohammedtadhak-u

Reiche MorphologieVerbform bestimmt Genus des Subjekts, z.B. yadhaku: Subjekt maskulin, tadhaku: Subjektfeminin:

Mohammedlachtضحكُ يمحمد

mohammedyadhak-u

Mohammedlachtتضحكُ محمد

mohammedtadhak-u

*

Freie Wortstellung auf Satzebene

Ermöglicht durch reiche MorphologieGrammatische Funktion der NPs kann damit eindeutig bestimmtwerden

Beispiele

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Beispiele

mohammed-a tuhib-u fatat al

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Beispiele

mohammed-a tuhib-u fatat al

fatat al mohammed-a tuhib-u

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Beispiele

mohammed-a tuhib-u fatat al

fatat al mohammed-a tuhib-u

fatat al tuhib-u mohammed-a

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Beispiele

mohammed-a tuhib-u fatat al

tuhib-u fatat al mohammed-a

fatat al mohammed-a tuhib-u

fatat al tuhib-u mohammed-a

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Beispiele

mohammed-a tuhib-u fatat al

tuhib-u fatat al mohammed-a

fatat al mohammed-a tuhib-u

tuhib-u mohammed-a fatat al

fatat al tuhib-u mohammed-a

liebtdieFrauMohammed

محمد فتاة التحب

tuhib-ualfatat-umohammed-a

Mafool MotlakEinzigartige grammatische KategorieSpezielle VerbformVerstärkt das VerbSteht am SatzendeWiederholung: Verstärkung der Verstärkung

Mafool Motlak: Beispiele

spielteKind dasspielen

لعباً الولُدلعَب

laib-awalad-u allaib-an

Mafool Motlak: Beispiele

spielteKind dasspielen

لعباً الولُدلعَب

laib-awalad-u allaib-an

laib-an laib-an walad-u al laib-a

Mafool Motlak: Beispiele

spielteKind dasspielen

لعباً الولُدلعَب

laib-awalad-u allaib-an

laib-an laib-an walad-u al laib-a

laib-an laib-an laib-an walad-u al laib-a

ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration

Modellierung in XDGVerwendung des XDG Development Kits(XDK) (Debusmann, Duchier, Niehren 2004)XDG-Instanz: wie in TDG (Duchier und Debusmann 2001, Debusmann 2001) fürsDeutsche

Reiche MorphologieLexikon: jedes Wort beschreibt Menge von Agreement-Tupeln aus Genus, Numerus und Kasus:

[ ]: $ &mohammed agrs masc sg=

[ ]: $ & &mohammed u agrs masc sg nom− =

[ ]: $ & &mohammed a agrs masc sg acc− =

: ( ) ( )v V agr v agrs v∀ ∈ ∈Analyse: jeder Knoten wählt ein Tupel aus:

Reiche Morphologie weiterVerben bestimmen Agreement ihrer Töchter

Beispiele:

: ( ) ( )( )h l d agr d outagrs h l∀ − → ∈

[ ][ ]nomfemsubjoutagrstadhaku &$::=

[ ][ ]nommascsubjoutagrsyadhaku &$::=

Freie Wortstellung auf Satzebene

Nutzung der sauberen ID/LP-Trennung in XDGBeschreibung der Wortstellung losgelöst von grammatischer Funktiontopologische Satzstruktur fürs Arabische:

Verb und andere Verb-Dependenten (sf)

Mafool Motlaks (mmf)

Beispielanalyse

ID

LP

Weitere Beispielanalyse

ID

LP

Beispiel-Lexikoneintrag

=

}{:*}*,{:

{}::

**,,!1,!{:{}:

:

sfonsfmmfout

inlp

advmmobjsubjoutin

id

tuhibu

ÜberblickEinführungPhänomeneModellierung in XDGAbschluss und Demonstration

AbschlussProof-of-concept: Arabisch kann mit XDG modelliert werdenFür Kombination reiche Morphologie + freieWortstellung sehr gut geeignetVermutung: Topologische Felder funktionierenauch fürs ArabischeGrundlage für größere Grammatik fürsArabische (mit großem Lexikon)

Demonstration

LiteraturRalph Debusmann 2001: A Declarative Grammar Formalism for Dependency Grammar, Diplomarbeit, Computerlinguistik, Universität des Saarlandes, Saarbrücken/GERRalph Debusmann, Denys Duchier, Alexander Koller, Marco Kuhlmann, GertSmolka und Stefan Thater 2004: A Relational Syntax-Semantics Interface Based on Dependency Grammar, Proceedings of COLING 2004, Genf/CHDenys Duchier und Ralph Debusmann 2001: Topological Dependency Trees: A Constraint-Based Account of Linear Precedence, Proceedings of ACL 2001, Toulouse/FRAIgor Melcuk 1988: Dependency Syntax: Theory and Practice, State University Press of New York, Albany/USALucien Tesniere 1959: Elements de Syntaxe Structurale, Klincksiek, Paris/FRAMahier s. Ahmed 1988: An Export System for Understanding Arabic Sentences, Cairo UniversityW. Wright 1967: A Grammar of the Arabic Language, Third Edition, Cambridge, England