Post on 05-Apr-2015
transcript
Morphologiesystem MORPHYhttp://www.uni-psycho.uni-padeborn.de/lezius/titel.html
• Für Deutsche Sprache:– morphologische Analyse
– statistische PoS-Tagger
– context-sensitive Lemmatizer
• Der System kann auch für Deutsch lernen benutzt werden.
• Platform: Windows95/NT• die nicht ASCII-Zeichen werden nicht unterstüzt
Morphologiesystem MORPHYLexikon
• Stammlexikon• Der Lexikon ist in kleinere Lexika unterteilt, die
jeweils eine Wortklasse umfasst.• Jede Wortklasse besitzt eine eigene Datenstruktur,
die alle Informationen zur Generierung enthält.• Für hochfrequente Wörter ist zusätzlich ein
kleines Vollformenlexikon eingerichtet.
Morphologiesystem MORPHYWortklassen (I)
• Substantive:– 62 mögliche Deklinationsklassen (in einer Tabelle gespeichert)– Die folgende Informationen zu einem Stamm gespeichert werden:
• Deklinationklassen (enthält Genus).
• erste von rechts vorkommende – “ß” durch “ss”– umlautbare Vokal durch seinem Umlaut
ersetzt• Adjektive:
– Deklinationsklasse (hier legt das Deklinationmuster fest)– best./unbest./ ohne Artikel– Komparativ / Superlativ
Morphologiesystem MORPHYWortklassen (II)
• Schwache Verben:– Konjugationsklasse
• Nicht-schwache Verben– die 7 markante Formen wird gespeichert.
• Eigennammen– Genitiv
– Genus
– mit/ohne Artikel
• Für die übrigen Wortklassen (Partikel, Interjektionen) die morphologische Bedeutung wird von Hand eingegeben