1
Vorlesungseinheit „Wörterbücher“
Im Rahmen derVorlesungsveranstaltung
„Informationsaufbereitung“Thomas Schütz,
wiss. Mitarbeiter LS Prof.Kuhlen([email protected])
2
Überblick
Einleitung:Neue Konzepte in dercomputergestützen Lexikographie
Wörterbücher
Lexikographische Grundlagen fürWörterbücher
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Erstellung und Produktion von Wörterbuchartikel– lexikographischer Arbeitsprozess
2
3
Neue Konzepte in der Lexikographiefür Wörterbücher -1
l Langweilig ? – „Es gibt schon alle mögliche Wörterbücher ?“
l Neue Dynamik durch den Einsatz der Computertechnik -insbesondere des Internets - bieten sich neue Chancen undPerspektiven für Wörterbücher.
l Ca. 400 elektronisch Wörterbücher können im Internet gefundenwerden.
4
Neue Konzepte in der Lexikographie -2
l im Mittelpunkt der neuen Diskussionen in der L. stehen diefolgenden grundlegenden Konzepte:– Die Einsatzmöglichkeiten der Auszeichnungssprache
SGML/XML für die lexikographischeInformationsmodellierung (wird ausführlich dargestellt)
– Die Nutzung des Internets als Publikationsmedium fürlexikographische Produkte (im WS 01/02)
– Hypertext/Hypermedia als Organisationsform fürlexikalisches Wissen. (andere VorlesungsEinheit)
l ENFORUM: Nutzungs des Internets nicht nur alsPublikationsmedium, sondern auch als Kommunikationsmedium
3
5
Projekt: „ENFORUM“
l Im Rahmen des ENFORUM-Projektes am Lehrstuhl von Prof.Rainer Kuhlen soll ein Informationsystem aufgebaut werden, das:
– die Inhalte eines enzyklopädischen Wörterbuchs für dieInformationswissenschaft organisiert,
– das Internet nicht nur als Publikationsmedium nutzt, sondernauch ...
– ... als Kommunikationsmedium für eine Diskussion in derinformationswissenschftliche Fachgemeinde. In Diskussionensollen kollaborativ WörterbuchArtikel erarbeitet werden.
l ... WS 01/02.
6
Projekt: „ENFORUM“-Architektur
Benutzungsoberfläche im Web-Client
Diskussions-forenWörterbuch
-db
ABC IW-SystematikAbrechnungs-system
Experten-verwaltung
Lotus Notes -Basis
Wörterbücher Software-Entwicklung
Wissens-management
4
7
Lexikographische Grundlagen fürWörterbücher
Einleitung:Neue Konzepte fürneue Wörterbücher
Wörterbücher
Lexikographische Grundlagen fürWörterbücher
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess
8
Überblick - Lexikographische Grundlagenfür Wörterbücher
LexikographischeGrundlagen fürWörterbücher
Unterscheidungsmerkmalevon Wörterbüchern
Makrostruktur vonWörterbüchern
Mikrostruktur vonWörterbüchern
Was sind Wörterbücher ?
5
9
Was sind Wörterbücher ?
l Eine Wörterbuch ist (allg. Veständnis):
– ein (lexikographisches) Nachschlagewerk mit einemgeordneten Verzeichnis von Wörter mit sprachlichen odersachlichen Informationen.
10
Unterscheidungsmerkmale vonWörterbüchern
– hilfreich für den systematischen Überblick übervorhandene Wörterbücherl Für die Plannung und Konzeption neuer Wörterbücherl Für den systematischen Zugriff auf Wörterbücher (z.B. für
Wörterbuchbenutzende die bestimmte lexikalische Informationensuchen)
6
11
Anerkannte Unterscheidungs-merkmale – „Anzahl der Sprachen“
l Unterscheidungsmerkmale dem Handwörterbuch fürSprach- und Kommunikation (HSK)
Unterscheidungsmerkmal
„Anzahl der Sprachen“für Wörterbücher
monolingual
bilingual
multilingual
HSK-Typologiestufe 1
12
Anerkannte Unterscheidungsmerkmale –„Spezialisierung“
Allgemeine Wörterbücher
Spezial-Wörterbücher
HSK-Typologiestufe 2
Definitions-wörterbücher
EnzyklopädischesWörterbuch
HSK-Typologiestufe 3
Unterscheidungsmerkmale
„Spezialisierung“Wörterbücher
„Der großeBrockhaus“
7
13
Unterscheidungsmerkmale vonSpezialwörterbücher
Spezial-Wörterbücher
Mit bestimmtenInformationstypen
SyntagmatischeWörterbücher
ParadigmatischeWörterbücher
Markierungen
-Orthographische WB-Aussprache WB-etymologische WB
-horizontale Beziehungen von Begriffen-Sprichwörter-Redewendungen
-vertikale Beziehungen vonBegriffen-Synonyme/ Antonyme-Thesauri
-Fremdwörter-Fachsprachen-Sprachstadien
HSK-Typologiestufe 3
14
Problematik vonUnterscheidungsmerkmalen
l Unterscheidungsmerkmale für Wörterbücher, wie sie für diemetalexikographische Fachdiskussion vorgeschlagen werden,orientieren sich ausschließlich an Print-Wörterbücher.
l Beispiel ...
8
15
...Beispiel
x
x
Lang D - E
Spezial;Syntagmatisch
Spezial;paradigmatisch
Markierungen
xxSpezial; Inhalstypen
Allg. Definitionswb
Allg. Enzyklopädisches
xMultisprachig
xEinsprachig
http://dict.leo.org/
Duden RechtS
16
ProblematikUnterscheidungsmerkmale-2
l Vergleich der Übersetzungswörterbücher reichen die Merkmalefür Wörterbücher nicht aus:
l Wir brauchen also neben den inhaltlichenUnterscheidungsmerkmalen noch weitere formaleUnterscheidungsmerkmale.
9
17
Unterscheidungsmerkmale für elektr.Wörterbücher – „Publikationsform“
Unterscheidungsmerkmal
„Publikationsform“Für elektr. Wörterbücher
BuchOffline
-WörterbücherOnline
-Wörterbücher
18
Unterscheidungsmerkmale für elektr.Wörterbücher – „Abschlossenheit“
Unterscheidungsmerkmal
„ Abschlossenheit“für elektr. Wörterbücher
WörterbücherIm Aufbau
AbgeschlosseneWörterbücher
Fehlerbehebung
Schließen vonLemmalücken
Beiträge von Spezialisten
Beliebige BeiträgeZu einem vorgegebenenWörterbuchgegenstand
Wenn das Endprodukt Nicht mehr zur Diskussion
(Besser InKommunikation)
10
19
Unterscheidungsmerkmale für elektr.Wörterbücher „Hypertextualisierung“
Unterscheidungsmerkmal
„ Hypertextualisierung“für elektr. Wörterbücher
Hypertextualisierung mit Informationsaufbereitung
Hypertextualisierung ohne Informationsaufbereitung
Keine Hypertextualisierung
„Browsing“
„StartetEine Suchfunktion“Bsp.:
„nur Suchfunktion“
20
BSP Hypertext ohne IAin http://work.ucsd.edu:5141/cgi-bin/http_webster?method=exact&isindex=hypertext&db=*
11
21
Unterscheidungsmerkmale für elektr.Wörterbücher „Multimedialität“
Unterscheidungsmerkmal
„ Multimedialität“Für elektr. Wörterbücher
Text und Bild
Nur Text
Text, Bild und Ton
Text und Ton
Beispiel: Gestenlexikon:Fachgebärdenlexikon Psychologie(textuelle Begriffserläuterungen + Video mit den zugehörigenGestenvorführungen):http://www.sign-lang.uni-hamburg.de/Projekte/PsychLex.html
22
Unterscheidungsmerkmale für elektr.Wörterbücher „Zugriffsangebote“
Unterscheidungsmerkmal
„ Zugriffsangebote“für elektr. Wörterbücher
mit hypertext-orientiertem Zugriff
mit blätterndem Zugriff
mit hypertext- und retrieval-orientiertem Zugriff
mit retrieval-orientiertem Zugriff
12
23
InformationswissenschaftlicheÜberlegungen zu Merkmalen
l Vielleicht sollte noch der Anbietertyp hinzugenommen werden, dawir grundlegende Unterschiede in Wörterbücher bezüglich diesesWörterbuchtyps feststellen können:
l z.B. Verlage bieten oft 1:1 Übertragungen ihrer Print-Wörterbücherim Internet an (Langenscheid Fremdwörterbuch)
l Z.B. Forschungsgruppen experimentierfreudigerl „Zitierungsfähigkeit“-Aspekt
24
Zwischenfazit–Unterscheidungsmerkmale
Unterscheidungsmerkmalefür Wörterbücher
Anzahl der Sprachen
Spezialisierung
Allg. Wörterbücher
Spezialwörterbücher
Publikationsform
Multimedialität
Abgeschlossenheit
Zugriffsangebote
Anbietertyp
formaleinhaltliche
13
25
Überblick: Makro- und Mikrostrukturvon Wörterbüchern
LexikographischeGrundlagen fürWörterbücher
Unterscheidungsmerkmalevon Wörterbüchern
Makrostruktur vonWörterbüchern
Mikrostruktur vonWörterbüchern
26
Makrostruktur von Wörterbüchern
l Gib an, wie das Wörterbuchverzeichnis aufgebaut ist. „Wie erfolgtder Zugriff auf die WörterbuchArtikel ?“ bzw. „Wie sind dieWörterbuchArtikel angeordnet ?“
l Wir können zwei grundlegende Zugriffstrukturen unterscheiden:– alphabetische Makrostruktur auch semasiologische
Makrostruktur genannt undl Beispiel: http://www.glossar.de/glossar/index.htm
– die systematische Makrostruktur auch onomasiologischeMakrostruktur genannt.l Beispiel:systematische Makrostruktur findet man bei jedem Thesaurus; auch
im WWW: z.B. bei http://www.gbi.de/thesaurus/subthes/bwl/bwl.htm– Bei elektr. Wörterbücher existieren oft Mischformen.
14
27
Mikrostruktur von WörterbuchArtikeln
l gibt Auskunft über die innere Zugriffsstruktur bzw.Ordnungsstruktur von WörterbuchArtikeln.
l Für die Beschreibung der Mikrostruktur gibt es aus derMetalexikographie anerkannte Analysemethoden. ImZentrum dieser Methoden steht die funktional-positionaleSegmentation nach Wiegand.
l Zuerst ein Beispiel è
28
Beispiel eines Wörterbuchartikels ausdem HWDG (Handw.buch der Deut.Geschichte).
Moos, das; es, e1. kleine, in großer, dicht stehender Menge,
vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.<o. Pl.> umg. Geld (1): da muß doch eineMasse M. herausspringen.
2.
15
29
Beispiel eines Wörterbuchartikels ausdem HWDG (Handw.buch der Deut.Gesch.
Moos, das; es, e1. kleine, in großer, dicht stehender Menge,
vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.
/o. Pl./ umg. Geld (1): da muß doch eineMasse M. herausspringen.
2.
ErläuterungenLemma Grammatische
Angaben
30
Funktional-positionale Segmentation-1
l Diese Methode unterscheidet die folgenden Segmententeaus den ein WörterbuchArtikel besteht kann:– Angaben (z.B. Angaben über die Bedeutung,
etymologische Angaben, Verweise, grammatischeAngaben )
– Strukturanzeiger:l typographische (Schriftart, -größe) undl nichttypographische (Komma, Klammern) Strukturanzeiger, die
dem Benutzer den besseren Zugriff auf die gesuchtenInformationen dienen
16
31
Funktional-positionale Segmentation-2
l Analyse bzw. zur Beschreibung der Mikrostruktur einesWörterbuches werden nur die Angaben berücksichtigt
l Die Strukturanzeiger lassen sich in gleicherweise in dieseMethode mit einbeziehen (Komplexitätsminderung in derDarstellung)
l Wichtig: Die Mikrostruktur macht nur Aussagen über Angaben undderen Beziehungen.
l Die funktionale positionale Segmentation für dieMikrostruktur erfolgt in zwei Schritten:
32
Funktional-positionale Segmentation–Schritt 1
l Angaben eines Wörterbuchartikels solange in seine Segmentezerlegt bis seine Angabe nur noch eine lexikalische Informationträgt; in diesem Fall spricht man von elementaren Angaben.
l exhaustive funktionale Segmentation der Angabenl Die Beziehungen der einzelnen elementaren Angaben werden mit
partiven Relationen (Teil-Ganzes-Beziehungen) ausgedrückt.l Beispiel:
das; es, e: Grammatische Angaben
das: Artikel
es: Genitiv
e: Deklination
„...besteht aus...“oder „ist Teil von“
17
33
Funktional-positionale Segmentation–Schritt 2
l Analyse der Reihenfolge der einzelnen Angaben, um
l explizite Informationen über Reihenfolge der Angaben zumachen
l Diese Informationen werden als präzedive Relationen(Vorgänger-Nachfolger-Beziehungen) über die einzelnenAngaben) festgehalten
34
WörterbuchArtikel als Baumstruktur
l Das Ergebnis kann nun dargestellt werden als Baumstruktur
l Positionsnummern sollen die Reihenfolge festhalten
„Moos“:WörterbuchArtikel
das: ArtikelPos =1
es: GenusPos=2
e: PluralangabePos=3
Moos: LemmaPos=1
Das; es, e: GrammatikPos=2
Erläuterung1: ErläuterungPos=3
Erläuterung1: ErläuterungPos=4
18
35
WörterbuchArtikel als Baumstruktur -2
Erläuterung1
DefinitionPos=1
kleine, in großer, dicht stehender Menge,vorzugsweise an schattigen, feuchtenStellen wachsende immergrüne, sich durchSporen vermehrende Pflanze;weiches, grünes M; sich im Wald ins M setzen.
Beispiel1Pos=2
Beispiel2Pos=3
36
WörterbuchArtikel als Baumstruktur-3
Erläuterung2
Grammatische A.Pos=1
DefinitionPos=2
Beispiel1Pos=2
<o. Pl.> umg. Geld (1): da muß doch eineMasse M. herausspringen.
19
37
Abstrakte hierarchische Mikrostruktur
l Dieses Ergebnis wird als konkrete hierarchischeMikrostruktur bezeichnet.
l wenn man im letzten Schritt noch von Angaben zuAngabenklassen abstrahiert (in der Lexikographie :Isomorphie ) und erhält man die abstrakte hierarchischeMikrostruktur.
38
Beispiel zur abstraktenhierarchischen Mikrostruktur
WörterbuchArtikel
Artikel Genitiv Pluralangabe
Lemma Grammatik Erläuterung
Grammatik? Definition Beispiel*
20
39
Zwischenfazit
l Mit der funktional-positionale Segmentation lassen sichwesentliche Aussagen über die Mikrostruktur eine Wörterbuchesgewinnen.
l Selbsterklärend: mehrere WbA notwendig für Aussagen über eineabstrakte hierarchische Mikrostruktur
l Wie diese abstrakte hierarchische Mikrostruktur darüber hinausein wesentlichen Beitrag zu einer konsistenteInformationsmodellierung liefert, soll im folgenden Kapitel erläutertwerden.
40
Übung 1: Mikrostrukturanalysemit der funktional-positionalenSegmentation
l Ausgangspunkt: Artikel aus dem WAHRIG Fremdwörterlexikon
In|for|ma|ti|on <f.; -, -en> 1 Auskunft, Nachricht,Aufklärung; Informationen einholen, erhalten; jmdm. eineInformation (über jmdn. od. etwas) geben 2 <Kyb.>Einwirkung eines dynamischen Systems auf einanderes, mit dem es gekoppelt ist, wobei Nachrichtenüber Zustände u. Vorgänge ausgetauscht werden [<lat.informatio „Formung, Bildung durch Unterweisung”]
21
41
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -1
Artikel
In|for|ma|ti|on
<f.; -, -en>
Auskunft, Nachricht,Aufklärung;Informationen einholen, erhalten; jmdm.Eine Information (über jmdn. od. etwas)geben
Einwirkung eines dynamischen Systemsauf einanderes, mit dem es gekoppelt ist,wobei Nachrichten über Zustände u.Vorgänge ausgetauscht werden.
[<lat.informatio „Formung, Bildung durchUnterweisung”]
:Stichwort
:Grammatische Angaben
:Bedeutungs-angaben
:Bedeutungs-angaben
:Herkunfts-angaben
42
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -2
In|for|ma|ti|onIn
for
ma
ti
on
:Silbe
:Silbe
:Silbe
:Silbe
:Silbe
22
43
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -3
<f.; -, -en>
f
-
-en
:Artikel
:Genitiv
:Plural
44
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -4
Auskunft, Nachricht,Aufklärung;Informationen einholen, erhalten; jmdm.eine Information (über jmdn. od. etwas)geben
Auskunft, Nachricht,Aufklärung;
Informationen einholen, erhalten;
jmdm. Eine Information (über jmdn. od.etwas) geben
:Beispiel
:Beispiel
:Defintion
23
45
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -5
<Kyb.>
Einwirkung eines dynamischen Systemsauf einanderes, mit dem es gekoppelt ist,wobei Nachrichten über Zustände u.Vorgänge ausgetauscht werden.
<Kyb.> Einwirkung eines dynamischen Systems aufeinanderes, mit dem es gekoppelt ist, wobeiNachrichten über Zustände u. Vorgängeausgetauscht werden.
:Fachdisziplinangabe
:Defintion
46
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -5
l Informationen über Reihenfolge über die Anordnungwurde festhalten
l Die konkrete hierachische Mikrostruktur ergibt ausallen (grünen) funktionalen Segmenten.
24
47
Übung 1: Schritt 1: Exhaustivefunktionale Segmentation: -6
l Die abstakte hierachische Mikrostruktur ergibt ausallen (gelben) funktionalen Segmenten.
:Stichwort
:Grammatische Angaben
:Bedeutungs-Angaben +
:Herkunkfts -Angaben ?
Artikel
:Silbe +
:Genitiv
:Plural
:Artikel
:Beispiel*
:Defintion
:Fachdisziplin
:Herkunkftssprache*
:Herkunkftsangabe
48
Zusammenfassung – Ausblick aufSGML
- Informationsproblem: Suche nach einer annerkannte/ allg. gültigen Information, dieer hofft in einem Wörterbuch zu finden.
- Zugriff auf ein bestimmtes Wörterbuch viaUnterscheidungsmerkmalen
- Zugriff via Makrostruktur aufWörterbuchArtikel
- Zugriff via Mikrostruktur auf bestimmteInformationen innerhalb eines WörterbuchArtikels
25
49
Zusammenfassung – Ausblick aufSGML -2
l Eine konstistente Struktur eines Wörterbuchs dient dem Benutzerzum schnellen Zugriff auf bestimmte Informationen in einemWörterbuch. Selbstverständlich hat der Benutzer keine formaleabstrakte Makrostruktur im Kopf; aber durch die mehrmaligeBenutzung bekommt er eine Vorstellung (auch durchBenutzungshinweise) durch die Makrostruktur, die ihmEffektivitätsvorteile beim Zugriff bringt.
l Damit bestimmte Angaben immer an einer bestimmten Stellestehen, muß der Artikel immer die gleiche Struktur erhalten.
l Der Benutzer eines Wörterbuches verlangt eine konsistenteStruktur, dafür brauchen wir eine Makro- und Mikrostruktur.
50
Anforderungen an eineComputerunterstützung im Aufbauund Erstellung eines Wörterbuches
l Der Anbieter braucht ein System,...
– das bei der Erfassung bzw. beim Schreiben eines Artikels dieStruktur einhalten wird.
– das die Langlebigkeit der Daten garantiert.– das eine flexible Darstellung der Inhalte ermöglicht. (gleicher
Inhalt in unterschiedlichen Publikationsmedium)– das die Speicherung dieser flexiblen Struktur von
WörterbuchArtikel ermöglicht.l è aus diesen Gründen schauen wir uns SGML/XML an.
26
51
Überblick: SGML-konformeAuszeichnung von Wörterbücher
Einleitung:Neue Konzepte fürneue Wörterbücher
Wörterbücher
Lexikographische Grundkenntnissefür Wörterbücher
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess
52
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Einsatz derAuszeichnungssprache SGML/XML fürWörterbücher
Grundgedanke der SGML
GrundlegendeSGML -konformeAuszeichnung
Mögliche Wege zurAuszeichungssprache
27
53
Grundgedanke der SGML
Inhalt (Text, Bilder)
Dokument___________________________
InformationenzurInhaltsstruktur(Bedeutung d. I)
InformationenzurDarstellung(Schriftgröße,-art)
l SGML basiert auf den Grundgedanken der Generic Markup, daß ...
54
Grundgedanke der Auszeichnung
l Die wesentliche Frage nun: Wie können Informationen über dieStruktur in den Text hineincodieren. Mit Hineincodieren ist dieAuszeichnung von Textteilen gemeint.
l Eine Auszeichnungssprache soll nun im wesentlichen Antwortenauf die folgenden Fragen leisten :
– Welche Auszeichnungen sind erlaubt?– Welche Auszeichnungen sind erforderlich?– Wie unterscheidet man Auszeichnung vom Text?– Was bedeutet die Auszeichnung?
28
55
SGML als Metasprache -1
l SGML ist eine Metasprache für Auszeichnungssprachen.l Beispielsweise ist HTML eine Auszeichnungssprache; man kann
auch von einer SGML- Anwendung sprechen.l XML ist wie SGML eine Metasprache, nur wesentlich knapper,
einige sagen auch logisch überzeugender. –Auf jeden Fall kannXML als echte Teilmenge von SGML auf gefasst werden
l SGML und XML legen also nur Rahmenbedingungen fürAuszeichnungssprache fest.
XML
SGML HTML
XHTML
56
SGML als Metasprache -2
l Wir brauchen also eine Auszeichnungssprache für Wörterbücher,die konform ist mit SGML/XML.
29
57
Grundsätzlicher Aufbau eines SGML-konformen Dokuments
Prolog:-XML-Deklination: < ? xml version = "1.0" encoding="UTF-8"?>- DTD (Document Type Definition)<! DOCTYPE wbuch SYSTEM „wb.dtd“>
TEXT
Verarbeitungsinstruktion
58
Grundlegende SGML-konformeAuszeichnung -ELEMENT
l SGML/XML –Konstrukt: ELEMENT
<wb_artikel> <Lemma>hallo</Lemma> <Grammatik> <artikel>der</artikel> <genitiv>der</genitiv> <plural>e</plural> </Grammatik> <Erlaeuterung> <plural_plus> o.Plu</plural_plus> <beispiel>zum Beispiel</beispiel> <beispiel>zum Beispiel2</beispiel> </Erlaeuterung></wb_artikel>
30
59
DTD
< ? xml version = "1.0"?><!DOCTYPE wb_artikel [<!ELEMENT wb_artikel (Lemma, Grammatik,Erläuterung+) ><!ELEMENT Lemma (# PCDATA) ><!ELEMENT Grammatik (artikel , genitiv, plural) ><!ELEMENT artikel (# PCDATA) ><!ELEMENT genitiv (# PCDATA) ><!ELEMENT plural (# PCDATA) ><!ELEMENT Erläuterung (plural_plus, beispiel) ><!ELEMENT plural_plus (# PCDATA) ><!ELEMENT beispiel (# PCDATA) >]>
lDTD kann man nun festlegen, welche Elemente innerhalb einesTextes benutzt werden können und welche Beziehungen entstehendürfen.
60
Grundlegende SGML -konformeAuszeichnung –Relationen
l Auch die Teil/Ganzes- und Vorgänger-Nachfolger Beziehungenlassen sich einfach entnehmen
<wb_artikel> <Lemma>hallo</Lemma> <Grammatik> <artikel>der</artikel> <genitiv>der</genitiv> <plural>e</plural> </Grammatik> <Erlaeuterung> <plural_plus> o.Plu</plural_plus> <beispiel>zum Beispiel</beispiel> <beispiel>zum Beispiel2</beispiel> </Erlaeuterung></wb_artikel>
31
61
Erstellung eines Dokumentes
l XML-Editor
62
Wege zu einer DTD für Wörterbücher
l Eigenentwicklungl Nutzung/Modifikation der von Text Encoding Initative (TEI)
vorgeschlagenen DTD
32
63
DTD-Eigenentwicklung
l Bedeutet: aus einer abstrakten hierarchischen Mikrostrukturund deren Erweiterungen für die Integration in eineumfassende Wörterbuch-DTD muss eine vollständige DTDentwickelt werden
64
Die DTDs der TEI
l steht für Text Encoding Initiative (http://www.hcu.ox.ac.uk/TEI/)l wurde 1988 als Forschungsprojekt mit Ziel: Richtlinien für die
Auszeichnung verschiedener Texttypen aus demgeisteswissenschaftlichen Bereich zur Verfügung zu stellen
l problemloser Datenaustausch soll gewährleistet werden undLanglebigkeit der Daten
l 1994 erschienen die Guidelines for Electronic Text Encoding undInterchange bekannt als TEI Proposal numer 3
l 1300 Seiten starkes Papier, das die Nutzung dieser modulare DTDerklären sollte.
l Modul auch TEI-DTD (für Printwörterbücher !!!???), hat denAnspruch alle modernen Wörterbücher westlicher Sprachenabzubilden.
33
65
Problematik der TEI-DTDs
l Einblick in die Modularität (Einblicke in die Komplexität zugewinnen)
l TEI –Pizza Bäcker (http://www.tei-c.org/pizza.html
l Die Anwendbarkeit dieser DTD muss selbstverständlich überprüftwerden. In vielen Stellen in der Literatur findet man allerdings denErkenntnis, dass die TEI-DTD für Wörterbücher zu flexibel undkomplex sind.
l Notwendig ist eine Modifikation der TEI-DTDl Modifikation bedeutet letztendlich das der Anwender sich eigene
Gedanken machen und abgleichen mit der TEI-DTD.
66
Prüfung der Anforderungen: Hilfreichfür die Erfassung der WbArtikel
l Editor () – ein flexibles Hilfsmittel für die Erfassung.
34
67
Prüfung der Anforderungen:Langlebigkeit der Daten
l Unabhängigkeit von Beriebssystem und Anwendungsprogramm
l Ist gesichert durch den problemlosen Dokumentaustausch, derdurch systemunabhängige Systemschnittstellen gewährleistet ist.
Anwendung1 Anwendung 2
XML-Dokument
XML-Parser
Ähnlich derMikrostruktur
68
Prüfung der Anforderungen:Speicherung flexibler Datenstrukturen
l Die Anwendung liest die Baumstruktur ein
l und transformiert diese für eine Datenbank.
Anwendung 2
XML-Dokument
XML-Parser
Ähnlich derMikrostruktur
XML-Datenbanken
35
69
Prüfung der Anforderungen: FlexiblePräsentationsformen
l Verschiedene Anwendungsprogramme für die Aufbereitung derWörterbuchInhalte können auf den gleichen Datenbestandzugreifen und die Inhaltsstruktur unterschiedlich interprtieren.
SGML-Document
Satzprogrammfür
Bücher
Satzprogrammfür
CD-ROM
Satzprogrammfür
das Web
Neue Präsentation WAP ?
70
Prüfung der Anforderungen: FlexibleAuswertungsmöglichkeiten
l Für neue Fragestellungen: z.B „gib alle WbA deren Lemma aufSubstantive aus dem 1. Jahrhundert, die .“, können mit SGML-konformen Dokument erfüllt werden:
Artikel
:Herkunkfts -Angaben ?
:Herkunkftssprache*
:HerkunkftsWortangaben
[<lat.informatio „Formung, Bildung durchUnterweisung”, 1.Jhd]
:Wortart
:Übersetzung
:Herk_Zeitangabe
36
71
Beispiel-Artikel
In|for|ma|ti|on <f.; -, -en> 1 Auskunft, Nachricht,Aufklärung; Informationen einholen, erhalten; jmdm. eineInformation (über jmdn. od. etwas) geben 2 <Kyb.>Einwirkung eines dynamischen Systems auf einanderes, mit dem es gekoppelt ist, wobei Nachrichtenüber Zustände u. Vorgänge ausgetauscht werden [<lat.informatio „Formung, Bildung durch Unterweisung”]
72
Zwischenfazit
l Der immense Arbeitsaufwand war aus meinen Ausführungen kaumzu entnehmen.
l TEI-DTD wahrscheinlich kaum nutzbar; auch andere freiverfügbare DTDs () versprechen keine schnelle Hilfe und müssenauf ihre Anwendbarkeit überprüft werden.
l Auch die vielen Problembereiche wurden nicht angesprochen.– Eine großer Problematik in der Entwicklung einer DTD, die
unabhängig vom Publikationsmedium sein, soll scheint dieinterne Verlinkung zu sein. Für die elektronische Präsentationist ein Hyperlink adäquat; für die Print-Version muss einnormaler textueller Verweis auf ein andres Lemma erscheinen.l Beispiel im Langenscheid Fremdwörterbuch scheinen diese Problematik nicht gelöst
zu sein.
– Auflösung von Verdichtungen
37
73
Zwischenfazit -2
l Auch wenn der Weg zu einer SGML-konformen DTDarbeitswendig ist, führt kein Weg für Wörterbuch-Anbieter vorbei:
l SGML/XML ist der einzige Weg, der– oben genannten Anforderungen erfülltgarantiert.
74
Überblick
Einleitung:Neue Konzepte fürneue Wörterbücher
Wörterbücher
Lexikographische Grundlagen fürWörterbücher
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess
38
75
Erstellung und Produktion vonWörterbuchartikel – lexikographischerArbeitsprozess
Einsatz derAuszeichnungssprache SGML/XML fürWörterbücher
1. Materialsammlung
2. Materialauswertung:Dokumentenanalyse undInformationsstrukturmodellierung
3. Schreiben derWörterbuchArtikel –Redaktionelle Erarbeitungund Bearbeitung derWörterbuchartikel
4. Publizieren desWörterbuches
76
1. Materialsammlung
Belegsammlung(Lexikographie: Quellenkorpus
Text, (am besten:SGML-konform)
Sound
Video externe-DB
39
77
2. Materialauswertung:Dokumentenanalyse undInformationsstrukturmodellierung
l Ganz im Sinne werden einige Dokumente ausgewählt, anhand der dieober dargestellten Mikrostrukturanalyse und der Transformation zu einerSGML/XML-DTD erfolgt.
Informationsstruktur-Modellierung (DTD-Entwicklung)
Beleg-sammlungDokumenten-
anayse
78
3. Redaktionelle Erarbeitung
l konkrete Erarbeitung der Wörterbuchartikell dazu wird ein Redaktionssystem benötigt, das den Zugriff auf die DTD
ermöglicht und die „Schablone“ mit Inhalten (WörterbuchArtikel) füllt.
Informationsstruktur-Modellierung (DTD-Entwicklung)
Beleg-sammlung
SGML-konforme Inhalte (-Instanzen)
Redaktionssystem
1.2.
Informationsbasis
40
79
Redaktionelle Erarbeitung-Redaktionssystem
l software-technisch kann das ein handelsüblicher SGML/XML–Editor sein. Allerdings das ein ausgebautesRedaktionswerkzeug, wesentlich mehr können bzw.besitzen muss:
l - Schnittstelle zur Belegsammlungl - Import von Fremdtexten (Word-Datei)l - SGML-gestützte Suchfunktionl - Versionsmanagement von Wörterbüchernl - Unterstützung von Verknüpfungenl - Generierung von Verzeichnissen - Schnittstelle zu einem Workflow –Management ( bspw.
für Qualitätssicherungsmaßnahmen, verteilte Informationen)
80
4.Publizieren des Wörterbuches
l Informationsbasis für unterschiedliche Publikationsarten
Informationsstruktur-Modellierung (DTD-Entwicklung)
SGML-konforme Inhalte (-Instanzen)
Informationsbasis
Buch CD-ROM WWW
41
81
Ausblick
Einleitung:Neue Konzepte fürneue Wörterbücher
Wörterbücher
Untersuchungsgegenstand„Wörterbücher“
Einsatz der Auszeichnungssprache SGML/XML für Wörterbücher
Erstellung und Produktion von Wörterbuchartikel – lexikographischer Arbeitsprozess
82
Ausblick-2
l WS 01/02 Vorlesungsveranstaltung „elektronische Wörterbücher“
42
83
Literatur
l zu Unterscheidungsmerkmalen und Typologie von Wörterbücher:Hausmann, Franz Josef: „Wörterbuchtypologie“ ; in: Steger, Hugo;Wiegand, Herbert Ernst: Handbuch der Sprach- undKommunikationswissenschaft; Teilband 1; 1989.
l Angelika Storrer und Katrin Freese: “Wörterbücher im Internet“;erschienen in: Deutsche Sprache 2/1996, S. 97-153; online:http://www.ids-mannheim.de/grammis/orbis/wb/wbfram1.html
l Zur Makro- und Mirkostruktur von Wörterbücher: Wiegand, Herbert Ernst,S. 371-501; in: Handbücher zur Sprach- undKommunikationswissenschaft / mitbegr. von Gerold Ungeheuer. Hrsg.von Hugo Steger u. Wiegand, Herbert Ernst, Teilband 1; 1989.
l Zur Makro- und Mirkostruktur: Bergenholtz, Henning; Tarp, Sven;Wiegand. H.E: Datendistributionsstrukturen, Makro- und Mikrostrukturenin neuen Fachwörterbücher; in:Hoffmann, Lothar: Fachsprachen : eininternationales Handbuch zur Fachsprachenforschung; Teilband 2, 1999.
84
Literatur -2
l s. zu SGML/XML: Lobin, Henning:Informationsmodellierung inXML und SGML; 2000.
l Zum lexikographischen Arbeitsprozess: Schmidt, Ingrid; Müller,Carolin: Entwicklung eines lexikographischen Modells: Ein neuerAnsatz; in: Lemberg, I.: s.u.
l Zur Einführung der in die neuen Grundkonzept imlexikographischen Arbeitsprozess: Lemberg, Ingrid: Chancen undPerspektiven computergestützer Lexikographie, 2001. (erscheintim Juni 01; Manuscipt im Arbeitsordner).