Hermann Kroll
Institut für Informationssysteme
Technische Universität Braunschweig
http://www.ifis.cs.tu-bs.de
Narrative
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Bibliotheken sind zentrale Repositorien für eine große Menge und Vielfalt an Wissen
– Bücher, Zeitschriften, Artikel
– Datensätze und Modelle
– Langzeitarchivierung der Werke
• Zentrale Herausforderung
ist der Zugriff auf Wissen
– Discovery-Systeme
– Semantische Suchwerkzeuge
– Vermittlung von Wissen
3
Bibliotheken
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany 4
Warum lieben wir Wikipedia?
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Dokumente lesen und Verlinkungen folgen
– Vielzahl von möglichen Pfaden durch das Wissen
– Überblick ist schwierig
– An welchen Stellen wird über Alan Turing geschrieben?
• Informationen zusammentragen in Wissensbasis
– Entitäten erkennen
– Relevante Informationen bzgl. Entität sammeln
5
Umgang mit Flut an Informationen?
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Dokumente satzweise in Fakten zerlegen
– Linked Open Data
– Natural Language Processing, Entity Recognition
• Fakten repräsentieren Aussagen über oder
Beziehungen zwischen Entitäten
• Fakten in Knowledge Base
speichern
6
Strukturierte Sammlung von Wissen
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Vorschau (Infobox) für Entität
– Entity Summarization (z.B. Popularität)
– strukturiert
• Relevante Dokumente finden
– unstrukturiert
7
Infoboxes für ersten Überblick
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Fakten stammen aus verschiedenen Quellen
• Dürfen Fakten bzgl. einer Entität beliebig kombiniert werden?
• Beispiel:
– Bücher von Alan Turing?
– Bücher über Alan Turing?
8
Kontext der Fakten?
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Aussagen (Properties) über Fakten erlaubt
– Gültigkeit, Referenz oder Einschränkung
• Viele Fakten besitzen keine
zusätzlichen Aussagen
• Frage unbeantwortet:
– Wie dürfen Fakten
kombiniert werden?
9
Fakten mit Referenzen?
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany 11
Aufbau eines Dokuments
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Dokument
Inhaltliche Struktur
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
12
Aufbau eines Dokuments
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Dokument
Fakten
Inhaltliche Struktur
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany 13
Aufbau eines Dokuments
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Dokument
Narrative
Fakten
Inhaltliche Struktur
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Narrativ umfasst Kontext bzw. Handlung
• Narrativ kann aus Teilnarrativen bestehen
• Beispiel: Aspirin hilft gegen Kopfschmerzen
– Gültigkeit abhängig von
• Art der Kopfschmerzen
• Dosierung
• Anwendung auf Mensch
• Wechselwirkung mit anderen Medikamenten
14
Narrative
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Fakten innerhalb eines Narrativs gültig
– Narrative repräsentieren Kontext / Gültigkeitsbereich
• Fakten aus gleichem Kontext können kombiniert
werden
– Kompatible Narrative
– Ähnliche Kontexte mit leichten Variationen
15
Faktengültigkeit
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Fakten verketten aus verschiedenen Quellen
– Folgerungen auf Faktenbasis
• Belegbare Folgerung auf Faktenbasis möglich
– Faktenbasis erweitern, wenn Narrative kompatibel
– Belege anführen
16
Faktengültigkeit
N1 N2 ≅
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Narrative als Index für ähnliche Dokumente
– Nutzer sucht ähnliche Dokumente zu einem
ausgewählten Dokument
– System analysiert gegebenen Narrativ und sucht
nach Dokumenten mit ähnlicher narrativer Struktur
– Was ist eine ähnliche narrative Struktur?
17
Suche mit Narrativen?
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
Kno
wled
ge
Base
Narratives
Do
cum
ent
Do
cum
ent
Structure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
≅ ?
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Narrativ auswählen
– Teile als variabel? markieren
– System ermittelt Dokumente mit
ähnlicher narrative Struktur mit evtl.
Einschränkungen?
• Abstraktion des Narrativs
– Suchspektrum erweitern
18
Suche mit Narrativen?
Knowledge Base
Narratives
Document
DocumentStructure
E1
E2
E2
E3
E1
E3
E2
E4
E1
E7
E7
E8
E8
E9
E2
E3
E4
E5
E6
E8
E8
E9
E2
E3
E4
E5
E6
E9
E4
E5
R1
?
N1 N2 ≈ N3 N4 ≈ ≈
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany
• Vielfalt und Menge an Wissen problematisch
– Kombinationen von Fakten aus unterschiedlichen
Quellen nicht immer gültig
– Fakten besitzen keine allgemeingültige Basis
• Narrative als Werkzeug für
– Folgerungen aus gleichem Kontext / Gültigkeit
– Suche nach ähnlichen Dokumenten?
– Vergleichsbasis von Dokumenten und Fakten?
19
Narrative als Werkzeug
Hermann Kroll – Institut für Informationssysteme – TU Braunschweig, Germany 20
Vielen Dank!