Post on 05-Apr-2015
transcript
PGIntelligence Service
Gezielte Suche im Internet
Lehrstuhl für künstliche Intelligenz
Forschung Praxis
Informationen im Internet
• Suchmaschinen:– Es werden nur Dokumente geliefert, die den
Suchbegriff enthalten. – Die Seiten sind von sehr unterschiedlicher
Qualität. – Vorwissen über zuverlässige Seiten und ihre
Struktur wird nicht ausgenutzt.
Intelligence Service
• Zusammenhänge zwischen Dokumenten:– Firmen wollen ihre Konkurrenz beobachten.– Anleger wollen eine Entwicklung verfolgen.– Bürger wollen wissen, wie es zu einer
Entscheidung in der Politik kam.
• Direkte Fragebeantwortung:– Innerhalb des Dokuments muss die betreffende
Textstelle gefunden werden! Forschungsthema Named Entity Recognition!
16.Wahlperiode, Drucksache, Antrag
Typ
Drs-Nr.
Fraktion
16.Wahlperiode, Drucksache, Antrag
Typ
Person
Drs-Nr.
16.Wahlperiode, 57. Sitzung, 19.10.2006, TOP 5
16/267
16/2790
Direkte Fragebeantwortung
• Der Antrag der FDP zur Entsorgung radioaktiven Abfalls wurde abgelehnt.
• Der Antrag der Grünen zur ergebnisoffenen Standortwahl für Endlagerung radioaktiven Mülls wurde an Ausschüsse verwiesen.
Für diese Antworten braucht man manuell 7 Stunden
PG-Arbeit
• Gezielte Recherche gemäß der Struktur bestimmter Webserver (Suchanfragen)
• Indexierung gemäß bestimmter Entitäten:Themen, Personen, Orte, Firmen...
• Named Entity Recognition:– Einige Dokumente nach Entitäten annotieren,
– maschinell Annotationsregeln lernen– Annotationsregeln anwenden
• Informationen zu den Entitäten zusammenstellen
Ausführliche PG-Vorstellung
Dienstag, 22.05.200710.15 Uhr
Raum 110 GB IV
Fragen an felix.jungermann@udo.edu