Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web
Mag. Blumauer Andreas
Semantic Web Companywww.semantic-web.at
www.poolparty.biz
Semantic Web Company GmbH
Gegründet 2001 in Wien
>20 Experts im Bereich semantischer Technologien
Produkt: PoolParty Suite (seit 2009)
Kunden: Globale Konzerne, NPOs, NGOs und GOs
Geschäftsführer, Wirtschaftsinformatiker
Kunden aus ‚wissensintensiven‘ Branchen
• Pearson• Roche• World Bank
• Daimler• Credit Suisse• Wolters Kluwer
• Nintendo• Council of EU• Wood Mackenzie
• Ministry of Finance (AUT)• Education Services (AUS)• Bank of America
Kunden aus der öffentlichen Verwaltung
AT Ministry of Finance - https://www.bmf.gv.at
AT Geological Survey - http://www.geologie.ac.at/
AUS Education Services - http://www.esa.edu.au
AUS Healthdirect - http://www.healthdirect.org.au
NOR Directorate of Immigration - http://www.udi.no/
SUI Swiss Federal Archives - http://www.bar.admin.ch/
UK Centre for Ecology & Hydrology - http://www.ceh.ac.uk
EU European Commission - http://ec.europa.eu/
EU Council of the EU - http://www.consilium.europa.eu
EU European Country of Origin Network – http://ecoi.net
Die Vortragsthemen
Informationsquellen zu bestimmten Rechtsgebieten wie Steuerrecht oder Zollrecht sind üblicher Weise mannigfaltig, kaum vernetzt und aus unterschiedlichsten Stakeholder-Perspektiven verfasst worden. Eine der größten Herausforderungen, denen sich viele juristische Berufe im Zeitalter von 'Big Data'
stellen müssen, ist die gezielte und kontextabhängige Vernetzung unterschiedlichster Informationsbestände entlang eines Entscheidungsprozesses.
Mit Hilfe kontrollierter Vokabulare und juristischer Thesauri, die auf Basis global anerkannter Technologiestandards entwickelt werden, können Fachinformationen gezielt und
automatisiert vernetzt werden. Werden Linked Data Standards wie SKOS ('Simple Knowledge Organization System') eingesetzt, so gelingt darüberhinaus die
organisationsübergreifende und multilinguale Informationsvernetzung auf effizientere Weise als je zuvor.
Zahlreiche Organisationen und ihre Fachvokabulare wie z.B. das Amt für Veröffentlichungen der
Europäischen Union (EuroVoc), das Schweizerische Bundesgericht (Jurivoc) oder das Leibniz-
Informationszentrum Wirtschaft (STW Thesaurus) haben bereits standard-basierte Vokabulare veröffentlicht, die in den nächsten Jahren den Status von Eckpfeilern für ein globales semantisches Web erlangen können.
Der Vortrag stellt die Anforderungen an ein Thesaurus-System des
Bundesministeriums für Finanzen dar, sowie ein Lösungskonzept, das u.a. auf
die Verwendung von offenen Linked Data Standards abzielt.
Warum Fachvokabulare?
Fachvokabulare: Glossare, Taxonomien, Thesauri, Ontologien
Fachvokabulare helfen, den Kontext eines Informationsobjekts genauer zu bestimmen, und damit die Bedeutung eines Begriffs zu determinieren
Die Notwendigkeit von permanent adressierbaren Referenzpunkten in einem babylonischen Sprachengeflecht wird immer offensichtlicher
Was bedeutet Kaffee?
Kaffee
• Stärke• Größe• Milch?• Schokolade?• Preis
Warum vernetzte Fachvokabulare?
VerwaltungsreformSearc
h
bmaskLebensministerium
bmvit BM.I
Standard basierte, vernetzte Fachthesauri
http://vocabulary.wolterskluwer.de/arbeitsrecht/10913
• EuroVoc• Thesaurus
Sozial-Wissenschaften• DBPedia• Standard-Thesaurus
Wirtschaft
50 Mrd.Fakten
Beispiel: Education Services Australia
SKOS-Thesauri in der Verwaltung
Eurovoc (EU)
ESCO (EU)
Jurivoc (SUI)
ScoT (AUS)
Agrovoc (UN)
GEMET (EEA)
GeoThesaurus (AT)
ST Wirtschaft (Leibniz Gesellschaft)
Polythematic SH (CZ)
Canadian SH (Can)
Worldbank Taxonomy (WBG)
Arbeitsrechts-Thesaurus (Wolters Kluwer)
Reegle Thesaurus (REEEP)
Demnächst: Steuerrechts-Thesaurus (AT)
Simple Knowledge Organization System (SKOS)
--- -- ----- -- ------- Umsatzsteuer-------- --- -------- -- Café---- -----
---- ---- ---- ---
--- --Mwst--- ------ --- ------ -- ---- --
---- ----- --- --Gastronomie---- -----
---- ---- ---- --- ------ -------- ----
http://voc.org.com/core/77
MwstaltLabel
Umsatzsteuer prefLabel
Gastronomie
Gastro
http://voc.org.com/core/176
Café
narrower
http://voc.org.com/core/44
Use Cases für SKOS entlang desContent Life Cycles
Fallbeispiel: WM-Werkzeug für das Finanzressort
Verbesserung / Vereinfachung des Annotationsprozesses(“hoher redaktioneller Aufwand notwendig, Schlagworte, Synonyme etc. zu jedem einzelnen Dokument zu vergeben”)
Suche auf Basis der Bedeutung eines Suchbegriffs (“Expertensprache, Umgangsprache, Synonyme, ähnliche Begriffe, …”)
Aufbau und Einsatz von Ressort-spezifischen Fach-Thesauri (Steuerrecht, Zollrecht, …)
Vereinfachung des Annotationsprozesses
Zu den vorgeschlagenen Tags kann Kontextinformation aus dem Wissens-graph angezeigt werden.
Extraktion von Enititäten mit PoolParty
Import von Excel, Word, PDF, CSV, XML, SKOS/RDF; integrierbar mit Oracle, SharePoint, Google, Mindbreeze, FirstSpirit, Drupal, Wordpress, …
FINDOK: Konzept-basierte Suche
Semi-automatische Erstellung von semantischen Fachvokabularen
Österreichischer Steuerrechtsthesaurus - Grundstruktur
Allgemeinbegriffe - Synonymverwaltung
Kontakt
Mag. Andreas BlumauerCEO, Semantic Web Company
+43 1 [email protected]
www.semantic-web.atwww.poolparty.biz
Partner network