Pfad Akt.Nr.: xxxx/xxxxx/xxxx
Analyse Medizinischer Freitexte
Lukas Faulstich , ID GmbH & Co. KGaA
Projekttreffen ByMedConnect | München, 12.03.2010
Übersicht
• Motivation: Einsatzszenarien der medizinischen Informationsextraktion
• Herausforderungen bei der Analyse medizinischer Freitexte
• Lösungen: IE-Tool / Web-Komponenten / ID Logik Word-AddIn
• Zusammenfassung
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 2
Einsatzszenarien der medizinischen Informationsextraktion
Ziel:
• Inhaltliche Erschließung von medizinischen Dokumenten (z.B. Befunden, Arztbriefen)
Anwendungsmöglichkeiten:
• Recherche semantisches Retrieval
• Codierung Erkennung von abrechnungsrelevanten Diagnosen / Prozeduren / Medikationen
• Plausibilisierung Abgleich mit vorhandener Codierung
Arzneimitteltherapiesicherheit
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 3
Herausforderungen bei der inhaltlichen Erschließung
• vielfältige Formulierungsvarianten
• teilweise mangelhafte Textqualität
• Formeln
• negierte Aussagen
• semantische Beziehungen
• irrelevante Informationen (anwendungsabhängig)
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 4
Linguistische Varianz in med. Freitexten
Beispiel: Gastritis
• Synomyme: Magenschleimhautenzündung
• Unterbegriffe: akute G~, chronische G~, Refluxgastritis, Ménétrier(-Syndrom) ...
• Akronyme: DG (diffuse Gastritis)
• Verkürzungen: gastr, gastr.
• Schreibfehler: Gastirtis, Zeichensetzung
• Getrennt- / Zusammenschreibung: Entzündung der Magenschleimhaut
• dt. / lat. Schreibweise: Kolon, Colon
• Groß-/Kleinschreibung: im = IM = Innenmeniskus?
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 5
Lösung: IE-Tool
• linguistische Textaufbereitung
• Verschlagwortung mit Konzepten (Indizes) der Wingert-Nomenklatur
• semantische Repräsentation
• Verknüpfung der semantischen Repräsentation mit ID MACS® – medical semantic network – (MSN)
• Visualisierung
• Beispielapplikationen (Retrieval, Codierung)
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 6
Textaufbereitungs-Pipeline
Un-strukturierter Text
Un-strukturierter Text
GliederungSatz-
segmentierung
Parsen / Floskeln
erkennen
Segment-ierung
Abk.-Exp.
semant.BeziehungenExtraktion Indexierung
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 7
IETool: Visualisierung
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 8
IETool: Codierung von Medikationen
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 9
Arzneimitteltherapiesicherheit: Web-Portal ID PHARMA CHECK®
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 10
Lösung: ID Logik WordAddIn
Medizinische Text-Retrieval-Systeme | Folie 11
Fazit
• Freitextanalyse medizinischer Dokumente verspricht attraktive Anwendungen für Retrieval, Codierung, Plausibilisierung u.a.m.
• heuristische Verfahren sind fehlerbehaftet vollautomatische Anwendungen weniger sinnvoll interaktive Anwendungen vorzuziehen
• ID LOGIK® Terminologieserver bietet verschiedene Dienste zur Informationsextraktion
• Einbindung dieser Dienste z.B. im Word-AddIn
• Web Components bündeln Dienste für bestimmte Anwendungen
Analyse Medizinischer Freitexte | Lukas Faulstich | 12.03.10 | Folie 12
Pfad Akt.Nr.: xxxx/xxxxx/xxxx
Vielen Dank für Ihre Aufmerksamkeit !