Programm – Abstracts

Sprachtechnologische Ressourcen für die propositionale inhaltliche Analyse deutschsprachiger medizinischer Texte
Udo Hahn, Universität Jena

Im Vortrag wird eine Übersicht über den aktuellen Stand der Ressourcenverfügbarkeit für die automatische Analyse von Inhalten in deutschsprachigen medizinischen Texten gegeben. Ich konzentriere mich dabei auf die Analyse von Fakten, Behauptungen und Vermutungen im Sinne der Informationsextraktion und des Text-Minings (summarisch als Propositionen bezeichnet), blende also den Bereich der indikativen Textanalytik, automatische Indexierung und Klassifikation, aus.

Ressourcen werden nach Korpora und Textanalytik-Software unterschieden, medizinische Texte grob nach veröffentlichten Fachtexten (Publikationen) und zugangsbeschränkten klinischen Dokumenten. Diese grundlegenden Unterscheidungen werden in den Kontext aktueller Methodenpräferenzen in der Computerlinguistik (neuere Entwicklungen im Bereich des maschinellen Lernens) und sprachtechnologischer Evaluationsszenarien gestellt.

Der Vortrag wird angesichts der gravierenden Ressourcendefizite für die deutschsprachige medizinische Domäne in dem Aufruf münden, eine nationale Infrastruktur-Initiative zu gründen, die das Ressourcen-Management für die deutsche Medizinsprache zum Gegenstand haben soll. Ihre Zuständigkeit läge in der Behebung identifizierter Abdeckungsdefizite, der Sicherung des (kontrollierten) institutionenübergreifenden Zugangs zu gemeinsam entwickelten Ressourcen und der Synchronisierung zukünftiger Ressourcenentwicklung in wechselseitiger Abstimmung der beteiligten Akteure.

Programm