IBM UIMA Innovation Award

Auf dem Weg zur intelligenten Suchmaschine

Ein Computerlinguist der Uni Jena hat den mit 24.000 Dollar dotierten IBM UIMA Innovation Award erhalten. Das Softwarekonzept UIMA ist eine offene Architektur für Analyse und Management großer, unstrukturierter Datenmengen.

UIMA steht für „Unstructured Information Management Architecture“. „Unstrukturiert“ meint hier, dass Computer keinen unmittelbaren Zugang zu den Inhalten von Texten, gesprochener Sprache, Musik, Bildern oder Filmen haben. Mit Hilfe der UIMA-Plattform sollen Rechner in die Lage versetzt werden, solche Inhalte automatisch zu erschließen. Dabei wird angestrebt, einmal erarbeitete Module wieder zu verwenden, anstatt sie für jede Anwendung aufs Neue zu entwerfen und zu programmieren.

„UIMA ist ein innovativer Weg, für komplexe Systeme der Sprachverarbeitung eine übersichtliche Architektur zu definieren, die eine inhaltliche Analyse von Texten erlaubt“, sagt der Preisträger Prof. Dr. Udo Hahn von der Uni Jena.

Das Jenaer System arbeitet anders als herkömmliche Suchmaschinen wie Google. Es fahndet nicht nach starren Zeichenfolgen, sondern kann formal verschiedene, aber inhaltlich gleiche oder stark verwandte Wörter und Aussagen auf ihren gemeinsamen Bedeutungskern reduzieren. Die so aufbereiteten Informationen können vor allem Wissenschaftlern zur zielgerichteten Suche dienen.

Beispielsweise enthält die weltgrößte biomedizinische Literatur-Datenbank etwa 17 Millionen Einträge. Täglich kommen Hunderte von neuen Hinweisen hinzu. Kein Mensch kann die für ihn wichtigen Texte aussuchen und durchsehen. Die Softwareplattform UIMA arbeitet im Hintergrund und soll die Datenflut für den Anwender beherrschbarer machen.

Ein zweiter mit dem Preis bedachter Aspekt ist der Aufbau einer großen computerlinguistischen Softwarebibliothek. Sie deckt den gesamten Analysezyklus bei der automatischen Sprachverarbeitung ab. „Diese Bibliothek ist wie ein großer Schrank mit vielen Schubfächern, wo in jedem dieser Fächer alternative Programme für die Lösung eines Teilproblems bei der Sprachanalyse aufbewahrt werden. Je nach Einsatzzweck ziehen wir die passende Software aus dem Schubfach“, so Hahn. (dsc)

tecCHANNEL Shop und Preisvergleich

Links zum Thema Datenbanktechnologie

Angebot

Bücher von Pearson Education

Bücher zum Thema

eBooks (50 % Preisvorteil)

eBooks zum Thema

Software-Shop

Datenbanken