Xerox-Software erkennt Bilder am Inhalt

Forscher am Xerox Research Center haben eine Technologie entwickelt, mit der sich digitale Bilder anhand von Inhalten und Motiv indizieren lassen.

Die Xerox-Software erkennt laut den Entwicklern verschiedene Bildmotive, die anschließend sortiert und so in Dokumenten- und Content-Managementsysteme einfließen können. Zwei Sekunden pro Bild dauert laut Xerox die Erkennung. Die Trefferquote der Software liege je nach Bildkategorie zwischen 80 und 99 Prozent.

Das Indizieren erfolgt in vier Schritten. Im ersten Schritt sucht die Software nach markanten Punkten und Elementen im Bild, so genannten "Keypatches". Diese Schlüsselstellen vergleicht die Software dann mit einem visuellen "Wörterbuch" und erstellt passende Schlagworte. Bei der Aufnahme eines Autos zählt Xerox dazu etwa Räder und Scheinwerfer.

Kategorisierung: Die Xerox-Software sucht markante Punkte im Motiv und vergleicht sie mit dem visuellen Wörterbuch. Quelle: Xerox

Im dritten Schritt analysiert das Programm, wie häufig die einzelnen "Schlagworte" erscheinen. Abschließend erfolgt die Einteilung in Bildkategorien. Die Software soll sich laut Xerox durch ungewöhnliche Blickwinkel oder Komplikationen wie mehreren Kategorien in einem einzelnen Bild nicht täuschen lassen. In frühen Phasen des Projekts sei dies aber sehr wohl der Fall gewesen. Einen Stapel Reifen habe die Software fälschlicherweise als Auto interpretiert. Xerox hat diesen Fehler ausgemerzt, indem für die Analyse weitere Merkmale eines Autos herangezogen werden. In der jetzigen Version dürfte sich die Erkennung wegen fehlenden Attributen wie Scheinwerfer oder Windschutzscheibe nicht mehr auf diese Weise narren lassen.

Derzeit arbeiten die Forscher des Xerox Research Center an einer Vergrößerung des visuellen Wörterbuchs, um die Software zur Marktreife zu bringen. Für die Zukunft planen die Xerox-Forscher, die Kategorisierungstechnologie für Videos nutzbar zu machen. (uba)