Enterprise Content Management, Teil 2

ECM: Die Komponenten im Überblick

Capture – Vollautomatische Erfassung

Neben manueller und halbautomatischer Erfassung lassen sich Daten auch vollautomatisch - direkt aus Anwendungsprogrammen heraus - generieren. Beispielsweise kann ein ERP-System Bestelldaten erzeugen, wenn es den Lagerbestand automatisch über eine Schnittstelle prüft.

Neben ERP-Anwendungen sind auch EDI- und XML-Dokumente eine oft genutzte Datenquelle. Die automatische Übernahme erfolgt in diesen Fällen meist im so genannten COLD-Verfahren – einer besonderen Methode zur vollautomatischen Verarbeitung strukturierter Eingangsdaten. Dabei werden die angelieferten Daten mittels eigener Strukturinformationen und Vorgaben aufbereitet und an die internen Speichersysteme übergeben.

Das Ziel aller Capture-Teilkomponenten ist es, die erfassten Informationen für die Weiterbearbeitung und Archivierung der nachfolgenden Manage-Komponente bereitzustellen. Nach der Erfassung müssen die Daten deshalb um beschreibende Merkmale ergänzt werden, mit denen die Dokumente beispielsweise wieder gefunden werden.

Hierzu werden sie indexiert – also mit Schlagworten versehen -, kategorisiert und eventuell in ein bestimmtes Format überführt. Masken helfen, die Inhalte der Dokumente nach ausgewählten Kriterien wie Eigenschaften oder Schlüsselworte weiter zu verarbeiten. Besonders wichtig für die inhaltliche Suche ist eine Kategorisierung oder automatische Klassifikation der Dokumente nach vorausgewählten Kriterien. Für diesen Zweck werden mittlerweile auch selbstlernende Systeme eingesetzt.