Enterprise Content Management, Teil 1

ECM: Informationsflut im Unternehmen im Griff

Formen von Content

Was ist mit Content im CM- und insbesondere im ECM-Umfeld genau gemeint? Allgemein gesagt ist Content alles, was sich an inhaltlicher Information in IT-Systemen speichern lässt: Texte, Tabellen, Datenbanken, Bilder oder Filme. Sie können als Dateien vorliegen oder als zusammenhängende Dateisysteme wie Webseiten oder in strukturierter Form als Datenbanken.

Anders als der geschlossene Begriff des „Dokuments“ – in dem auch Layout und andere Daten enthalten sind – ist mit Content aber, wie oben erwähnt, der reine Inhalt gemeint. Getrennt von diesem werden Strukturinformationen, Metadaten und das Layout verwaltet. So lässt sich der Inhalt in unterschiedlichen Medien für unterschiedliche Zwecke nutzen.

Formal unterscheidet man zwischen unstrukturiertem, schwach strukturiertem und strukturiertem Content. Strukturierter Content entstammt in der Regel datenbankgestützten Systemen und wird in einem standardisierten Layout bereit gestellt. Ein Beispiel sind Kundendaten, die direkt in einem Datenbank-System abgelegt werden können.

Schwach strukturierter Content sind Informationen wie Textverarbeitungsdateien oder E-Mails, die zwar ein Layout und Metadaten mit sich tragen, jedoch nicht standardisiert sind. Unstrukturierter Content schließlich sind alle restlichen Informationsobjekte, die Inhalt, Layout und Metadaten nicht trennen und deren Inhalt nicht direkt erschlossen werden kann. Beispiele dafür sind Bilder, Videos und Tonaufnahmen.