Was ist eigentlich Datenintegration?

Informationen liegen zu 90 Prozent unstrukturiert vor

Bei den involvierten Datenquellen kann es sich um Standardapplikationen wie zum Beispiel SAP, Oracle oder Peoplesoft handeln, um verschiedene relationale Datenbankformate und Flatfiles aller Art, um Standards wie IBM MQSeries, TIBCO Rendezvous, webMethods, ODBC oder XML, oder um hierarchische und multidimensionale Plattformen, wie verschiedene Mainframe-Systeme, C-ISAM oder Adabas.

Neben solchen Standards existieren aber auch unstrukturierte Daten aus E-Mails, Word-Dokumenten, Präsentationen, Excel-Tabellen oder PDF-Dateien. Schätzungen zufolge machen diese unstrukturierten Daten bis zu 90 Prozent der in einem Unternehmen gespeicherten Informationen aus.

Teilstrukturierte Daten mit Industriestandard-Formaten – etwa EDIFACT im Handel oder SWIFT im Finanzsektor – sind ebenfalls weit verbreitet und dienen in zunehmendem Maße als Basis für automatisierte Geschäftsumgebungen. Eine leistungsfähige Datenintegrationslösung sollte all diese Datentypen unterstützen. Erst wenn diese technische Hürde genommen ist, können multidimensionale Analysen mit den gängigen Werkzeugen zur Business Intelligence durchgeführt werden.