Große Datenmengen im Griff

Big-Data-Strategie im Unternehmen richtig aufsetzen

IT und Fachbereiche noch nicht auf Big Data ausgerichtet

Um einen Big Data-Ansatz umzusetzen, müssen auf Anwenderseite die IT-Experten des Unternehmens andere Fähigkeiten besitzen als für Systeme, die eine Datenverarbeitung nach heutigen Standards unterstützen. Dabei sind drei Aspekte besonders relevant: die Datenanalyse, die Datenvisualisierung und die technischen Fähigkeiten.

Eine Datenverarbeitungsaufgabe umfasst normalerweise eine Analyse in Form einer Standardabfrage in ausgereiften und nutzerfreundlichen BI-Programmen und eines anschließenden Standardberichts. Für eine Big- Data-Anwendung muss der Analyst zunächst die Datenquellen bestimmen und so aufbereiten, dass sie automatisiert weiterverarbeitet werden können. Der Analyst muss daher Säuberungsregeln, Datenformate und die wichtigsten Kenngrößen unter den vielen Datenquellen im Vorfeld festlegen. Dieser explorative Ansatz unterscheidet sich von dem heute üblichen, standardisierten Vorgehen.

Wichtig: Das Big-Data-Modell unterscheidet sich grundlegend von dem etablierten relationalen Datenmodell.
Wichtig: Das Big-Data-Modell unterscheidet sich grundlegend von dem etablierten relationalen Datenmodell.
Foto: Roland Berger Strategy Consultants

Die Visualisierung spielt hierbei eine besondere Rolle: Berichte helfen heute, Analyseergebnisse in einheitlicher Form an die Entscheider zu kommunizieren. Bei der Entwicklung einer Big-Data-Anwendung greift aber der Analyst nicht auf standardisierte Berichte zurück, sondern nutzt die Visualisierung als Hilfsmittel, um statistische Muster und Verläufe schnell erkennen zu können. Erst im nächsten Schritt kann er dem Kunden durch Standardberichte Fakten präsentieren, die aus verschiedenen Datenquellen zusammengesetzt sind.

Für einen Hadoop-basierten Analyseansatz benötigen die Experten aber gute Kenntnisse des Frameworks selbst sowie angrenzender Technologien (HDFS, HBase, Hive, Mahout). Diese Fähigkeiten sind jedoch nicht nur für die Analyse erforderlich, sondern auch schon im Vorfeld, um die Big-Data-Ansätze zu bewerten. Unternehmen können heute intern nicht auf die entsprechenden Ressourcen zurückgreifen. Denn die notwendigen Technologien wurden nicht von den führenden Datenbankherstellern entwickelt; Unternehmensmitarbeiter kennen sich folglich nicht damit aus. CIOs sollten daher Innovationsimpulse sowohl in ihren IT-Bereich als auch in die Fachbereiche geben.