Große Datenmengen im Griff

Big-Data-Strategie im Unternehmen richtig aufsetzen

Schritt für Schritt zur Big-Data-Strategie

Unabhängig von der heutigen Verfügbarkeit von Out-of-the-Box-Lösungen müssen Unternehmen frühzeitig eine Strategie entwickeln, um ihre Daten sinnvoll zu nutzen. Eine "Data Due Diligence" hilft dabei, die wesentlichen strategischen Fragen zu beantworten.

Eine Checkliste:

  • Welche Herausforderungen soll die Datennutzung lösen?

  • Warum sollen diese Herausforderungen gelöst werden? Wie sieht der Business-Case aus?

  • Welche Daten benötigt das Unternehmen dafür?

  • Welche Daten liegen heute in welchen Systemen vor? Ist der Detailgrad ausreichend?

  • Welche der erforderlichen Daten werden heute noch nicht systematisch erfasst?

Können die fehlenden Daten als Nebenprodukt bestehender Prozesse erzeugt werden? Oder sind neue Erfassungswege dafür erforderlich? Entsprechend lassen sich dann die wichtigsten Eckpunkte einer Infrastrukturstrategie definieren. Diese umfasst mehrere Aspekte:

  • Daten-Infrastruktur/-Architektur: Das Unternehmen muss festlegen, welche Systeme für die jeweiligen Datensätze in Zukunft führend sein werden, wenn dies aktuell noch nicht definiert ist.

  • Software-Infrastruktur: Unternehmen müssen die Mittel für die Datenanalysen festlegen. Normalerweise geht es dabei um etablierte BI-Werkzeuge, die Standard-Reports aus den vorhandenen Daten erstellen können. Im Falle eines Big-Data-Ansatzes besteht diese Software-Infrastruktur aus einer Big-Data-Plattform wie Hadoop, Konnektoren zu den relevanten Datenquellen in der Daten-Architektur sowie Analyse-Tools wie "Hive" für Data Warehousing, "Mahout" für Machine Learning oder "Pig" als interaktive Shell.

  • Technische Infrastruktur: Hier geht es um die technische Infrastruktur für die Umsetzung des Big-Data-Ansatzes. Für das Unternehmen heißt es: eine klassische "Make or Buy"-Entscheidung. Wenn Analysen nur einmalig erfolgen beziehungsweise große Schwankungen im Datenvolumen oder in der Analysenachfrage bestehen, dann lohnt sich eher, auf Cloud-basierte Infrastrukturen zurückzugreifen als in eine eigene Hardware zu investieren. Aufschluss darüber liefert der in der "Data Due Diligence" entwickelte Business Case.

Unternehmen sollten daher zuerst eine umfassende Bestandsaufnahme im Rahmen einer "Data Due Diligence" erstellen. Dabei können sie wirtschaftlich sinnvolle Ansätze identifizieren, die Technologiefrage klären und dann erste Schritte für eine Pilotumsetzung in die Wege leiten. (hal)

Dieser Artikel basiert auf einem Beitrag unserer Schwesterpublikation CIO.