Datenanalyse immer leistungsfähiger

Big, bigger, Big Data

3. Big Data-Seen

Ursprünglich war Voraussetzung jeder Datenanalyse, dass die verwendeten Daten vereinheitlicht werden, bevor man sie in die Datenbank schüttet. Sogenannte Datenseen stellen dieses Prinzip jetzt auf den Kopf, sagt Chris Curran, Chief Technologist in der US-Beratungssparte von PricewaterhouseCoopers. "Datenseen anzulegen bedeutet, Informationen wie sie sind in ein großes Hadoop-Framework kippen, ohne sie vorher zu vereinheitlichen oder irgendwie anzupassen." Stattdessen werden den Nutzern Werkzeuge zur Analyse dieser Daten zur Verfügung gestellt, zusammen mit einer differenzierten Beschreibung der Daten. Auf diese Weise lassen sich schnell großen Datenbestände aufbauen. Das ist der Vorteil. Der Nachteil: Die Nutzer müssen sich sehr gut auskennen beziehungsweise sehr gut ausgebildet sein.

4. Qualität der Analysen wird immer besser

Im Mittelpunkt (fast) aller Big Data-Strategien stehen der Mensch und seine Wünsche.
Im Mittelpunkt (fast) aller Big Data-Strategien stehen der Mensch und seine Wünsche.
Foto: alphaspirit, Fotolia.com

Big Data bedeutet nicht nur, dass Unternehmensstrategen viel mehr Informationen zur Verfügung haben als früher, sie haben auch deutlich mehr Rechenleistung, um daraus nützliche Schlüsse ziehen zu können. Das führt dazu, dass erstens mehr Analysen und zweitens Analysen mit viel mehr Attributen als früher möglich sind. Die Aussagekraft und Verlässlichkeit der Ergebnisse wird dadurch deutlich größer.

Nach Ansicht von Forrester-Analyst Brian Hopkins verändern sich zudem die Ausgangsfragestellungen einer Datenanalyse, wenn Rechenleistung und Rechenzeit keine oder fast keine Rolle mehr spielen.

5. SQL öffnet Hadoop fürs Business

Fähige Programmierer und Mathematiker können mit Hilfe von Hadoop so ziemlich alles analysieren. "Das ist ein großes Versprechen. Und zugleich ein Problem", sagt Gartner-Analyst Mark Beyer. Denn solche Analysen bedienen sich dann nicht unbedingt einer Sprache, die andere Business-User verstehen. "An dieser Stelle kommt SQL für Hadoop ins Spiel", so Beyer. Es öffne das Framework für Businessanwendungen weil es Anwendern erlaube, Anfragen an das System in einer Form zu stellen, die ihnen vertraut ist.