Forrester Q&A

5 häufige Fragen zu Big Data

30.04.2015 von Christoph Lixenfeld
Die Analysten von Forrester haben die wichtigsten Antworten zu Big Data zusammengestellt, und Anwälte von Oppenhoff & Partner geben Ratschläge zur Sicherheit.

Grund dafür, dass das Interesse an diesem Thema so stark wächst, ist laut Forrester eine sich wandelnde Einstellung: Unzählige Unternehmen haben aufgehört, Datenanalyse lediglich als neues, noch etwas exotisches Phänomen wahrzunehmen. Stattdessen fragen sie sich, wie sie Big Data konkret und gewinnbringend für ihr Business einsetzen können.

"Aber solche Möglichkeiten auszuloten bedeutet, sich durch einen konfusen Mix ganz unterschiedlicher Technologien zu navigieren, die sich schneller verändern, als irgendjemand erwartet hätte", schreibt Brian Hopkins von Forrester, einer der Autoren des Reports.

Das Papier will deshalb Antworten liefern auf die fünf am häufigsten von Forrester-Klienten gestellten technologischen Fragen im Zusammenhang mit Big Data.
Hier sind sie.

1. Was genau ist gemeint, wenn von Big-Data-Technologien die Rede ist?

Die Menge der auswertbaren Informationen ist in den zurückliegenden drei Jahren exponentiell gestiegen.
Foto: Dreaming Andy - Fotolia.com

Forrester hat die Erfahrung gemacht, dass die meisten im Grunde Hadoop meinen, wenn sie Big Data sagen. Hadoop ist ein Framework für skalierbare, verteilt arbeitende Software. Durch den verwendeten MapReduce-Algorithmus von Google besitzt Hadoop die Fähigkeit, unterschiedlichste Arten von Abfragen und Analysen schnell und parallel durchführen zu können.

Das Framework wird mehr und mehr zu einer preiswerten Standardplattform für solche Prozesse. Hilfreich ist dabei auch die beinahe grenzenlose Konfigurierbarkeit von auf Hadoop basierenden Systemen.

Laut Forrester vergessen viele IT-Verantwortliche aber, dass es noch viele andere Werkzeuge gibt, die dazu dienen, aus Datenmaterial für das Business nutzbare Analysen zu formen, Forrester nennt hier zum Beispiel den Hersteller SAS.

2. Wie reif ist der Anbietermarkt für Big-Data-Technologien?

In den zurückliegenden drei Jahren habe der Markt erheblich an Reife zugenommen. Die Anbieter ließen sich in fünf Gruppen einteilen. Erstens die großen, etablierten Player wie IBM, Oracle, Microsoft und SAP, zweitens Service-Provider wie Accenture, Deloitte oder TCS. Drittens die gesamte Open-Source-Community und mit ihr verbundene Dienstleister wie Hortonworks, MapR, viertens Anbieter von reinen BI- und Analyse-Tools und fünftens kleine wie mittelgroße Integrations- und Infrastrukturanbieter.

Forrest zählt 39 Firmen, die man als Big Data-Anbieter bezeichnen kann, wobei (natürlich) die Dienstleister vor Ort nicht mitgerechnet sind.

3. Wie steigen erfolgreiche, wachsende Unternehmen in das Thema Big Data ein?

36 Prozent der von Forrester befragten globalen IT-Entscheider implementieren entweder bereits eine Big-Data-Lösung, erweitern eine bestehende Implementierung oder haben zumindest die Absicht, im kommenden Jahr eine Big-Data-Lösung einzuführen.

Im Gegensatz zu Befragungen in den Jahren davor war bezüglich dieser Pläne kein genereller Unterschied feststellbar zwischen erfolgreichen und weniger erfolgreichen Unternehmen. In Details der Entscheidungen unterschieden sich diese allerdings durchaus. So haben Firmen, die stark wachsen, in aller Regel höhere Erwartungen an Big Data und sind viel häufiger als weniger erfolgreiche Unternehmen davon überzeugt, dass sie Big-Data-Lösungen ihren Business-Zielen näherbringen werden.

IT-Verantwortlichen fällt es immer schwerer, durch die Möglichkeiten von Big Data noch durchzublicken.
Foto: Sergey Nivens - Fotolia.com

Dazu passt, dass sich erfolgreiche Firmen auch stärker der Grenzen ihrer aktuellen, ohne Big Data funktionierenden Business-IT-Landschaft bewusst sind.

Diese Unterschiede sind nach Ansicht der Autoren des Forrester-Reports ein Beleg dafür, dass es nicht nur vom Investitionsverhalten abhängt, ob Unternehmen mit einer neuen Technologie Erfolg haben. Vielmehr stellt sich der Erfolg dann ein, wenn sich die richtigen Investitionsentscheidungen mit der richtigen Mentalität paaren, also mit der Überzeugung, durch Big Data und BI die Situation des eigenen Unternehmens nachhaltig verbessern zu können.

4. In welcher Beziehung zueinander stehen Big-Data- und Cloud-Technologien?

Das Zusammenwachsen von Big-Data- und Cloud-Lösungen hat bereits 2011 begonnen, und dieser Trend hält bis heute an. Allerdings sollten IT-Verantwortliche beachten, dass mit einem "Cloud-Etikett" auf Big-Data-Lösungen ganz unterschiedliche Dinge gemeint sein können.

Gerade beim Online-Handel versprechen sich viele Unternehmen viel von Big Data.
Foto: vario images, Otto GmbH & Co. KG

Zum Beispiel erstens das Migrieren einer lokalen Hadoop-Plattform in eine Private Cloud. Zweitens das Nutzen einer Public-Cloud-Infrastruktur, um auf ihr Big-Data-Anwendungen laufen zu lassen. Drittens schließlich kann eine Kombination aus Big-Data- und Cloud-Technologie auch darin bestehen, dass Unternehmen Big-Data-as-a-Service nutzen. Microsoft zum Beispiel bietet eine solche Lösung an.

5. Welche Sicherheits- und Compliance-Aspekte sind wichtig?

Viele Unternehmen stellen sich diese Frage. Nach Ansicht von Forrester sollten sich die Verantwortlichen intensiv damit beschäftigen, weil hier eine Menge Fallstricke lauern.

Erster wichtiger Bereich ist die Frage der Zugangsberechtigung zu großen Datensammlungen und den dazugehörigen Auswertungen.

Zweitens spielt natürlich das Thema Datenschutz eine Rolle, wobei sich Forrester dazu nur sehr allgemein äußert. Wenn die regulatorischen und die Datenschutzanforderungen hoch seien, so die Analysten, sollten die IT-Verantwortlichen viel Zeit dafür einplanen, entsprechende Strukturen aufzubauen.

In Deutschland spielt dieser Bereich traditionell eine deutlich größere Rolle, und Datenschutzfragen sind bei Big Data besonders vertrackt.

Marc Hilber: "Daten dürfen nicht grundlos gesammelt werden."
Foto: Oppenhoff & Partner

Nach Ansicht von Marc Hilber, Datenschutzexperte und Anwalt der Kanzlei Oppenhoff & Partner aus Köln, stellt sich zunächst die Frage, ob es sich bei den Informationen, die man auswerten möchte, um personenbezogene Daten handelt.

Das ist öfter der Fall, als IT-Verantwortliche gemeinhin annehmen, weil die Zusammenführung mehrerer, für sich genommen anonymisierter Datenbasen meist Rückschlüsse auf dahinterstehende Personen zulassen. "Natürlich kann es ein berechtigtes Interesse von Unternehmen geben, Profile zu erstellen", so Hilber. "Dies darf in Deutschland aber nicht grundlos und in hemmungslosem Umfang geschehen."

Erhebliche Unterschiede beim Datenschutz

Vor Datensammlungen muss der Zweck, der mit dieser Sammlung verfolgt wird, klar definiert sein. "Einfach mal so" auf Vorrat sammeln ist nach EU-Recht nicht zulässig.

Bei solchen Sammlungen zeigen sich die Unterschiede zwischen Europa und den USA am deutlichsten. Marc Hilber: "In den USA gibt es Big-Data-Anwendungen im Recruiting-Bereich, die verschiedene Datenquellen zu einem Kandidaten miteinander verknüpfen, Facebook- und Mail-Account zum Beispiel. So etwas wäre in Deutschland selbst dann unzulässig, wenn der Bewerber dem Verfahren zugestimmt hätte."

Ebenfalls problematisch sind automatisierte Einzelfallentscheidungen: Entscheidungen, die auf Datensammlungen beruhen, dürfen nicht ausschließlich automatisiert erfolgen.

Jürgen Hartung: "Man darf nicht die ganze Technologie infrage stellen."
Foto: Oppenhoff & Partner

Dazu Jürgen Hartung, IT-Rechtler und Kollege von Marc Hilber bei Oppenhoff & Partner: "In diesem Zusammenhang ist auch schon die Frage diskutiert worden, ob es nicht eine Hinterlegungsstelle für jene Algorithmen geben sollte, die bei automatisierten Entscheidungen verwendet werden."

Nicht die ganze Technologie infrage stellen

Davon abgesehen muss sich der Gesetzgeber nach Ansicht von Jürgen Hartung intensiver als bisher mit dem Thema Big Data beschäftigen. Datenschutzbelange dürften nicht dazu führen, "eine ganze Technologie infrage zu stellen. Die europäische Gesetzgebung ist bisher nicht in der Lage, auch die Chancen, die in Big Data liegen, angemessen abzubilden."

Es gibt noch viel zu tun, auch für Unternehmen, wie Forrester Research festgestellt hat: Viele IT-Verantwortliche, die ein Big-Data-Projekt planen und mit denen die Analysten gesprochen haben, äußerten offen ihre Frustration über eine ausufernde Komplexität entsprechender Anwendungen. Diese Komplexität resultiert in erster Linie aus der schieren Menge der dabei eingesetzten Hard- und Softwarekomponenten - von den neu aufzusetzenden Prozessen gar nicht zu reden.

Dennoch - oder gerade deshalb - rät Forrester Unternehmen dazu, die möglichen Gewinne durch einen Big-Data-Einsatz nicht aus den Augen zu verlieren.