Komplettsysteme für die Datenanalyse

Big Data Appliances haben noch Luft nach oben

Schlüsselfertige Big-Data-Appliances sollen Unternehmen helfen, große Datenmengen zu sammeln und zu analysieren. Doch die Entwicklung steht erst am Anfang.

Dass die meisten Unternehmen mit einem schwer kontrollierbaren Datenwachstum kämpfen, ist heute schon fast eine Binsenweisheit. Vor allem unstrukturierte Informationen wie E-Mails, SMS oder Videos sorgen für einen kontinuierlichen Strom neuer Daten in die Rechenzentren. Dort müssen sie häufig wegen gesetzlicher oder unternehmensinterner Vorschriften archiviert werden, teils werden sie innerhalb kürzerer Fristen für diverse Auswertungen herangezogen. Solche Analysen beziehen sich zunehmend auf zeitnahe Datensammlungen, die zum Beispiel im Bereich der Social Media anfallen. Schlüsselfertige Big-Data-Appliances, bestehend aus vorintegrierten Hardware- und Softwarekomponenten, könnten helfen, solche Aufgaben effizienter zu meistern. Das zumindest versprechen die Hersteller.

IBM spricht von "Smarter Analytics": Big-Data-Appliances sollen den Anwendern viele manuelle Tätigkeiten bei der Datenanalyse abnehmen. In der Praxis gibt es einige Stolpersteine.
IBM spricht von "Smarter Analytics": Big-Data-Appliances sollen den Anwendern viele manuelle Tätigkeiten bei der Datenanalyse abnehmen. In der Praxis gibt es einige Stolpersteine.
Foto: IBM

Ob Schnelligkeit das entscheidende Kriterium bei der Auswertung solcher Informationen ist, hängt vom jeweiligen Anwendungsfall ab. Anbieter von Big-Data-Lösungen und kompletter Big-Data-Appliances heben dies besonders hervor, weil sie sich erst noch gegen die schon länger am Markt befindlichen Data-Warehouse- und Business-Intelligence-Produkte durchsetzen müssen. Der unabhängige Analyst Josh Krischer von Krischer & Associates verweist dagegen darauf, dass man bei Big Data oder Analytics genau unterscheiden müsse. Er geht von vier Datenkategorien aus, die nur zum Teil eine sofortige Auswertung und neue Methoden erfordern:

  1. Analytics (Velocity and Volume): Sehr große Datenmengen, die nur in einigen Fällen wie der Gesichtserkennung an Flughäfen oder bei der Prüfung von Kreditkarten in Real-Time-Geschwindigkeit ausgewertet werden müssen. In der Retail-Branche komme es dagegen nicht auf ein paar Stunden oder Tage an, um über aktuelle Verkaufszahlen Bescheid zu wissen.

  2. Bandwidth (Volume and Velocity): Netz- und Zugriffsdaten, zum Beispiel aus sozialen Netzwerken. Unmittelbare Auswertung und Verwendung seien in der Regel nicht erforderlich.

  3. Content (Volume and Variety): Da es sich meistens um langfristig abgelegte oder archivierte Daten handelt, könne man auf zeitnahe Analytics verzichten.

  4. Machine and Sensoring (Volume and Velocity): Oft handelt es sich um sensible Daten, die zum Beispiel bei Wetter- oder Erdbebenmeldungen eine schnelle Auswertung erforderten um Katastrophen zu verhindern.

SAP HANA treibt den Big-Data-Hype

Für Krischer hängt das gegenwärtige Trendthema Big Data und Big-Data-Appliances vor allem mit den Entscheidungen von SAP in Sachen HANA-/In-Memory-Technologie zusammen. SAP sei wegen der großen installierten Basis seiner Anwendungen mit dem weiteren Absatz an eine Barriere gestoßen, die man jetzt mit einem technologischen Entwicklungsschub aufbrechen möchte: Um alle Neuerungen der SAP-Programme sinnvoll und vor allem performant nutzen zu können, bräuchten die Kunden laut Hersteller zusätzlich noch HANA-Appliances, ausgestattet mit In-Memory-Bausteinen und einer Datenbank.

Auch der Analyst und SAP-Spezialist Helmuth Gümbel spricht von den Geschäftszwängen, die SAP dazu bewogen haben, sich auf das Hardware-Feld zu bewegen. Dabei handele es sich nicht nur um einen reinen Verkaufstrick, sondern die Kunden hätten durchaus die Möglichkeit, die Leistung ihrer etablierten SAP-Software-Landschaft ein Stückchen nach oben zu treiben. Dafür müssten sie allerdings etwas zusätzliches Geld - so wie von SAP beabsichtigt - in die Hand nehmen.

Appliances enthalten laut Gartner viele vorgefertigte Komponenten und Funktionen, die die IT'ler unterstützen sollen.
Appliances enthalten laut Gartner viele vorgefertigte Komponenten und Funktionen, die die IT'ler unterstützen sollen.
Foto: Gartner


SAP hat mit einer Reihe von Hardware-Herstellern Abkommen getroffen, um geeignete Appliances anzufertigen - anders als Konkurrent Oracle hat man keinen Hardware-Produzenten hinzugekauft. Die geeignte Hardware für SAP-Programme ist derzeit erhältlich von Cisco, Dell, Fujitsu, HP, Hitachi, Huawei, IBM, NEC und VCE. Entwickler und Kunden haben laut SAP außerdem die Möglichkeit, über Hosting-, Anwendungsmanagement- und Outsourcing-Dienste HANA-Technologie als Service zu beziehen.
Der Hamburger SAP-Partner Info AG zum Beispiel, der drei eigene Rechenzentren in Deutschland betreibt, ist bereits aktiv in dieses Geschäftsfeld eingestiegen. Auf seiner Webseite heißt es: "HANA steht für "High Performance Analytic Appliance". Die Appliance ist ein Paket aus Hardware und In-Memory-Software und stellt große Mengen operativer Daten aus SAP-Anwendungen direkt im Hauptspeicher für die Auswertung oder zusätzliche Anwendungsfunktionen zur Verfügung." Mit SAP HANA könne man "die gesamte IT-Infrastruktur effizienter gestalten und dabei auch noch die Betriebskosten senken". Besonders zwei Aspekte hebt Info AG hervor: "Der Plattenspeicher wird durch den Hauptspeicher ersetzt - das spart Betriebskosten." Es bestehe ferner eine "konstante Datensicherheit, auch bei Stromausfall".


Auf der Kundenveranstaltung SAPPHIRE in Orlando Mitte Mai 2013 kündigte SAP den Cloud-Einsatz von HANA an. Die Technologie stehe nun in verschiedenen Bereitstellungsoptionen zur Verfügung: On Premise, in der Cloud oder über andere Geschäftsmodelle wie etwa Hosting oder Outsourcing. Die Option "SAP HANA Enterprise Cloud" solle es Unternehmen ermöglichen, das In-Memory-Potenzial "als Service auf vollkommen neue Weise auszuschöpfen". Zu den ersten Partnern auf diesem Sektor gehören Accenture, Deloitte, IBM, itelligence, Savvis and Virtustream. Außerdem gibt es den von Amazon Web Services betriebenen "SAP HANA One Database Service": Er ist über den AWS Marketplace zugänglich und umfasst eine kleinere Version von HANA für produktive und kommerzielle Zwecke.