EMC World 2011

EMC setzt auf die hybride Cloud

Trotz Sicherheitsbedenken setzt der Storage-Anbieter EMC weiterhin auf die Cloud. Neue Produkte und Analysetechniken sollen die Datenmengen in Zaum halten.

Zum Auftakt der Hausmesse EMC World 2011 haben CEO Joe Tucci und CTO Pat Gelsinger deutlich gemacht, dass das Unternehmen auch in Zukunft am Ausbau von Cloud-Infrastrukturen teilhaben will. Insbesondere hybride Clouds, also der Mix aus der im eigenen Rechenzentrum und der vom Dienstleister betriebenen Cloud-Technik, werden laut Tucci weite Verbreitung finden.

Auf dem Weg zur allgegenwärtigen Cloud werden die gespeicherten Datenmengen laut einer von Tucci zitierten IDC-Studie immens ansteigen. Insbesondere die Menge unstrukturierter Daten soll explodieren: Knapp 70 Exabyte sollen es im Jahr 2014 sein. Im Gegensatz dazu sollen nur zirka 10 Exabyte an strukturierten Daten anfallen. EMC spricht in diesem Zusammenhang von Big Data und meint damit schwierig handhabbare Files. Diese fielen typischerweise beim Produzieren von 3D-Kinofilmen an oder beim Analysieren von Genmaterial. Laut Tucci und Gelsinger findet sich inzwischen aber auch in zahlreichen Storagesystemen von kleineren und mittleren Unternehme Big Storage. Und zwar immer dann, wenn die Menge an unstrukturierten Daten anschwillt und die Übersicht über die Bestände verloren geht.

Keine Zweifel an der Cloud: EMC-Boss Joe Tucci setzt weiterhin voll auf die Cloud, auch wenn Technik und Sicherheit nicht immer einwandfrei sind.
Keine Zweifel an der Cloud: EMC-Boss Joe Tucci setzt weiterhin voll auf die Cloud, auch wenn Technik und Sicherheit nicht immer einwandfrei sind.
Foto: Uli Ries

Damit Unternehmen dieser Flut an Daten Herr werden und den eigentlichen Wert der Dateien ausschöpfen können, will EMC ihnen eine leistungsfähige Analyselösung zur Seite stellen: Die kürzlich zugekaufte Datenbank Greenplum – optimiert auf das parallele Verarbeiten von Informationen – beherrscht jetzt auch unstrukturierte Daten und ist somit eine wichtige Säule von EMCs Big-Data-Strategie. Möglich wird der Umgang mit den unstrukturierten Daten durch die Integration von Apache Hadoop. Die Open-Source-Lösung skaliert sehr gut, ist optimiert auf paralleles Verarbeiten und wird beispielsweise von Facebook, IBM und Yahoo genutzt.

Demonstrierte Leistung: CTO Pat Gelsinger zeigte während der EMC World 2011 unter anderem, wie leistungsfähig die Greenplum-Hadoop-Appliance in der Praxis ist.
Demonstrierte Leistung: CTO Pat Gelsinger zeigte während der EMC World 2011 unter anderem, wie leistungsfähig die Greenplum-Hadoop-Appliance in der Praxis ist.
Foto: Uli Ries

Wie leistungsfähig Hadoop auf der entsprechend gut ausgestatteten Hardware „Greenplum HD Data Computing Appliance“ funktioniert (mehr als 300 CPU-Kerne und über 1 Terabyte Arbeitsspeicher), demonstrierte Gelsinger. Er ließ mehrere Milliarden Kundendatensätze durchsuchen, um einen bestimmten Kundenkreis für ein Mailing zusammen zu stellen. Der vollständige Suchvorgang war nach 34 Sekunden beendet. Referenzkunde T-Mobile hat nach Auskunft von EMC dank Greenplum erstmals analysieren können, woher die Unzufriedenheit von Kunden kommt. Der Mobilfunkbetreiber hat hierzu verschiedene Datenquellen – unter anderem Informationen der Funkzellen und Meldungen aus dem Call-Center – korreliert und mit der Greenplum-Appliance analyisiert. Das Ergebnis sollen Einblicke im Wert von 100 Millionen US-Dollar gewesen sein.

Neben der Greenplum-Appliance will EMC noch die Greenplum HD Enterprise Edition (enthält eine vollkommen kompatible Interface-Implementierung des Apache-Hadoop-Stacks) sowie die kostenlose Community Edition ins Angebot aufnehmen.