Vergleich von Leistung, Kapazität und Kosten

Ratgeber - SSDs und Festplatten richtig kombinieren

24.11.2014 von Scott Harlin
Die Verwendung von HDDs und SSDs im Rechenzentrum muss nicht immer eine Entweder-oder-Entscheidung sein. Eine Koexistenz kann sogar für eine optimale Balance aus Leistung, Kapazität und Kosteneffizienz sorgen. Wie das in der Praxis gelingt, erfahren Sie in diesem Beitrag.

Seitdem die meisten von uns entweder privat oder geschäftlich Computer und Computernetzwerke nutzen, sind wir mit der Speicherung von Informationen auf traditionellen Festplatten (HDDs) vertraut. Ja, diese antiquierten Speichergeräte mit sich drehenden Platten, eingeführt Mitte der 1950er-Jahre, werden immer noch dominierend als Sekundärspeicher in Rechenzentren eingesetzt.

Diese Vormachtstellung fordern aber die Flash-basierten NAND-Speicher (SSDs) zunehmend heraus. Denn SSDs haben in den vergangenen paar Jahren erhebliche Fortschritte gemacht und liefern deutlich schnellere Daten-I/O-Zugriffe und eine beschleunigte Server-Anwendungs-Performance, was die Investitionskosten CAPEX, die Betriebskosten OPEX und die Gesamtbetriebskosten TCO in den Unternehmen reduziert hat.

Die Verwendung von HDDs und SSDs im Rechenzentrum muss nicht immer eine "Entweder-oder"-Entscheidung sein. Eine Koexistenz kann sogar für eine optimale Balance aus Leistung, Kapazität und Kosteneffizienz sorgen, vor allem für jene weit verbreiteten Enterprise-Anwendungen wie hierarchisches Speichermanagement "Tiered Storage" und Virtualisierung.

Der Hybrid-Ansatz vereint die Performance-Vorteile von SSDs mit den kosteneffizienten Kapazitätsvorteilen der HDDs.

Grenzen der HDDs im Enterprise-Umfeld

Basierend auf ihrem mechanischen Innenleben, haben HDDs sowohl mit Performance als auch mit physikalischen Einschränkungen zu kämpfen, die verhindern, dass sie mit den wachsenden Server-Workloads Schritt halten können.

Während Basic-Server bereits Millionen von Input/Output-Operationen pro Sekunde (IOPS) bearbeiten können, liefert eine traditionelle HDD typischerweise eine Leistung zwischen 200 und 350 IOPS. Für jede Anfrage, bei der Daten von einem anderen Ort auf der Festplatte benötigt werden, muss sich der mechanische Kopf der Festplatte bewegen, was sich allein durch die physikalische Beschaffenheit auf die Lesegeschwindigkeit für zufällige Daten auswirkt.

Antwortzeiten: SSDs schneiden wesentlich besser ab als HDDs.
Foto: OCZ

HDDs sind für einfache Datenströme konzipiert, die sequentielle Lese-und Schreibvorgänge beinhalten, die physisch auf der gleichen Spur abgelegt werden. Da moderne Betriebssysteme immer mehr komplexe und multiple Daten beinhalten, kommen auch immer mehr Random-Lese-und -Schreibvorgänge vor, sodass HDDs mit den wachsenden Server-Workloads einfach nicht mehr Schritt halten können.

Obwohl HDDs eine niedrige I/O-Leistung haben und physikalisch bedingt anfälliger für Fehler sind, liegt ihr Nutzen für Unternehmen in der großen Speicherkapazität, basierend auf grundlegenden Terabyte-Konfigurationen, die weit über den typischen Kapazitäten von SSD-Flash liegen.

Performance jenseits der Disk

NAND-Flash-Zellen in einer SSD sind im Vergleich zu herkömmlichen Festplatten viel dichter, und es werden keine rotierenden Scheiben oder magnetischen Köpfe für die Suche von bestimmten Orten verwendet, um auf die Daten zuzugreifen oder sie zu verarbeiten.

Der Controller hat die erforderlichen Datenstandorte bereits zur Verfügung, was zu kürzeren Lese- und Schreibzugriffszeiten führt und keine beweglichen Teile beinhaltet, die kaputt gehen oder für Fehlfunktionen sorgen könnten, und somit mühelos einen I/O- Zugriff auf zufällige Daten mit geringer Latenz begünstigt.

Tatsächlich kann eine einzelne Flash-basierte SSD so viele Random-IOPS liefern wie vergleichsweise ein großes SAN-Array mit Tausenden von HDDs. Mit einem Flash-Translation-Layer (FTL) erscheint der SSD-Flash-Speicher für das Betriebssystem als Laufwerk, was eine schnelle und einfache Integration ins Enterprise-Umfeld ermöglicht, insbesondere im Rahmen vorhandener HDD-Implementierungen.

Maximale Bandbreite - Vergleich von HDDs und SSDs
Vergleich des Energieverbrauchs bei Client- und Unternehmensapplikationen
Vergleich der Antwortzeiten
Vergleich des IOPS-Durchsatzes
Vergleich der Abschlusszeiten bei Datawarehouse-Abfragen

SSDs sind als HDD-Ersatz im Rechenzentrum selbst dann wirksam, wenn die Anwendung nur noch 50 Prozent des tatsächlichen Speichers zur Unterstützung des bestehenden SAN benötigt. Wird die Hälfte der Festplatten mit vergleichsweise performanten SSDs ersetzt, reduziert dies nicht nur den Platzbedarf bei geringeren Investitionen, sondern auch die SAN-Leistung wird zusätzlich noch dramatisch verbessert. Dieser hybride Ansatz ist für jene IT-Manager sehr interessant, die ein Gleichgewicht aus Leistung, Kapazität und Kosteneffizient anstreben, vor allem für so weit verbreitete Anwendungen wie Tiered Storage und Virtualisierung.

Hybrid Tiered Storage

Das beste Beispiel für die Kombination von Geschwindigkeit von SSDs mit der großen Kapazität von HDDs zeigt die Tier-Pyramide. Diese Anwendung kategorisiert Daten von Unternehmen, basierend auf bestimmten und verbunden Kriterien, wie beispielsweise den Performance-Anforderungen, dem Datennutzen, der Datengröße, deren Wichtigkeit oder dem Grad für Datenschutz.


Die kategorisierten Daten werden dann verschiedenen Arten von Speichermedien zugeordnet, die sich entweder im SAN oder in bereitgestellten Anlagen (Storage-Arrays oder -Geräten) befinden - auch abhängig von den Kosten des Mediums. Dieser hybride Ansatz legt Wert auf Daten, priorisiert diese und reduziert damit die Gesamtkosten für das SAN/Speicher-Equipment.

Die wichtigsten Daten eines Unternehmens (Mission Critical), mit intensiven Transaktionen, brandaktuell und als "Hot" sowie vertraulich eingestuft, werden zum Beispiel Tier-0-Daten zugeordnet. Ihre Bedeutung qualifiziert diese Daten für Speichermedien höher Qualität wie SSDs, die eine höhere Leistung, Beständigkeit und Zuverlässigkeit bieten.

Stufenmodell: Das beste Beispiel für die Kombination von Geschwindigkeit von SSDs mit der großen Kapazität von HDDs zeigt die Tier-Pyramide.
Foto: OCZ

Weniger häufig verwendete Daten werden typischerweise Tier-1-Speichern zugewiesen, beanspruchen nicht unbedingt SSD-Performance, sondern nur ein wenig mehr Leistung und Zuverlässigkeit wie Konsumlösungen. Damit sind HDDs, die 10K bis 15K U/min liefern, gut für dieses Spektrum geeignet. Eine große Menge an selten genutzten Daten wird normalerweise als Tier 2 eingestuft. Hier passen kapazitätsorientierte HDDs mit 7.500 U/min.

Da die Tier-Abstufungen wachsen, könnte eine Vielzahl von Kategorisierungsstrategien implementiert werden, um weniger teure Medien wie Wechseldatenträger (zum Beispiel CDs, Band, Low-End-HDDs) zu integrieren oder auch ein MAID (Massive Array of Idle Disks) einzubinden.

Die Kombination aus schnellen I/O-Zugriffen und beschleunigter Anwendungs-Performance von SSDs und der signifikanten Speicherkapazität von HDDs kann entsprechend den Anforderungen der Unternehmensstruktur implementiert werden. Um diesen Hybridansatz zu perfektionieren, wäre die Überlegung, eine SSD im Server selbst zu installieren und diese als Beschleuniger durch Caching der am häufigsten verwendeten Tier-0- und Tier-1-Daten zu nutzen.

Innerhalb eines jeden Anwendungsdatenzugriffsprofils gibt es häufiger eine Datenteilmenge, die regelmäßig angefordert wird. Diese "Hot Data" können auf der SSD im Server zwischengespeichert werden. Auf diese Weise müssen diese angeforderten "Hot Data" nicht vom SAN kommen, da sie bereits auf der SSD innerhalb des Servers kopiert worden sind. Dies eliminiert nicht nur Serverengpässe sondern auch den Flaschenhals bei SAN-Zugriffen. Angesichts der von SSDs gegenüber HDDs gelieferten Leistung wie auch der I/O-Resonanz-Vorteile wird der Zugang zu den "Hot Data" stark verbessert.

Integriert man dieses Flash-Caching in die Infrastruktur, werden nicht nur die allgemeinen Investitionen gesenkt, da nur ein paar SSD-Flash-Medien benötigt werden, sondern es wird auch die Leistung durch die Flash-Technologie erhöht. Dies ermöglicht es IT-Managern weiterhin, die Kapazitätsvorteile von Festplatten für weniger frequentierte oder häufig verwendete Daten zu nutzen, und bietet eine der kostengünstigsten und effizientesten Ansätze der Hybridspeicherlösung heutzutage.

Fügt man Flash-Caching der Infrastruktur hinzu, werden nicht nur die allgemeinen Investitionen gesenkt, da nur einige SSD-Flash-Speicher benötigt werden, sondern es wird auch die Leistung durch die Flash-Technologie erhöht.

Hybridvirtualisierung

Virtualisierung ist eine Unternehmensanwendung, die Serverressourcen verteilt und den physischen Host in mehrere isolierte virtuelle Umgebungen, sogenannte virtuelle Maschinen (VMs), unterteilt, um durch die bessere Auslastung der Host-Ressourcen kosteneffektiver zu werden. VMs helfen, die Systemlasten auszugleichen, und erweitern die Verarbeitungskapazitäten, wodurch weniger physikalische Hosts pro Anwendungsbearbeitung benötigt werden und somit auch die System- und Wartungskosten deutlich reduziert werden.

Flaschenhals: Mehrere gleichzeitig laufende virtuelle Maschinen (VMs) einer virtualisierten Umgebung können einen HDD-SAN-Engpass verursachen.
Foto: OCZ

In diesen virtualisierten Umgebungen wurden Speichermedien traditionell in externen SANs oder Storage-Arrays mit HDDs ausgelagert, die in den meisten Fällen jedoch keine große Anzahl von VMs gleichzeitig bedienen können, geschweige denn mit ihrer IOPS-Leistung mit der benötigten Serverarbeitslast Schritt halten können. Da viele Anwendungen gleichzeitig laufen, werden ihre gemeinsamen Speicherzugriffe durch die Virtualisierung-Layer vermischt. Dadurch entstehen I/O-intensive Random-Zugriffe, was wiederum für HDDs das größte Problem darstellt, weil sich ihre physikalischen Köpfe so kontinuierlich von einem Ort zum anderen bewegen. Dies ist allgemein als I/O-Blender-Effekt bekannt.

Da alle VMs einer virtualisierten Umgebung gleichzeitigen Zugriff auf externe Speichermedien im Host haben müssen, ermöglicht das Caching der am häufigsten verwendeten Daten auf SSD-Flash-Speicher allen verbundenen VMs den Datenzugriff mit einer viel höheren Geschwindigkeit und geringerer Latenz. Daten, auf die nicht häufig zugegriffen wird oder die weniger wichtig sind, sind Anwärter auf HDDs, wie im zuvor im Hybrid-Tiered-Storage-Abschnitt besprochen.

Im Gegensatz zu HDD-Speichern haben Flash-basierte SSDs keine beweglichen Teile und können daher Random-Datenzugriffe mühelos bewältigen, sodass sie Virtualisierung effektiv unterstützen und gleichzeitig die Anzahl der Tausenden von Festplatten reduzieren, die für die erforderliche I/O-Leistung benötigt wurden. In einer virtualisierten Umgebung liegt der Schlüssel darin, Random Loads effektiv zwischen allen verfügbaren Flash-Ressourcen der SSD zu verteilen, um somit schnellen und zuverlässigen Datenzugriff ohne Belastung der Host-CPU oder Speicherressourcen zu liefern.

Um dies zu erreichen, ist zusätzlich eine intelligente Software erforderlich, die Flash-Caching und Storage-Virtualisierung in einer virtualisierten Serverplattform liefert, während es dem Flash-Cache ermöglicht wird, die Größe des Clusters oder der gesamten verfügbaren HDD-Speicherkapazität aus dem externen SAN zu skalieren und damit eine Hybridvirtualisierung zu schaffen.

Fazit

In Unternehmen bietet die Koexistenz von HDDs und SSDs ein ausgewogenes Verhältnis aus Leistung, Kapazität und Kosteneffizienz für Anwendungen wie Tiered-Storage und Virtualisierung. Dieser Hybridansatz ermöglicht den HDD-Einsatz, um günstige Speicherkapazität, aber auch die erforderliche Leistung von SSDs zu liefern. Die I/O-Performance muss daher nicht länger von einem großen Array rotierender und fehleranfälligen Festplatten erbracht werden.

Die Zusammenführung der Performance-Vorteile von SSDs mit den Kapazitätsvorteilen von HDDs erlaubt eine bessere Nutzung von Serverressourcen und reduziert die Anzahl erforderlicher Festplatten im Rechenzentrum. Dies wiederum senkt die Investitions- und Betriebskosten erheblich, ebenso den mit High-End-SAN-Arrays verbundenen Strom-, Kühlungs- und Wartungsaufwand. Am Ende steht nicht nur eine leistungsfähigere und schlankere Lösung, sondern auch eine, die am Ende die bessere TCO für das Rechenzentrum liefert. (cvi)