Grundlagen: Network Attached Storage

01.04.2005 von KARL FROEHLICH, speicherguide.de 
Network Attached Storage Devices spielen in Storage-Strategien eine zunehmend wichtige Rolle. Doch was verbirgt sich hinter dem Kürzel NAS, und wer benötigt diese Geräte? tecCHANNEL klärt über Nutzen und Einsatz von NAS auf.

Die grundsätzlichen Ziele, die durch die Einführung vernetzter Speichersysteme verfolgt werden, sind Konsolidierung, Zusammenarbeit und Verteilung. Durch Konsolidierung lassen sich viele unterschiedliche Informationsquellen zusammenfassen und unter eine zentrale und effizientere Verwaltung stellen. Beispielsweise ist es möglich, die Funktionen vieler verstreuter Server auf einem einzigen System zu konzentrieren, oder mehrere kleinere Speichersysteme zu einem großen zusammenzuführen und so Betriebskosten einzusparen. Diese Einsparung ist das Ergebnis niedrigerer Einkaufspreise, effizienterer Verwaltung und einheitlichen Betriebes.

Durch NAS-Systeme lassen sich Informationen innerhalb einer Organisation einfacher und schneller austauschen beziehungsweise gemeinsam bearbeiten. So können mehrere Mitarbeiter oder Abteilungen mit unterschiedlichen Zielsetzungen am selben Datenbestand arbeiten, ohne diesen physikalisch kopieren oder verlegen zu müssen. Durch diese Parallelisierung werden hohe Kosteneinsparungen möglich, zum Beispiel bei Datenbankprojekten oder im CRM- sowie SRM-Umfeld.

Ein weiterer Vorteil von NAS ist die Verteilung von Daten an genau den Ort, an dem ein Unternehmen sie gerade benötigt. Herkömmliche Installationen haben den Nachteil, dass Nutzer, die in geringer Entfernung zum Speichersystem arbeiten, über die besten Zugriffszeiten und Bandbreiten verfügen, während diese mit zunehmender Entfernung ständig abnehmen. Vernetzte Speichersysteme bringen die Daten automatisiert zu jeder Zeit an genau den Ort, wo sie benötigt und bearbeitet werden. Dadurch wird im gesamten Unternehmen eine höhere Effizienz bei der Nutzung der Informationen erzielt.

Unterscheidung: Kanal- und IP-Netze

Grundsätzlich werden zwei Typen von Speichernetzwerken unterschieden: Kanalnetze und IP-Netze. Kanalnetze wurden ausschließlich für die Anbindung von Storage-Systemen an Rechner entworfen. Sie bieten eine Hochgeschwindigkeitsverbindung, die sich wie ein dezidierter Kanal verhält. Kanalnetze erlauben vielen unterschiedlichen Servern und Speichern, ihre Signale zeitgleich über eine gemeinsame Verbindung zu senden, ohne sich gegenseitig zu beeinflussen.

Solche Netze sind allerdings nicht annähernd so verbreitet wie IP-Netze. Unternehmen haben daher mit den Kosten zu kämpfen, die sich durch die Einführung zusätzlicher Technologie ergeben. Außerdem wird dezidiert ausgebildetes Fachpersonal benötigt, um ein Kanalnetz professionell zu betreiben. Hauptsächlich wird heute Fibre-Channel-Technologie in Kanalnetzen verwendet. Diese startete Mitte der 90er Jahre mit einem Gbit Bandbreite, bietet aktuell zwei Gbit als Standard und wird in Zukunft vier beziehungsweise acht Gbit bieten.

IP-Netze andererseits existieren fast überall, implementiert hauptsächlich als Ethernet-LANs mit Bandbreiten zwischen zehn Mbit und einem Gbit. Der größte Vorteil dieser LANs liegt in ihrer ausgereiften und weit verbreiteten Technologie, die es Unternehmen erlaubt, existierende Infrastrukturen und Fachwissen weiter und besser zu nutzen. Des Weiteren sind IP-Netze gut dazu geeignet, zuverlässig Daten über annähernd beliebige Entfernungen zu transportieren und durch Umleitung (re-Routing) mit dem Ausfall einzelner Komponenten fertig zu werden.

Der größte Nachteil von IP-Netzen ist ihre nicht vorhersehbare Leistung, vor allem bei hohen Auslastungen. Nur ein Gerät kann zu einer Zeit eine IP-Verbindung nutzen - sollte also ein Rechner hohe Netzwerklast erzeugen, hat dies Auswirkungen auf die Verbindung zu allen anderen Geräten im Netz.

Datenzugriff im Block- oder Dateiverfahren

Grundsätzlich werden zwei unterschiedliche Methoden unterschieden, mit denen auf Informationen zugegriffen werden kann: Block und Datei.

Beim Blockzugriff zieht der Rechner seine Informationen direkt (Block für Block) vom Datenträger. Das Betriebs- beziehungsweise Dateisystem hält Tabellen der Inhalte der Datenträger vor und steuert den schreibenden und lesenden Zugriff. Dieser erfolgt direkt auf den Datenträger, ohne dass weitere Intelligenz benötigt wird. Da allerdings nur ein Prozessor zu einer Zeit die Inhaltstabelle eines Datenträgers vorhält, kann auch nur dieser eine Chip mit den darauf enthaltenen Informationen arbeiten. Mit anderen Worten: Blockzugriff ist schneller als alle anderen Methoden, allerdings beschränkt auf jeweils nur einen Rechner und somit nur schwer verteilbar. Im Blockzugriffsverfahren arbeiten beispielsweise Fibre Channel und iSCSI.

Beim Dateizugriff werden Daten nur über ihre Namen adressiert, nicht über ihren Speicherplatz. Deswegen ist ein separater Rechner - ein so genannter Fileserver - nötig, um über die Angabe des Namens an die Inhalte von Dateien zu gelangen. Dieser Host erhält die Lese- oder Schreibanforderungen einer kompletten Datei und arbeitet den Blockzugriff auf den Datenträger "hinter den Kulissen" ab. Weil die angeschlossenen Rechner nur den Namen der Datei, aber nicht die physikalische Adresse der einzelnen Blöcke kennen müssen, ist es möglich, dass viele Systeme gleichzeitig auf einen einzigen Datenbestand zugreifen. Dies ist der Hauptvorteil des Dateizugriffes, der allerdings durch einen weiteren Rechner im Datenpfad, höhere Komplexität und möglicherweise eingeschränkte Leistungsfähigkeit erkauft wird.

NAS ist nicht gleich SAN

Die Kombination von Kanalnetzen und Blockzugriff heißt SAN, die Nutzung von IP-Netzen für den Dateizugriff beruht auf der NAS-Architektur. Die beiden Technologien repräsentieren den Großteil der heutigen Installationen.

Der gemeinsame Zugriff auf Daten von unterschiedlichen Systemen ist der Schlüsselvorteil der NAS-Technologie. Anwendungen und Daten vieler verstreuter Systeme können auf einem einzigen zusammengefasst und zur gemeinsamen Arbeit bereitgestellt werden. Skalierbare Hochleistungs-NAS-Systeme ersetzen oft viele kleinere Linux/Unix- oder Windows-Server. Dadurch lassen sich Kosten für den Einkauf und den Unterhalt der Speichersysteme senken.

In Entwicklungsumgebungen - zum Beispiel CAD, Software oder Forschung - können NAS-Systeme durch Zusammenarbeit am selben Datenbestand Projektlaufzeiten verkürzen und somit höhere Effizienz ermöglichen. Auch im Bereich des Web-Hostings setzen sich NAS-Systeme immer weiter gegen dezidierte Server durch.

NAS auf PC-Basis

Grundsätzlich unterteilen sich NAS-Produkte in Standard-PCs und spezialisierte NAS-Systeme. Herkömmliche Rechner mit Linux-, Unix- oder Windows-Betriebssystem bieten mehr Flexibilität auf der Plattform. Da auf ihnen auch Anwendungen laufen können, sind sie mehr als nur ein Dateiserver. Typischerweise installieren Unternehmen, die NAS auf PC-Basis einführen, eine homogene Server-Infrastruktur, also ausschließlich Unix- oder Windows-Rechner.

Diese Server verfügen grundsätzlich über niedrigere Anschaffungskosten als spezialisierte NAS-Systeme. Andererseits fallen sie meist im Preis-Leistungs-Verhältnis hinter diese zurück. Grund dafür sind die eingesetzten Betriebssysteme, die hauptsächlich für den Betrieb von Anwendungen entworfen wurden. Das heißt, sie sind nicht für den NAS-Betrieb optimiert. Darüber hinaus ist es schwieriger, Dateien zwischen unterschiedlichen Betriebssystemen auszutauschen, da es sich meist um herstellerabhängige und somit proprietäre Formate handelt.

Sollen Daten zwischen Linux/Unix und Windows ausgetauscht werden, benötigt mindestens eine Seite zusätzliche Software, und das erhöht Komplexität und Fehleranfälligkeit. Außerdem verfügen die wenigsten Standardrechner über integrierte Speicherverwaltung, Ausfallsicherheit oder Backup.

Spezialisierte NAS-Systeme

Spezialisierte NAS-Systeme besitzen gegenüber den Standard-Rechnern deutliche Vorteile bei der Leistung und Skalierbarkeit. Ihre Betriebssysteme wurden für eine einzige Aufgabe als Datei-Server entworfen. Sie betreiben NFS für die Unix-Welt und CIFS für die Windows-Welt sehr effizient, schnell und vor allem parallel, ohne zusätzliche Software auf den angeschlossenen Rechnern zu benötigen. Allerdings können NAS-Systeme oft keine oder nur proprietäre Anwendungen betreiben.

Wegen ihrer Auslegung als speicherzentrische Architekturen können spezialisierte NAS einfach skaliert werden. Sie sind einfacher als Cluster und somit ausfallsicher auslegbar. Zwar sind NAS-Systeme in der Anschaffung teurer als Standard-Rechner, eignen sich allerdings wesentlich besser für den Einsatz in missionskritischen Umgebungen, die hohe Leistung und Verfügbarkeit erfordern. Noch wichtiger allerdings ist die Möglichkeit zur Konsolidierung der Infrastruktur und damit zur langfristigen Senkung der Betriebskosten im Rechenzentrum.

Kategorisierung von NAS-Systemen

Eine weitere Möglichkeit, NAS-Systeme zu kategorisieren, ist die Art ihrer Nutzung. Hier unterscheidet die Branche zwischen Lowend, Midrange und Highend.

Lowend-Installationen werden meist mit "Plug-in-Storage" realisiert. Hier wird das NAS-System nur genutzt, um der Infrastruktur zusätzlichen Speicher über das IP-Netz zur Verfügung zu stellen. Hauptkriterien für solche Geräte sind der Preis und die einfache Installation. Standard-Rechner werden meist zusätzlich mit dieser Aufgabe betraut, aber es gibt auch immer mehr renommierte Hersteller, die ihr Portfolio mit diesen auf Preis und Installation optimierten Systemen erweitern.

Midrange-NAS-Installationen kommen in kleineren Konsolidierungs- und Datei-Server-Anwendungen zum Einsatz. In diesem Fall wird meist die Last mehrerer Standard-Systeme auf ein neues Gerät gelegt, um dadurch die Infrastrukturkosten zu senken. Schlüsselkriterien sind hier das Preis-Leistungs-Verhältnis und die zusätzlichen Eigenschaften, wie die Speicherverwaltung. Für diese Zwecke sind bereits spezielle NAS-Systeme notwendig.

Highend-NAS-Installationen werden zur massiven Konsolidierung und bei hochkritischen Aufgaben als Datei-Server verwendet. Der Hauptunterschied zu Midrange-Geräten ist die Skalierbarkeit. Highend-Systeme konsolidieren typischerweise mehrere hundert Standard-Server und bieten dabei 24x7-Verfügbarkeit. Schlüsselkriterien sind hier Skalierbarkeit, Verfügbarkeit und Leistung. Dies alles können wiederum nur spezielle NAS-Systeme offerieren, welche 100 oder mehr TByte an Kapazität verwalten.

Filesharing

Durch seine Art des Dateizugriffs "erbt" NAS seine Möglichkeiten zum gemeinsamen Bearbeiten von Informationen und die Abhängigkeiten der Leistung durch die Nutzung von IP-Netzwerken. Deswegen sind "filesharing"-Anwendungen das ideale Feld für NAS, allerdings solche, bei denen die reine Bandbreite beziehungsweise die Reaktionszeit des Speichers nicht die entscheidende Rolle spielen.

Ein weiterer Bereich sind Server-Konsolidierungen. Hier geht es darum, viele Standard-Hosts durch ein einziges NAS-System zu ersetzen. So sind beispielsweise 30 bis 50 Prozent aller Daten auf Plattensystemen Home-Verzeichnisse, gemeinsam genutzte Dokumente oder andere unstrukturierte Daten. NAS ermöglicht es, all diese Informationen zu konsolidieren und mehr Anwendern im Netzwerk zur Verfügung zu stellen.

Filesharing-Anwendungen sind solche, die zwei oder mehr Einzelapplikationen betreiben oder viele Nutzer haben, die auf ein und denselben Datenbestand zugreifen müssen. Beispielsweise in der Software-Entwicklung, wo es notwendig ist, Codemodule mehreren Ingenieuren gleichzeitig zur Verfügung zu stellen. Mit NAS ist es nicht mehr erforderlich, mehrere Kopien einer Datei auf vielen Speichern vorzuhalten. Ein anderes Beispiel sind Webumgebungen. Ein NAS-System kann ein einziges Abbild einer Webseite an Dutzende oder Hunderte Server verteilen, die wiederum einen wesentlich breiteren Zugriff auf diese Seite ermöglichen.

Fazit

NAS-Architekturen rechtfertigen sich ausschließlich durch eine TCO- beziehungsweise ROI-Betrachtung. Wie viel Geld kann durch eine Server-Konsolidierung gespart oder wie viel mehr Umsatz durch ein schneller entwickeltes Produkt erzielt werden. Die Ergebnisse dieser Überlegungen führen zur Einführung der beschriebenen Lowend-, Midrange- oder Highend-NAS-Systeme.

Je höher der ROI, desto eher wird sich der Interessent für höher wertige Lösungen entscheiden. Hinzu kommen personelle Überlegungen. Spezielle NAS-Systeme erfordern geschultes Personal, genauso wie Standard-Unix- oder Windows-Umgebungen. Allerdings ist der Aufwand für NAS in diesem Bereich wesentlich niedriger als zum Beispiel für SAN. (cvi)

Dieser Artikel basiert auf einem Beitrag von speicherguide.de.