RAID, Alarmkette, Derating & Co.

Hochverfügbarkeit - Storage richtig konfigurieren

Gefragt: Zuverlässigkeit auf Subsystemebene

Auf der FRU- oder Subsystemebene sind vier Ansätze zur Maximierung der MTBF und zur Integration innovativer SAN-Funktionen zu empfehlen. Da theoretisch jeder einzelne Bestandteil ausfallen kann, ist die Zuverlässigkeit des Subsystems umso höher, je weniger es davon gibt. Unternehmen sollten daher auf eine möglichst kleine Anzahl an Elementen in den Leiterplatten und anderen FRUs achten. Außerdem lohnt es sich, nur auf qualitativ hochwertige Einzelteile zu setzen. Diese sind zwar meist teurer, die bessere Performance und die längere Betriebsdauer zahlen sich aber aus.

Der dritte Ansatz ist das "Derating" ausgewählter Teile. Wird ein Element stets vollständig belastet, senkt dies die Betriebsdauer. Funktioniert eine Komponente beispielsweise bei 50 Prozent des maximalen Verbrauchs an Strom, lassen sich so die Betriebsdauer und somit die MTBF deutlich verlängern.

Ein weiterer Ansatz ist die Auslegung des Systems für Softwarezuverlässigkeit. Zuverlässige Software ist genauso wichtig wie zuverlässige Hardware - wenn nicht wichtiger. Denn Softwarefehler sind langwieriger als Hardwarefehler, da sie sich schwerer eingrenzen lassen und Updates und Patches vor deren Veröffentlichung getestet werden müssen. Die lange MTTR von Softwarefehlern beeinträchtigt die Betriebsfähigkeit und Zuverlässigkeit des Systems. Daher sollten IT-Verantwortliche darauf achten, dass Bugs in der Software möglichst schnell zu entdecken sind.