Effizientes Strommanagement spart Kosten

Green IT: Strom sparen in Serverräumen durch optimales Energiemanagement

06.10.2008 von Bernhard Haluschak
Der Betrieb von kostenoptimierten Serverräumen erfordert ein ausgeklügeltes Energiemanagement. Dabei beinhaltet ein gelungenes Green-IT-Konzept nicht nur das Server- und Klimamanagement, sondern auch die Raumplanung und die Gebäudetechnik.

Ein zentraler Aspekt zum Strom sparenden Betrieb von Serverräumen beziehungsweise Rechenzentren ist eine optimale und effektive Stromversorgung. Doch nicht nur die Stromversorgung ist wichtig, sondern auch die Geräte selbst müssen in der Lage sein, mit den Ressourcen sparsam umzugehen. Das beginnt bei den CPUs, geht über die kompletten Rechnersysteme bis hin zu den Serverräumen samt Klimatisierung und sollte sogar das komplette Gebäude- beziehungsweise Raummanagement mit einschließen.

Es reicht aber nicht aus, dass nur die „Hardware“ über Strom sparende Steuerungsmechanismen verfügt. Wichtig ist auch eine intelligente Software, die alle Parameter zentral sammelt und die Komponenten überwacht und steuert. Diese Management-Tools bilden die Schaltzentrale zur Koordination und Verteilung der Ressourcen.

In unserem Beitrag erläutern wir detailliert die wichtigsten Möglichkeiten zur Stromeinsparungen. Dabei werden nicht nur Green-IT-Gesichtspunkte betrachtet, sondern das gesamte Green-IT-Environment mit einbezogen.

Die grüne CPU

Die Prozessorhersteller haben in Bezug auf Strom sparen aus der Not eine Tugend gemacht. Der steigende Stromverbrauch der Prozessoren zwang die Hersteller, entsprechende energiesparende Maßnahmen in die CPUs zu implementieren. Bei AMD heißt diese Technologie „PowerNow!“, und Intel bezeichnet diese als „Speedstep“.

Aktuell setzt Intel in seinen Xeon-Server-CPUs das sogenannte „Demand Based Switching“ ein, besser bekannt als „Intel Enhanced Speedstep Technology“ (EIST). Dabei werden je nach CPU-Auslastung die Taktfrequenz und die Core-Spannung dynamisch im Prozessor geregelt.

Über sechs definierte Leistungsstufen (States) wird die Leistung des Prozessors beziehungsweise Cores in einem Multi-Core-Prozessor gemäß den Systemanforderungen reguliert. Dies geschieht ohne Zutun des Betriebssystems im laufenden Betrieb. Das zentrale Steuerungselement basierend auf der Advanced-Configuration-and-Power-Interface-Tabelle (ACPI), die der Hersteller des Mainboards festlegt.

AMD setzt aktuell in seinen Opteron-Server-Prozessoren die Enhanced-PowerNow!-Technologie ein. Dabei wird unter anderem die Taktfrequenz in 32 Stufen reduziert. Zusätzlich können die Prozessoren – wie bei Intel – die Core-Spannungen je nach Bedarf im Betrieb anpassen.

Laut den CPU-Herstellern sollen diese leistungseffizienten Optionen in den CPU-Architekturen eine Reduktion des Stromverbrauchs bis zu 40 Prozent bringen.

Leistungsabhängige Steuerung des Energieverbrauchs in Servern

Ein großer Anteil der Energie für den Betrieb der IT wird nicht in Rechenleistung umgesetzt, sondern geht als Abwärme verloren. In der Praxis setzen die Unternehmen häufig auf einem Server nur eine einzige Applikation ein. Das führt dazu, dass die Systeme das Gros ihrer Rechenzeit nicht optimal auslasten. So verbraucht ein Server im Leerlaufbetrieb etwa 60 bis 70 Prozent der Energie gegenüber einem Server im normalen Lastbetrieb.

Um die Rechenlast in einem Server, Rack oder Rechenzentrum besser zu verteilen, wurde unter der Federführung von Intel die Initiative Automatic Control of Power Consumption (ACPC) ins Leben gerufen. Sie arbeitet an der Optimierung des maximalen Energieverbrauchs von Rechnern beziehungsweise Rechnerräumen unter Berücksichtigung eines definierten Regelkreislaufs für den Stromverbrauch.

Steuerzentrale: Die Ablaufsteuerung verdeutlicht den Regelkreislauf des Stromverbrauchs bei Automatic Control of Power Consumption. (Quelle: Intel)

Dies kann auf zwei Arten durchgeführt werden: Zum einen kann der Serverbetreiber die maximalen Verbrauchsgrenzen so festlegen, dass auch ein Betrieb bei einer eingeschränkten Stromversorgung gewährleistet ist. Darüber hinaus können mithilfe des Automatic-Control-of-Power-Consumption-Ansatzes die gesammelten Leistungswerte dazu verwendet werden, um ein Modell zur Leistungsoptimierung der Rechner zu erstellen. So kann zum Beispiel für einen Server mehr Leistung freigegeben werden, sobald andere Server diese nicht benötigen. Diese Technologie kooperiert eng mit den Prozessor-Stromsparmechanismen und bildet die Grundlage für das Enterprise-Power-and-Thermal-Management, das im Folgenden erläutert wird.

Ganzheitliche Steuerung von Energieverbrauch und Kühlung

Der nächste Schritt für ein energieeffizientes Rechenzentrum ist es, die gesamte Kontrolle aller Racks inklusive der Klimaanlage in eine zentrale Gebäudesteuerung einzubinden. Dies stellt eine große Herausforderung dar, vor allem an die Schnittstelle zwischen IT-Systemen und Haustechnik.

In der Praxis müssen so alle Systeme und Komponenten über ein standardisiertes „Power Thermal Management Interface“ (PTMI) alle Meldungen an eine zentrale Instanz leiten. Diese Instanz regelt dann gebäudeübergreifend die Energieversorgung.

Die Idee ist nicht grundsätzlich neu und bereits in vielen Systemmanagement-Werkzeugen IT-seitig implementiert. Meist fehlt dort jedoch die Erweiterung um die Aspekte der Kühlung und Haustechnik. Bei einem konsequenten Einsatz der Modellierung können beispielsweise die Klimaanlage, der Luftstrom der Ventilatoren oder die Leistungsaufnahme der Serverkühlung auf das notwendige Minimum gedrosselt werden.

All-in-One-Lösung: Das Diagramm zeigt ein Gesamtsystem zum Management von Strom, Leistung und Kühlung im Rechenzentrum. (Quelle: Intel)

Als zusätzliche Maßnahme sollte der IT-Verantwortliche die Nutzung von Thermoanalyseprogrammen, die die Wärmeausstrahlung im Rechenzentrum überwachen kann, in Erwägung ziehen. Damit könnten im Vorfeld die Ursachen von Ausfällen durch sogenannte Hot Spots ohne hohen Zeit- und Kostenaufwand ermittelt werden.

Dazu werden sowohl der Raum als auch die einzelnen Komponenten überwacht und Daten über elektrische Leistung sowie Temperatur der einzelnen Systeme aufgezeichnet. Daraus lässt sich ein virtuelles Modell errechnen, das die verschiedenen Bestandteile und Raumbereiche berücksichtigt. Auf dieser Basis kann ein entsprechendes Strommanagement-Programm bei Bedarf Aktionen automatisch durchführen oder darauf hinweisen, manuelle Gegenmaßnahmen zu ergreifen.

So könnte zum Beispiel die dynamische Arbeitsverteilung auf die verschiedenen Prozessoren in einem Server zentral gesteuert werden. Dies geschieht dann nicht nur aufgrund der benötigten Rechenleistung, sondern bezieht auch die Hitzeabstrahlung und den Energieverbrauch des Racks beziehungsweise der Klimatisierung mit ein.

Leistungskontrolle der Server mit Cabinet Power Distribution Units

Die Möglichkeiten zur Energiekontrolle mittels SpeedStep- oder PowerNow!-Technologie setzt eine moderne Ausstattung und eine aktuelle Servergeneration voraus. Dies ist in „historisch gewachsenen“ Umgebungen nicht immer gegeben. Darüber hinaus beschränken sich die Möglichkeiten auf den Bereich der x86-basierten Technologie, Komponenten wie Netzwerk-Switches, KVM-Verteiler (Keyboard, Video, Maus), Bandlaufwerke und Ähnliches bleiben dabei unberücksichtigt. Hier ermöglicht der Einsatz von sogenannten „Cabinet Power Distribution Units“ (CPU) eine weitgehende Kontrolle über den Energieverbrauch eines Geräts direkt an der Steckdose.

Hierbei wird die Stromleiste des Servers gegen eine funktional erweiterte Steckerleiste ausgetauscht. Diese ist in der Lage, an jeder Steckdose die Energiewerte und den Verbrauch zu messen und diese Werte über eine Standard-Ethernet-Verkabelung mittels TCP/IP-Protokoll an ein Strommanagement-Tool zu melden.

Heutzutage werden diese Lösungen oft mit proprietären Schnittstellen und Überwachungsprogrammen angeboten. Allerdings sollte das langfristige Ziel eine solche Integration mittels eines standardisierten Power Thermal Management Interfaces (PTMI) sein. Derzeit können solche Lösungen den Energieverbrauch messen oder Über- oder Unterspannungen feststellen und diese dann als Fehlermeldung an ein übergeordnetes System melden.

USV-Stromversorgung optimieren

Zum energieeffizienten Betrieb eines Rechenzentrums gehört auch, dass eine unterbrechungsfreien Stromversorgung USV optimiert wird. Der Einsatz von Deltawandlern in USVs bietet hier Lösungsansätze, ebenso wie die Einführung von speziellen Managementprogrammen, die Stromversorgung und Rechnerleistung aufeinander abstimmen. Neueste USV-Systeme gehen sogar noch einen Schritt weiter und beziehen die Steuerung der Klimaanlage mit ein.

Einsparpotenziale: Die Stromversorgung eines Servers bietet durch technische Maßnahmen (Bild unten) vielfältige Einsparmöglichkeiten. (Quelle: Intel)

Im Bereich der Stromzuführung ist ein erhebliches Einsparpotenzial möglich. Durch den Einsatz von Deltawandlern (Delta Conversion On-Line UPS) statt Doppelwandlertechnik in der unterbrechungsfreien Stromversorgung (USV) kann ein erheblich höherer Leistungs- beziehungsweise Wirkungsgrad der USV erreicht werden, da entsprechende Komponenten in der Stromverteilung und in der Rackunterverteilung entfallen. Darüber hinaus wird durch die Weiterleitung des Gleichstroms der gesamte Leitungsverlust um bis zu 50 Prozent reduziert. Zusätzlich erhöht sich die Systemverfügbarkeit, da weniger Teile in der Stromversorgung ausfallen können.

Fazit

Der stetig steigende Kostendruck auf die Betreiber von IT-Systemen durch den wachsenden Bedarf an elektrischer Energie zwingt zum Umdenken. So nutzen immer mehr IT-Betreiber Strom sparende Möglichkeiten in Form von Hardware- und Software-Lösungen zur Reduzierung der hohen Betriebskosten.

Das fängt bei der Nutzung der CPU-Stromsparmechanismen wie SpeedStep und PowerNow! in Servern an und endet bei einer optimierten und energieeffizienten Steuerung der gesamten Gebäudetechnik. Dabei sollten idealerweise alle Systeme ihre Informationen an ein zentrales Management-Tool liefern, das dann übergreifend alle Komponenten aufeinander abstimmt und entsprechend steuert.

Ein Ziel dieses zentralen Energiemanagements ist es, bestehende Rechenkapazität weiterhin nutzen zu können oder sogar zu erweitern, aber teure Investitionen in eine neue Infrastruktur für Energieversorgung und Klimatisierung so lang wie möglich hinauszuschieben. Der Hauptaspekt besteht aber darin, langfristig Energie einzusparen, die Betriebskosten zu mindern und einen Beitrag zum Umweltschutz zu leisten. (hal)