Bei der Planung von Rechenzentren oder Server-Farmen muss nicht nur die sichere Stromversorgung beachtet werden. Mit dem Trend zu immer höherer CPU-Leistung und Rechnerdichte wachsen die Anforderungen an die Infrastruktur für die Energiezufuhr und die Kühlung.
80 Prozent der Datenverluste sind nicht auf Vi- ren oder andere Schad- programme, sondern auf Spannungsprobleme zurückzuführen.
Immer mehr Rechenpower auf immer weniger Raum lautet der ungebrochene Trend in den Rechenzentren. Je höher aber Leistung und Dichte, desto höher sind auch der Strombedarf und die Wärmeabgabe der Systeme. Auch die Wärmeabgabe und damit in Verbindung stehende Themen wie die Luftzirkulation und das Kabel-Management im Rack müssen optimiert werden. Moderne Tools und Komponenten helfen, unliebsame Überraschungen zu vermeiden und die Verfügbarkeit sicher zu stellen.
Wer einen Serverraum betritt, merkt schnell, dass IT eine schweißtreibende Angelegenheit sein kann. Auf engstem Raum ballen sich hier Geräte – Prozessoren, Festplatten, Netzteile – die viel Abwärme produzieren. Um den sicheren und kosteneffektiven Betrieb eines Rechenzentrums zu garantieren, rücken seit einiger Zeit der Stromverbrauch und das thermische Design auf Rack- und Raumlevel in den Mittelpunkt des Interesses. Diese Themen gehen weit über die traditionelle Absicherung der Stromversorgung und die Klimatisierung hinaus. Denn ein dicht gepacktes Server-Rack verbraucht teilweise mehr Strom als ein Einfamilienhaus – und das auf der Standfläche einer aufgeschlagenen Tageszeitung.
Es lohnt sich daher, Stromverbrauch, Abwärme und die Luftzirkulation genauer unter die Lupe zu nehmen, um auf künftige Entwicklungen vorbereitet zu sein. Anderenfalls können sich Sicherungsmaßnahmen rasch als unzureichend erweisen. Nachträgliche Änderungen sind in der Regel wesentlich teurer als adäquate Maßnahmen durch präzise Planung.
Die Suche nach Optimierungspotenzial beginnt bei einer selten beachteten Komponente, dem Netzteil. Der Wirkungsgrad gängiger Modelle liegt nach einer Studie der ETH Zürich zwischen 60 und 80 Prozent. Einfache Transformatoren vergeuden also ein Fünftel der eingesetzten Energie und geben diese in erster Linie als Wärme ab, ohne dass der Benutzer einen Vorteil davon hat. Ganz im Gegenteil, wie noch erläutert wird.
Seit dem Jahr 2000 müssen Netzteile die Europa-Norm EN 61000-3-2 erfüllen. Den besten Wirkungsgrad bieten derzeit Netzteile mit aktiver Power-Factor-Correction (PFC) mit dem Leistungsfaktor (Power-Factor) gleich 1,0. Die Kennzahl gibt an, wie effizient Spannung in tatsächliche Arbeit (Verbrauch) umgewandelt wird. Ein Power-Factor von 1,0 bedeutet, dass Stromnetz und Netzteil perfekt synchron und effizient arbeiten, also nicht mehr Strom aufgenommen wird als notwendig. Dies bedeutet gleichzeitig geringeren Verbrauch, weniger Oberschwingungen und weniger Verlust durch Abwärme. Beim Kauf von Servern und USVs sollten IT-Verantwortliche unbedingt auf hochwertige Schaltnetzteile mit aktivem PFC achten. Wer hier spart, zahlt an anderer Stelle doppelt.
Ein Beispiel für den immer weiter steigenden Leistungsbedarf beziehungsweise die Netzteilkapazität: Ein HP-Proliant-4000-Server arbeitete 1992 mit einem 540-Watt-Netzteil. Das Netzteil für die heutigen Proliant-BL-Server hat hingegen 3000 Watt. Hier zahlt sich Energie-Effizienz aus – auch um die Hardware beim Einschalten nicht zu überlasten. Denn gerade beim Booten und Initialisieren des Systems laufen alle Komponenten mit hoher Last, was etwa die Sicherungen stark belastet. Fehlertolerante Server verwenden deshalb redundante Netzteile, die sogar während des Betriebs ausgetauscht werden können. Im Normalbetrieb teilen sie sich die Last untereinander auf. Das schont die Hardware und verlängert die Lebensdauer.
Angesichts des Stromverbrauchs einer größeren Server-Gruppe scheinen ein paar Watt Mehrverbrauch nicht ins Gewicht zu fallen. Doch bei näherem Hinsehen verdoppelt jedes Watt den Aufwand. Zum einen bezahlt das Unternehmen, um die Energie erst in den Serverraum hinein und dann erneut, um sie wieder heraus zu bekommen. Die enorme Hitzeentwicklung kann sich zu einem ernsthaften Problem entwickeln, weil die hohe, punktuelle Dichte der Wärmequellen im Raum das Abführen der Hitze erschwert. Außerdem wird es immer schwieriger, die vielen Einheiten mit Strom zu versorgen. Je höher der Strom-Verbrauch pro Rack ist, desto eher stoßen traditionelle Verkabelungskonzepte an ihre technischen Grenzen.
Üblicherweise gibt es in einem Rechenzentrum oder einer Server-Farm mehrere Hauptleitungen, von denen Verbindungen zu den Steckdosenleisten abzweigen. Von dort transportieren Kabel den Strom zum jeweiligen Gerät. Das ist kein Problem, so lange die Last die Kapazität nicht voll ausschöpft. Ist ein Strang überlastet, erfordert die Verkabelung umfangreiche Arbeiten. Mit einer modularen Power-Distribution-Unit (PDU) kann man diesem Problem vorbeugen. PDUs integrieren Verbindungen und Kabel direkt im Rack und machen diese unabhängig von der Anordnung der Steckdosen in der Wand. HP bietet beispielsweise modulare PDUs mit einer Leistung von 24 bis 40 Ampere an, die bis zu 32 Steckdosen speisen. Neben der beschriebenen Flexibilität besonders wichtig: Die Kabellängen zwischen Verteilerleiste und Verbraucher (Server) werden auf die kürzest mögliche Länge von 33 cm reduziert. Dies verbessert das Kabel-Management und den »Airflow« im Rack erheblich.
Betreiber von Rechenzentren können sich nicht allein auf das Stromnetz verlassen. Denn 80 Prozent der auftretenden Datenverluste sind nicht auf Viren oder andere Schadprogramme, sondern auf Spannungsprobleme zurückzuführen. Zu den Spannungsproblemen zählen Spannungsschwankungen, Hochspannungsspitzen, Schaltspitzen, Frequenzabweichungen, Kurzschlüsse, Netzausfall (Blackout), Leitungsrauschen sowie harmonische Oberwellen. Die Folgen sind Datenverlust, Datenfehler, zerstörte Netzteile, der Ausfall von geschäftskritischen Anwendungen für mehrere Stunden oder auch Tage und der damit einhergehende Verlust an Produktivität.
Der USV kommen also neue Aufgaben zu. Vor allem muss sie Unternehmen vor den täglich auftretenden Spannungsproblemen und deren Auswirkungen schützen. Fällt die Stromversorgung vollständig aus, muss die USV weiterhin Spannung für die Systeme liefern, so dass ausreichend Zeit besteht, um Daten zu sichern und Systeme herunterzufahren. Eine USV steigert die Verfügbarkeit von Servern, Workstations, Desktops, Netzwerken und Anwendungen. Damit sorgt die USV für einen reibungslosen Betrieb, was letztendlich auch die Betriebskosten senkt.
Je wichtiger ein System für ein Unternehmen ist, desto mehr ist es nötig, es über eine unterbrechungsfreie Stromversorgung zu schützen. Die Batterien der USV springen nicht nur im Falle eines Stromausfalls ein. Filter verhindern auch die oben beschriebenen Auswirkungen der Spannungsprobleme. Doch viele Standalone-USVs entsprechen nicht den 7x24-Anforderungen. Führende Anbieter wie HP bieten deshalb modulare Lösungen an, die direkt in die Racks integriert werden können. Je nach Bedarf lassen sich weitere Batterien ergänzen oder während des laufenden Betriebs austauschen. Die HP-Rack-USV »R5500 XR« bietet dabei beispielsweise eine maximale Leistungsdichte von 5400 Watt in nur drei Höheneinheiten. Damit lassen sich auch umfangreiche Installationen absichern und im Fall der Fälle definiert herunterfahren. Das Herunterfahren der Systeme kann besonders flexibel über mehrere Last-Segmente oder Gruppen definiert werden. Während die Geräte der einen Gruppe bei einem Stromausfall gezielt heruntergefahren werden, lassen sich andere hochfahren, um einen Notfallplan auszulösen. Außerdem ist ein priorisierter Shut-down möglich, um die Server, auf denen geschäftskritische Anwendungen laufen, möglichst lange mit Strom zu versorgen.
Info Standards für das sichere Rechenzentrum
Die meisten USVs kommen nur selten zum Einsatz, was einerseits ein Glück, andererseits eine Gefahr ist. Denn Batterien ermüden mit der Zeit durch das ständige Laden und müssen ungefähr alle drei Jahre erneuert werden. Dagegen hat beispielsweise HP einen patentierten, dreistufigen Ladeprozess (EBM) entwickelt, der die durchschnittliche Batterielebensdauer auf etwa sechs Jahre verdoppelt. Dies senkt die Betriebskosten (TCO) spürbar. Darüber hinaus sind die Batterien mit einem Frühwarnsystem ausgestattet. Die Pre-Failure-Warnung informiert den Administrator, wenn die Ladefähigkeit eines Akkus sinkt. Damit weiß er rund zwei Monate im voraus, dass das Ende der Lebensdauer bald erreicht ist. Eine Ersatzbatterie kann früh genug beschafft und während des Betriebs ausgetauscht werden. Die USV muss dafür weder ausgebaut noch die angeschlossenen Server herunter gefahren werden. Dies spart Zeit und Wartungskosten und stellt höchste Verfügbarkeit sicher.
Eine moderne USV-Software, die unter Windows, HP-UX, Linux oder Netware läuft, kann Server nicht nur bei einem Stromausfall herunterfahren und eine automatische Datensicherung einleiten. Um die Stromkosten zu senken, kann das Management-System auch ungenutzte Systeme herunter fahren. Alle Parameter der kompletten USV-Infrastruktur lassen sich von einer einzigen Konsole aus steuern. Im Gegensatz zu anderen Lösungen erlaubt beispielsweise die HP-Software, verschiedene und redundante USV-Konfigurationen zentral zu administrieren. Das Bündel der Maßnahmen senkt Betriebskosten, indem viele Aufgaben automatisiert werden.
Seit Jahren werden 19-Zoll-Racks eingesetzt, um mehr Equipment auf wenig Raum unterzubringen. Als Folge der höheren CPU-Leistung und Serverdichte steigt der Wärmeausstoß pro Quadratmeter kontinuierlich. Ein typischer Schrank mit 42 Höheneinheiten, der mit aktuellen Zwei-Prozessor-Servern bestückt ist, verbraucht inklusive Speichermedien rund 15 kW. An Hitze gibt dieses Rack gut 50000 BTU pro Stunde ab. Das entspricht der Abwärme aller Geräte inklusive der Zentralheizung eines Einfamilienhauses. Mit Itanium- und
Blade-Servern sowie Festplatten mit hoher Speicherkapazität sind über 20 kW per Rack keine Seltenheit. Stehen nun mehrere 19-Zoll-Schränke in einem Raum, stellt dies enorme Anforderungen an die Klimatisierung. Wird die Hitze nicht schnell genug abgeführt, kann es zu schwer wiegenden Schäden an der Hardware kommen. Jedes weitere Rack vergrößert die Probleme.
Die Anforderungen an Racks steigen damit erheblich. Alte Racks mit zum Teil geschlossenen Türen können nicht mehr eingesetzt werden. Heute sind perforierte Racks, die auf der Vorder- und Rückseite mit perforierten Türen ausgestattet sind, zwingend notwendig. Sie stellen sicher, dass die Luft von vorne nach hinten zirkuliert, so wie es die heutige Servergeneration benötigt. Beispielsweise spezifiziert HP für Proliant-Server, dass die Luftlöcher 65 Prozent der Türfläche einnehmen müssen. Außerdem dringend zu empfehlen sind Blenden für ungenutzte Einschübe. Damit wird verhindert, dass die heiße Luft, die aus der Rückseite der Server austritt, nach vorne gelangt und dort wieder vom Server angesaugt wird. Studien belegen, dass Überhitzung die Ursache für über 30 Prozent der Serverausfälle ist.
Beim Einsatz mehrerer Racks in einem Serverraum ist außerdem die optimale Aufstellung der Racks wichtig. Es hat sich bewährt, die Rackreihen jeweils mit den Fronten gegenüber aufzustellen, damit sich »kalte« und »heiße« Gänge ergeben. Das verhindert, dass ein Rack die bereits erhitzte Luft eines anderen ansaugt. Optimal ist die Absaugung der heißen Luft in den heißen Gängen von oben und die Zuführung der abgekühlten Luft in den kalten Gängen von unten.
Um die Planung zu erleichtern, bietet HP ein Tool auf Excel-Basis an. Es enthält einen »Power Calculator« für jeden Server, um die Energieversorgung des Racks optimal zu planen. Außerdem wird der voraussichtliche Verbrauch und die erwartete Hitze-Entwicklung ermittelt, um den Raum vorab optimal vorzubereiten und Schwachstellen vor der Installation zu entdecken. Ein paar Mausklicks verhindern, dass der Administrator hinterher ins Schwitzen kommt.
Werner Hergl, Program Manager, Hewlett Packard