Der Stromausfall am 4. November 2006 machte vielen Unternehmen die Abhängigkeit von der Stromversorgung schmerzhaft bewusst. Laut aktuellen Untersuchungen des Verbands der Netzbetreiber betrug die Stromausfallzeit pro Kunde im Jahr 2005 durchschnittlich 30 Minuten, wenn man die Fälle höherer Gewalt mit berücksichtigt. Doch der Schutz vor Stromausfällen ist nur ein Aspekt von vielen bei der ausfallsicheren Gestaltung eines Rechenzentrums.
Je nach Branche haben Unternehmen ganz unterschiedliche Kriterien und Gewichtungen für ein
ausfallsicheres Rechenzentrum. Beispielsweise bedeutet ein Ausfall der IT von wenigen Minuten für
ein Internet-Auktionshaus immense Kosten und Verluste, während dies für ein "Offline"-Unternehmen
womöglich nur geringe Konsequenzen hat. Doch je mehr Hauptgeschäftsprozesse über die IT abgewickelt
werden, desto kritischer ist dieser Bereich für den Geschäftserfolg.
Wer seine IT ausfallsicher gestalten will, muss Gefahren, die von fehlerhafter Organisation oder
Höherer Gewalt ausgehen, weit gehend minimieren. Darunter fallen auch mögliche personelle Engpässe
durch Krankheit sowie mangelhaft durchgeführte Wartung, Testverfahren oder Kontrollen der
IT-Sicherheitsmaßnahmen und Leistungskapazitäten. Außerdem müssen Sicherheitsmaßnahmen gegen
menschliches Fehlverhalten wie Zerstörung von Geräten, Diebstähle oder Sabotageakte und technisches
Versagen der Stromversorgung oder der Netzkomponenten bedacht werden. Da Unternehmen
unterschiedlich stark von diesen Bedrohungen betroffen sind, sollten individuelle Schutzmaßnahmen
definiert werden. Zunächst empfiehlt es sich, die möglichen Gefahren zu analysieren und
gleichzeitig festzulegen, wie hoch die Ausfallzeit maximal sein darf. Außerdem muss geklärt werden,
welcher Datenverlust toleriert werden kann, wie lange die Wiederherstellung dauern darf, wie
schnell die Netzwerkanwendungen wieder zugänglich sein müssen und wie lange ein eingeschränkter
Betrieb maximal akzeptabel ist. Mögliche Antworten auf diese und andere Fragen gibt beispielsweise
das ITIL-Regelwerk (IT Infrastructure Library), in dem Sicherheitsaspekte für den IT-Betrieb eine
bedeutende Rolle spielen. ITIL trägt Praxiserfahrungen zusammen und ist dem Ziel verpflichtet, die
IT prozess-, service- und kundenorientiert auszurichten. ITIL zeigt die Synergien und
Abhängigkeiten der einzelnen IT-Bereiche auf und ermöglicht so ein effizientes
Sicherheitsmanagement.
Sind die potenziellen Ausfallzeiten abgeschätzt, lassen sich diese zu den möglichen finanziellen
Schäden in Relation setzen. Hierzu sollte das Projektteam alle mit einem Ausfall zusammenhängenden
Kostenfaktoren berücksichtigen. Auf dieser Grundlage können dann fogerichtig die adäquaten
technischen Maßnahmen bestimmt werden.
In der Praxis müssen für eine sichere Unterbringung der IT zahlreiche Faktoren berücksichtigt
werden. Dabei ergeben sich drei grundsätzliche Alternativen: Die Büroräume können IT-gerecht
ausgestattet werden. Das Unternehmen betreibt ein eigenes Rechenzentrum oder es lagert das
Rechenzentrum an einen professionellen externen Rechenzentrumsbetreiber aus. Welche Option für ein
Unternehmen die Beste ist, hängt zum einen von den Kosten ab und zum anderen von den Ansprüchen an
das Rechenzentrum. Je geschäftskritischer die IT für ein Unternehmen ist, desto höher sind die
Anforderungen an den Energiebedarf und das Ausstattungsniveau eines Rechenzentrums. Allerdings sind
ein IT-gerechter Umbau eines Bürogebäudes oder der Bau beziehungsweise der Kauf eines
Rechenzentrums immens teuer.
Derzeit bringen die meisten mittelständischen Unternehmen ihre IT in den eigenen Büroräumen
unter. Problematisch ist hierbei, dass ein Bürogebäude im Durchschnitt über eine Anschlussleistung
von 80 Watt pro Quadratmeter verfügt, ein mit Blade-Servern voll bestückter Schrank aber schnell
zehn Kilowatt und mehr benötigt. Hinzu kommt der Strombedarf für die Kühlung der Server. Um den
Strombedarf des Racks zu decken, müsste ein Unternehmen aufgrund der niedrigen Anschlussleistung
rund 125 Quadratmeter Fläche vorhalten. Legt man einen durchschnittlichen Büromietpreis von 18 Euro
pro Quadratmeter zugrunde, würde die Miete eines entsprechenden Raumes 2250 Euro monatlich kosten.
Darin sind weder die Betriebskosten (Strom, Wartung, etc.) noch die Kosten für den IT-gerechten
Umbau des Büros enthalten. Ein Stellplatz für ein solches Rack bei einem externen
Rechenzentrumsdienstleister ist schon für zwei Drittel dieser Kosten zu haben. Darin sind die
kontinuierliche Instandhaltung der Anlagen sowie die Überwachung aller Systeme rund um die Uhr
enthalten. Darüber hinaus verfügen externe Rechenzentrumsdienstleister über Wachpersonal und
Sicherheitsmechanismen, die vor Einbruch, Diebstahl, Vandalismus und Manipulation der IT schützen.
Hier müsste sich ein Unternehmen nur um die ausfallsichere Auslegung seiner Geräte kümmern und eine
ihm entsprechende Ausstattungskategorie für das Rechenzentrum festlegen.
Das Uptime Institute unterscheidet für Rechenzentren vier Ausstattungsstufen je nach zulässiger
Ausfallzeit. Definiert ein Unternehmen eine zulässige Ausfallzeit von 72 Stunden, fällt das
Rechenzentrum in die Kategorie 1 (Bild 1) und sollte über eine Standardstromeinspeisung,
-verteilung sowie über eine unterbrechungsfreie Stromversorgung (USV) verfügen. Die
Überbrückungszeit bis zum Einsatz der USV ist abhängig von der Anzahl und Größe der Geräte. Handelt
es sich um einen Serverschrank mit bis zu 24 Kilowatt Leistung, müssen mindestens zehn Minuten
überbrückt werden können.
Bei einem ganzen Serverraum steigt der zu überbrückende Zeitraum auf mindestens eine Stunde.
Optional kann bei Rechenzentren dieser Kategorie auch eine Notstromversorgung vorhanden sein.
Hinsichtlich der Kühlung reicht das Spektrum von einer Präzisions- über eine Hochleistungs- bis hin
zu einer Flüssigkeitskühlung. Zum Schutz vor Feuer sollten Brandschutztüren sowie hitzebeständige
Wände, Böden und Decken ebenso vorhanden sein wie eine Überwachungseinheit mit Branderkennung.
Kann sich ein Unternehmen keinerlei Ausfallzeiten erlauben, fällt es in die Kategorie 4 (Bild
2). Die Stromversorgung muss in diesem Fall über redundante Verteiler erfolgen, die von
verschiedenen Umspannwerken mit Strom versorgt werden. Die USV ist redundant angelegt und muss eine
Spanne von zehn bis dreißig Minuten überbrücken können. Spätestens 15 Minuten nach dem Stromausfall
läuft das angeschlossene Notstromaggregat an, das über genügend Brennstoff für einen 72stündigen
Betrieb verfügt. Die Präzisions-, Hochleistungs- oder Flüssigkeitskühlsysteme sind in dieser
Kategorie ebenfalls redundant ausgelegt. Zudem ist für den Brandschutz eine Überwachungseinheit mit
Brandfrüherkennung vorgeschrieben sowie eine Gaslöschtechnik oder ein Sauerstoffreduzierungssystem
in jeweils redundanter Ausführung.
Dabei müssen Wände, Böden, Decken sowie Türen der EN 1047-2 entsprechen und dem Brandherd 90
Minuten standhalten, damit das Feuer eingedämmt und gelöscht werden kann.
Ein hochwertig ausgestattetes Rechenzentrum bietet zudem die Möglichkeit, die Server im
laufenden Betrieb ohne Einschränkungen zu warten. Um die Ausfallzeiten zu minimieren, sollten alle
kritischen Komponenten, insbesondere die Netzteile der einzelnen Geräte redundant ausgelegt sein.
Wichtig ist, dass die Netzteile der Geräte jeweils über unterschiedliche Stromkreise versorgt
werden, also an zwei getrennten Stromverteilerleisten angeschlossen sind. Hängen die Stromkreise
zudem noch an zwei voneinander unabhängigen USV-Anlagen und werden über getrennte Transformatoren
und Generatoren versorgt, lässt sich die Verfügbarkeit zusätzlich steigern.
In vielen Unternehmen wird das Thema IT-Unterbringung und die ausfallsichere Auslegung
stiefmütterlich behandelt. Dies mag zum einen daran liegen, dass das Thema für IT-Experten oftmals
hinter den technischen Belangen der IT anstehen muss. Zum anderen ist es sehr komplex, da es nicht
nur Stromversorgung und Kühlung umfasst, sondern beispielsweise auch die Gebäudesicherheit oder die
Überwachung von Störfällen.
Bezüglich der Stromversorgung stehen letztlich die Vorstände, Geschäftsführer und
IT-Verantwortlichen der Unternehmen in der Pflicht, ihre IT selbst abzusichern. Um hier auf der
sicheren Seite zu sein, sollten sie folgende Fragen für die eigene IT-Absicherung abklären:
Ist die Stromversorgung ausreichend?
Ein Rack, das randvoll mit modernen Blade-Servern bestückt ist, benötigt etwa 10 bis 20 Kilowatt
an Leistung. Hinzu kommt der Strombedarf für die Kühlung und die sonstige Infrastruktur (Licht,
Telefon, Überwachung). Die meisten Bürogebäude bieten aber nur 80 bis 90 Watt Leistung pro
Quadratmeter und stoßen somit an die Grenzen der verfügbaren Anschlussleistung im Gebäude.
Wie sieht die Notstromversorgung aus?
Vielen Unternehmen treffen zwar Vorkehrungen für den Notfall, testen aber oft die angeschafften
Geräte nicht oder konfigurieren sie unzureichend. Unterdimensionierte oder schlecht gewartete
USV-Anlagen bringen bei einem Ausfall wenig, und auch Geräte mit redundanten Netzteilen, die nicht
entsprechend angeschlossen und konfiguriert sind, helfen nicht.
Wie zuverlässig arbeitet die USV-Anlage?
Eine nicht zu unterschätzende Rolle spielt die Zuverlässigkeit der unterbrechungsfreien
Stromversogung: USV-Anlagen müssen regelmäßig gewartet und getestet werden. Kann die Anlage einen
Ausfall nicht innerhalb von neun Millisekunden auffangen, versagen die Netzteile und die Server
stehen still. Im Falle eines längeren Stromausfalls erhöht sich die Temperatur pro Serverschrank
innerhalb von drei Minuten um 12 Grad Celsius. Somit kann eine statische USV mit einer empfohlenen
Überbrückungszeit von 20 Minuten bei voller Last schnell zu einem Problem führen.
Funktioniert das Notstromaggregat?
Im Ernstfall müssen alle Systeme rechtzeitig umschalten. Wer eine dynamische USV-Anlage mit
Notstromaggregat verwendet, muss sicher sein, dass das Dieselaggregat innerhalb von 15 bis 20
Sekunden zuverlässig anläuft, um einen Stromausfall im Rechenzentrum zu verhindern.
Rechenzentrumsdienstleister sind zum Beispiel verpflichtet, ihre USV-Anlagen und Notstromaggregate
monatlich für eine Stunde mit halber Last zu testen.
Bei der Diskussion um ein ausfallsicheres Rechenzentrum darf es allerdings nicht allein um
technische Argumente gehen. Wie wichtig eine sichere Unterbringung der IT ist, zeigt unter anderem
auch die EU-Richtlinie Basel II, die Kriterien für die Bewertung der Kreditwürdigkeit eines
Unternehmens enthält. Das schlichte Fazit lautet demnach: Unternehmen sollten die Qualität ihrer
Rechenzentren in jedem Fall regelmäßig überprüfen.