Hochverfügbarkeit und Redundanz kosten Geld - meist zu viel, wenn ein RZ-Kunde aus Unkenntnis eine falsche Sicherheitsklasse wählt. Sowohl Betreiber als auch Nutzer profitieren von flexiblen Ansätzen.
Das Unternehmen Databurg betreibt seit zehn Jahren ein Rechenzentrum mit derzeit rund 15.000
Quadratmetern ausgebauter und im Betrieb befindlicher Housing-Fläche. Das Ziel, möglichst nah an
den sich wandelnden Kundenbedürfnissen zu bleiben, führte unter anderem zu einem mehrstufigen
Sicherheitsmodell, um die Infrastrukturleistungen in der Umgebung anforderungskonform und
wirtschaftlich – je nach Kundentyp – angemessen anzubieten.
Nach einem Maximum an Verfügbarkeit der Versorgungseinheiten und Anbindung der Rechenzentren zu
streben, war jahrelang das Postulat großer professioneller Rechenzentrumsbetreiber und ein
wichtiges Qualitäts- und Leistungsmerkmal. Dieser Ausbau ist mit hohen Investitionen in den
gesamten Versorgungspfad mit seinen redundanten Anlagen für die Stromversorgung und Klimatisierung
sowie auch für die gedoppelte Infrastruktur für die beteiligten Versorgungswege und die
Netzanbindung verbunden.
Ein derartig hohes Sicherheitsniveau durchgängig in den Rechenzentren zu konzipieren und
anzubieten, ist nicht mehr zeitgemäß, denn ein maximaler infrastrukturseitiger Schutz vor
Ausfallsicherheit ist nicht für alle Unternehmen notwendig. Unterschiedliche Anforderungen an die
Verfügbarkeit lassen sich durch eine Variation der Redundanz der Versorgungsinfrastrukturen und
-wege anforderungskonform und im Kundeninteresse wirtschaftlicher gestalten. Für ein niedrigeres
Verfügbarkeitsniveau bezahlen Kunden, die einen Housing-Bereich ohne Redundanz der
Versorgungseinheiten für den Betrieb ihrer IT-Systeme als ausreichend empfinden, entsprechend
weniger Miete.
Abhängig vom Unternehmen und bezogen auf einzelne Anwendungen und Daten ist die Anforderung an
Verfügbarkeit der IT-Systeme unterschiedlich. Unternehmen haben grundsätzlich – bezogen auf die
Größe und Art ihres operativen Geschäfts – verschiedene Anforderungen an die Funktionalität und die
Verfügbarkeit ihrer IT-Systeme. Es gibt eine große Kundengruppe, bei deren Geschäftsmodell die
Ausfallsicherheit der IT-Systeme für die Existenzsicherung des Unternehmens maßgeblich beteiligt
ist. Bei der differenzierten Risikobeurteilung müssen alle Restrisiken bekannt sein. Zudem ist zu
bewerten, inwieweit einzelne davon vertretbar sind. Für die Risiken, die eine ernste Bedrohung
darstellen, müssen Risikokompensationsmaßnahmen aufgesetzt werden. Banken und Finanzdienstleister,
die im Rahmen von Business-Continuity-Management eine Backup-Lösung betreiben, erwarten für ihre
redundanten IT-Systeme eine Hochverfügbarkeit im externen Rechenzentrum wie in den eigenen
Räumlichkeiten.
Junge- und mittelständische Unternehmen hingegen, die eine gewisse Downtime von Anwendungen oder
temporär keinen Zugriff auf Daten vertreten können, ohne das Unternehmen zu gefährden oder sogar
Regressverpflichtungen gegenüber Dritten bei einem Ausfall zahlen zu müssen, können ihre Server in
einer weniger anspruchsvollen Rechenzentrumsumgebung betreiben. Dafür müssen diese Kunden auch
entsprechend weniger für das Outsourcing bezahlen als jene, die eine maximale Verfügbarkeit
anstreben. Somit ist eine skalierte Rechenzentrumsinfrastruktur für unterschiedliche Kundengruppen
vor allem ein faires Outsourcing-Modell. Der Kunde bestimmt die individuellen Anforderungen für die
gewünschte Verfügbarkeit selbst. Dem Rechenzentrumsbetreiber obliegt die Aufgabe, die Umgebung in
der gewünschten Verfügbarkeitsklasse wirtschaftlich zu gestalten und in einem übergeordneten
Projekt-Management in der Colocations-Fläche umzusetzen.
Klassifizierung der Verfügbarkeit
Der Outsourcing-Markt ist von einem Zusammenwachsen der Informationstechnik und des
Facility-Managements für die Sicherung der Hochverfügbarkeit innerhalb der Rechenzentren geprägt.
Eine Planung der Infrastruktur und der laufende Betrieb der Versorgungseinheiten sollten unter
Berücksichtigung ökonomischer und ökologischer Effekte in unterschiedlichen Szenarien umgesetzt
sein. Bei der Konzeption und dem Ausbau von Rechenzentrumsflächen ist eine Unterscheidung nach der
branchenüblichen Tier-1- bis -4-Klassifizierung der Komponenten gegeben. Der niedrigste Wert eines
einzelnen Gewerks – dazu gehören Stromversorgung, Kühlung, Technik und Überwachung – bestimmt
die gesamte Bewertung. Diese Taxierung bezieht sich auf die jeweilige Redundanz der
Versorgungseinheiten und -wege.
Ein Risiko-Management in einem Rechenzentrum bedingt folgende Schritte:
Aus Sicht von Databurg sind die Klassen Tier 1 und Tier 3 die sinnvollste Skalierung für einen
differenzierten operativen Rechenzentrumsbetrieb. Eine reduzierte Tier-1-Rechenzentrumsausstattung
ist für kleinere und junge Unternehmen angemessen, deren IT primär die Abbildung interner Prozesse
stützt. Die im Einsatz befindlichen Anwendungen sind geschäftsunkritisch. Die Internet-Präsenz hat
eine rein repräsentative Image- und Informationsaufgabe. Auch kleinere Unternehmen, deren
Kundenbetreuung kein rechnergestütztes Customer-Relationship-Management benötigt, fallen in diese
Kategorie.
Storage-Funktionen sind für dieses Ausfallniveau eine typische Anwendung, wobei Daten zum
Beispiel einmal am Tag abgerufen oder gesichert werden, sowie E-Mail- und Print-Dienste.
Unternehmen, deren IT-Systeme nur 5,5 Tage pro Arbeitswoche aktiv im Einsatz sind kommen mit einer
Infrastruktur mit Tier 1-Topologie aus.
Das Konzept von Cloud Computing (siehe Artikel auf Seite 26) ist eine mittlerweile verbreitete
Struktur, bei der die Anwendungen und ihre Verfügbarkeit über mehrere Standorte abgebildet werden.
Über den Verbund der Cluster-Lösung spielt die hohe Verfügbarkeit des einzelnen Standorts eine
untergeordnete Rolle. Das Modell ist heutzutage interessant, da die Preise für Hardware und für die
Anmietung von Leitungskapazitäten gesunken sind. Dabei gilt es dann, die Opportunitätskosten für
die Anmietung von Rechenzentrumsfläche gegenüberzustellen. Das wäre bei einem typischen
Tier-3-Standard und Einbezug von mehreren Standorten zu aufwändig. Mit einer
Tier-1-Infrastrukturumgebung ist es hingegen ein wirtschaftlich interessantes Modell. Bei Ausfall
eines Servers oder sogar Standorts kann ein anderer Rechenzentrumsstandort ohne Downtime die
Funktion nahtlos übernehmen.
Tier-Klassen
Das Uptime-Institut (www.uptimeinstitut.org) hat eine allgemeine Klassifizierung in den Stufen
Tier 1 bis 4 definiert. Eine Tier 1-Konzeption besteht aus einem System und einzelnen, nicht
redundant ausgelegten Versorgungspfaden, die zum Rechnerequipment des Standortes führen. Es gibt
keine räumliche Trennung zu anderen Systemen. Die Tier-1-Klassifizierung vom Uptime-Institut sieht
keine redundanten Komponenten vor, so gibt es auch nur eine unterbrechungsfreie Stromversorgung in
Form einer USV-Anlage. Für die Versorgung der Lasten während der Wartung existiert ein interner
USV-Bypass. Eine Wartung, die auf jeden Fall einmal im Jahr für die Sicherung der Betriebsfähigkeit
der Systeme erforderlich ist, kann in der Regel nicht ohne Umschaltung auf das ungesicherte
Stromnetz und der damit verbundenen Risiken erfolgen.
Um einen möglichen Defekt in der Versorgungsleitung zur USV zu kompensieren, bedarf es einer
zweiten Versorgungsquelle wie zum Beispiel eines Dieselgenerators, der automatisch startet, wenn es
zu einer Unterbrechung der Stromversorgung kommt. Generell führt bei dieser Konzeption ein Fehler
einer Versorgungskomponente oder eine Beeinträchtigung der Verfügbarkeit des Versorgungspfads zu
einer Störung des Rechnerbetriebs. Das Uptime-Institut gibt hier eine zu erwartende
Verfügbarkeitsobergrenze von 99,67 Prozent an.
Infrastrukturumgebung für anspruchsvolle Anforderungen
Die Tier-3- und Tier 4-Ausstattung von Rechenzentren bietet eine maximale Ausfallsicherheit für
geschäftskritische Anwendungen wie beispielsweise SAP-basierende Leistungen, Backup-Lösungen oder
auch Entwicklungsumgebungen. Ein so garantiertes Ausfallsicherheitsniveau von mehr als 99,98
Prozent gemäß des Uptime-Instituts brauchen Unternehmen, deren Daten einen hohen Unternehmenswert
darstellen und deren Anwendungen unternehmenskritisch sind. Dazu gehören Dienstleister, die für
ihre externen Kunden rund um die Uhr eine Betriebsbereitschaft erbringen müssen, die aber bei einem
Ausfall der Rechner über eine Backup-Lösung anderweitig erreichbar und arbeitsfähig sind.
IT-Systeme werden für elektronische Geschäftsprozesse genutzt. Bei Wartungsarbeiten und anderen
Ereignissen, die eine Ausfallzeit mit sich bringen, besteht keine Beeinträchtigung der Leistungen
für die Kunden. Bei einer Tier-3-Konfiguration gibt es zwei Server, die jeweils zweifach angebunden
sind. Wenn ein Server gewartet wird, bleibt der zweite Server in Betrieb und hat als zusätzliche
Sicherheitskomponente selbst noch eine doppelte Versorgung.
Für den Ausgleich von Netzausfällen gibt es unterschiedliche Lösungen. Ist dieser im Sekunden
oder Minutenbereich angesiedelt, können Batterien für die Stromversorgung eingesetzt werden, oder
ein Kondensator speichert Energie und liefert diese im Störungsfall als Überbrückung. Alternativ
fahren die an eine USV angeschlossenen Server – über eine Software initiiert – gezielt herunter.
Wenn eine USV ausfällt, gibt es einen zweiten Versorgungsweg. Ein alternativer Versorgungsweg
erlaubt eine Wartung mit einer geringen Mean-Time-To-Repair (MTTR), da der Betrieb nicht
beeinflusst wird. Die getrennten Versorgungswege sind über statische Transferschalter mit der
Verbrauchsquelle verbunden, sodass eine Umschaltung jederzeit für eine Wartungsphase möglich ist.
Die Tier-3-Ausstattung ist die am meisten verbreitete Redundanzform in den professionellen
Rechen-zentren.
Vorteile eines Multi-Tier-RZ-Designs
Es kommt bei einer Vielzahl von Unternehmen immer wieder vor, dass die IT als strategische
Entscheidung zentralisiert und auch wieder dezentralisiert wird.
Databurg setzt nach eigenen Angaben als einer der ersten Anbieter ein Multi-Tier-Design um,
damit die Kunden, die eine geringere Verfügbarkeit akzeptieren können, im Gegenzug
Outsourcing-Kosten sparen. Diese Maßnahme steigert für die Kunden, aber auch für den Betreiber die
Effizienz im Rechenzentrumsbetrieb und schafft über den weitergegebenen Kostenvorteil
Kundenbindung. Es gibt in diesem Fall keinen Zielkonflikt zwischen Redundanz und Energieeffizienz,
da die Infrastruktur angepasst ist und der Nutzer weiß, was er an maximaler Verfügbarkeit für
welche Systeme und Anwendungen zu erwarten hat. Dies wirkt sich insgesamt positiv auf die
Investitionen in die angemessene Infrastruktur und den Energieverbrauch aus.
Differenzierter RZ-Betrieb erfordert ein Umdenken
Die IT-Planer für jede Form von Software und Anwendung, wie beispielsweise Windows, Unix oder
Linux, müssen bereits in der Planungsphase klassifizieren, was hochverfügbar sein muss und welche
IT-Systeme und Anwendungen graduell weniger hochverfügbar laufen können. Für Unternehmen folgt
daher zukünftig ein Umdenken, weg von dem Anspruch, seine gesamte IT-Landschaft komplett in einem
Rack oder Cage oder eine Suite beim Outsourcing zu betreiben. Die Erfahrung lehrt, dass es in
diesem Punkt einen gewissen Beratungs- und Überzeugungsbedarf gibt, um die Unternehmen dahin zu
führen, einen klassifizierten und differenzierten Ansatz beim Outsourcing für ihre IT-Landschaft zu
fahren. Die Projekt-Manager der Anbieter unterstützen die Kunden dabei, ihre Anwendungen nach dem
Sensibilitätsgrad und der entsprechend benötigten Verfügbarkeit zu klassifizieren. Die
Verantwortlichen auf Kundenseite stehen also schon in einer frühen Planungsphase mit den
Projekt-Managern der Anbieter in einem Dialog, um die IT-Landschaft konkret zu analysieren und den
Rechenzentrumsklassifizierungen entsprechend zuzuordnen.
Für den operativen Betreib heißt dies, dass innerhalb des Rechenzentrums Applikationen mit
ähnlichen Anforderungen in jeweiligen Rechenzentrumszonen mit Tier-1- oder Tier-3-Versorgung und
angepasster Skalierung der Redundanz der Infrastruktur laufen können. Ein Netzwerkknoten für den
europaweiten Datenverkehr steht beispielsweise in einer Suite mit Tier-3- bis Tier-4-Standard. Die
Server der Kunden, die daran angeschlossen sind, um ihren Datenverkehr über den Netzwerkknoten zu
transportieren, stehen in einem anderen separaten Raum. Dabei kann es wieder eine Differenzierung
von Tier 1 bis 3 in separate Suites geben.