Zum Inhalt springen
Praxis: Ein komplettes RZ zieht um

1000 Server unterwegs

Der Umzug eines ganzen Rechenzentrums ist alles andere als ein triviales Unterfangen. Beim Dienstleister NTT Europe gab es dabei reichlich zu bewegende Hardware - und wenig Spielraum für logistische Fehler.

Autor:Andreas Holzhammer/jos Andreas Holzhammer ist Data Center Manager bei NTT Europe Online. • 16.10.2008 • ca. 5:00 Min

Wem es in den eigenen vier Wänden zu eng wird, der schaut sich nach größeren Räumlichkeiten um. Was für Privatpersonen gilt, trifft auch auf Rechenzentren zu. Im Januar dieses Jahres fällte NTT Europe Online die Entscheidung, sein Rechenzentrum aus der Frankfurter City nach Frankfurt Nord zu verlegen, da der Hosting-Anbieter keine Möglichkeiten mehr zu räumlichen Erweiterungen sah. Ab dem Startschuss Anfang Februar liefen die Vorbereitungen: Schritt für Schritt wurde der Projektplan ausgearbeitet, das Team inklusive externer Berater formiert, die Kunden kontinuierlich mit Mailings auf dem Laufenden gehalten, bis es schließlich an einem Wochenende im Juli, abgestimmt auf das Ende der Fußball-EM, den Christopher Street Day und noch vor Beginn der olympischen Spiele soweit war: Der größte Umzug in der Geschichte von NTT Europe Online in Deutschland konnte starten.

NTT Europe Online ist eines der größten weltweit agierenden Webhosting-Unternehmen und bietet Geschäftskunden eine Bandbreite an Internetservices, wie Managed Hosting, Sicherheitsmanagement, Applikationsmanagement sowie weltweite Netzwerkdienstleistungen für die Auslieferung von Media- und Webinhalten (Content Delivery Network Services). Als Teil der weltweiten IP-Lösungsstrategie von NTT Communications ist es die Aufgabe von NTT Europe Online, Kunden mit der erforderlichen Infrastruktur zu versorgen, die diese zur Umsetzung ihrer Onlinegeschäftsaktivitäten benötigen. Ende 2007 zeichnete sich bereits ab, dass die Kapazitäten im Rechenzentrum der Frankfurter City an ihre Grenzen stoßen würden. Dies betraf neben neuen Server- und Netzwerkkapazitäten auch damit zusammenhängende Ausbauten, wie zusätzliche Kühleinheiten und einen höheren Strombedarf.

Entscheidung für Frankfurt Nord

Anstatt ein weiteres Rechenzentrum anzumieten, entschied sich das europäische Management für einen Komplettumzug und folgte damit der Empfehlung des Rechenzentrumsleiters Thomas Mitschke. Noch bevor feststand, wo das neue Rechenzentrum stehen sollte, informierte der Anbieter seine Kunden von dem Beschluss in einem Brief. Dazu Mitschke: "Mit diesem sehr frühen Kunden-Mailing Anfang Februar wollten wir unsere Kunden gleich ins Boot holen und ihnen zeigen, dass wir alles tun, um unseren Service für sie zu verbessern. Besonderes Augenmerk wurde auf die mehrfache Redundanz der Stromversorgung gelegt."

Das Thema Strom spielte auch bei der Standortprüfung eine wichtige Rolle: Die neuen Räumlichkeiten mussten neben einem größeren Platzangebot und einer redundanten Kühlung, eine dreifach redundante Stromversorgung vorweisen. Außerdem war es wichtig, im Frankfurter Raum zu bleiben, allein schon um die Ausfallzeit während des Umzugs durch einen weiten Transportweg nicht noch zu verlängern. Ende Februar stand der neue Standort fest: Frankfurt Nord erfüllte alle Bedingungen an Platz, Strom und Kühlung und lag nicht weiter als 25 km vom alten Rechenzentrum in der Frankfurter City entfernt.

Planung ist der halbe Umzug

Das zwölfköpfige Projektteam um Mitschke begann Mitte Februar mit den ersten Planungen. Bei 100 Racks, 1000 Servern und über 10.000 Kabelverbindungen, die teilweise in der zentralen Infrastruktur mündeten, teilweise innerhalb der Racks verliefen, würde, so die Befürchtungen des Teams, die Fehlerquote beim kompletten Entfernen der einzelnen Kabel und ihrem Wiederanschluss zu hoch ausfallen.

Die Lösung lag schließlich darin, immer zwei Racks gemeinsam zu transportieren und alle internen Kabelverbindungen zu belassen. Damit mussten am neuen Standort "nur" noch die Kabel zur zentralen Netzwerkinfrastruktur berücksichtigt werden, die mit circa 3500 Kabeln immer noch recht hoch lag. Aus diesem Grunde erfolgte ein Teil der Netzwerkinstallation vorab.

Für einen reibungslosen Ablauf war auch hier die Vorbereitung im Vorfeld wichtig: Neben der bereits angesprochenen Vorverkabelung der Netzwerkinfrastruktur wurde auch die Verbindung zu Konsolen-Switches oder Fiber-Patchpanels vorab gelegt. Auch das Labeling aller Komponenten (Server und Verbindungen) musste überprüft und gegebenenfalls vervollständigt werden. Natürlich musste NTT auch für die Integrität und Verfügbarkeit der Kundendaten für den Fall sorgen, dass einzelne Komponenten nach dem Umzug nicht mehr starten würden. Daher kopierten die Techniker im Vorfeld sämtliche Kunden-Filer auf ein 100 TByte großes Storage-System. Lokale Kundendaten sicherten sie ohne Ausnahme auf Band.

Ein anderer wichtiger Punkt war die Versicherung der LKW-Transporte. Ab Übergabe an die Spedition und damit ab Überschreitung der ersten Rechenzentrumsschwelle musste das Inventar gegen Raub, Unfälle etc. versichert sein. Um den vereinbarten Transportwert von einer Million Euro pro Fahrt nicht zu überschreiten, wurde die Hardware in Transporteinheiten von jeweils sechs Racks geteilt.

Ausfallzeit unerwünscht

Die Kunden von NTT Europe Online, die sich sowohl aus Großkunden wie auch aus dem Mittelstand zusammensetzen, wurden nicht nur über die Vorzüge des neuen Rechenzentrums informiert, sondern auch in verschiedenen Mailings auf den Umzug vorbereitet. NTT bot ihnen die Möglichkeit, Zeitfenster anzumelden, in denen ein Ausfall ihrer Internetpräsenz unter keinen Umständen möglich ist. Mitschke dazu: "Wir hatten etliche Kunden, die uns beispielsweise mitteilten, dass der Umzug ihrer Racks unbedingt erst nach Samstag früh drei Uhr stattfinden kann, sei es wegen Börsennotierungen oder anderen wichtigen Ereignissen." Ein gab einen genauen Zeitplan, der alle Kundenanforderungen berücksichtigte. Waren Kundenserver auf mehrere Racks verteilt, mussten diese im Vorfeld auf benachbarten Racks wandern, damit sie in einer Transporteinheit zu bewegen waren.

Komplizierter wurde es bei Shared-Storage-Systemen, also den gemeinsam genutzten Plattenspeichersubsystemen mehrerer Kunden. Dabei war erheblicher Aufwand bei der Abstimmung notwendig. Für Kunden, die gar keine Ausfallzeit tolerieren konnten, hat NTT eine verkleinerte Kopie der gesamten RZ-Infrastrukur im neuen Rechenzentrum vorgehalten. Und wer auf keinen Fall am Umzugswochenende im Juli wegen besonderer Termine eine Downtime tolerieren konnte, zog eine Woche früher um. Allen Kunden richtete man außerdem eine Maintenance-Page mit dem Hinweis auf Wartungsarbeiten während der Ausfallzeit ein.

Nachdem der Testlauf vier Wochen vor dem D-Day gut geklappt hatte, versammelte sich die erste Schicht am Freitag, den 25. Juli um 15 Uhr, um schließlich pünktlich um 20 Uhr im alten Rechenzentrum mit der Demontage zu beginnen. Die Systeme wurden sicher (per Skript) heruntergefahren und die Kabelverbindungen zur zentralen Infrastruktur gekappt. Im Doppelpack hob das Serviceteam die Racks, die jeweils bis zu 700 kg wiegen, hydraulisch an und transportierte sie über einen eigens für dieses Wochenende vergrößerten Ausgang zu den angemieteten LKWs. Insgesamt waren rund 100 Personen im Einsatz, die sich jeweils in Schichten von zehn Stunden abwechselten. Wer gerade nicht arbeiten musste, ruhte sich in einem eigens angemieteten Hotel in der Nähe des neuen Rechenzentrums aus. Nach 28 Stunden war der Umzug komplett beendet: Nach zwölf Touren haben 1000 Server, 100 Racks und um die 10.000 Kabel ein neues Zuhause gefunden. Hinzu kommt ein beträchtlicher Anteil an Ersatzteilen wie Kabel, Festplatten oder Server, der für mögliche Ausfälle vorgehalten werden musste.

Mitschke zieht ein positives Resümee: "Dank einer peniblen Vorbereitung und externer Unterstützung ist der Umzug sehr glatt über die Bühne gegangen. Es gab viel positives Feedback unserer Kunden, die vor allem den Informationsfluss im Vorfeld zu schätzen wussten." Und die Bilanz kann sich sehen lassen: Bei der abschließenden Endkontrolle waren lediglich fünf defekte Festplatten und ein Kundensystemserver auszutauschen. Bei einer Gesamtzahl von rund 4000 Festplatten ist dies ein guter Schnitt.