Im Ernstfall ist es wichtig, den Betrieb und seine Daten per Disaster Recovery schnell sichern zu können. Die Cloud hat sich für diesen Zweck bei einigen Unternehmen etabliert - doch nicht alles verläuft reibungslos. Für einen berechenbaren Prozess sollte man folgende fünf Punkte beachten.
1. Anwendungen differenzieren
Jede Geschäftsanwendung hat einen bestimmten Wert für ein Unternehmen und dementsprechend eigene Anforderungen, was die Fristen für die Wiederherstellung betrifft. Hochkritische Dienste dürfen heutzutage nicht länger als 15 Minuten ausfallen, dies sollte sich in ihren so genannten Recovery Time Objectives (RTOs) und Recovery Point Objectives (RPOs) widerspiegeln. Die RPO-Kennzahlen geben vor, wieviele Daten die Anwendung während des Ausfalls verlieren darf, während die RTOs klar festlegen, wie lange es dauern darf, bis alle Elemente der Anwendung wieder reibungslos laufen. Jede Strategie für Disaster-Recovery sollte auf Grundlage der RTOs und RPOs geplant sein. Für hochkritische Anwendung ist es notwendig, einen Data Mover oder eine Replikationstechnologie zu verwenden, damit man den 15-minütigen RPO-Zeitrahmen einhält.
2. Automatismen etablieren
Damit die Wiederherstellung über die Cloud schnell abläuft und um Ausfälle durch menschliche Fehler zu verhindern, ist es unerlässlich, Disaster-Recovery-Prozesse zu automatisieren. Mit nur einem Mausklick sollte es möglich sein, den gesamten Prozess auszulösen. Dies ist bei großen Vorfällen, ausgelöst durch Fluten oder Feuer, aus IT-Sicht entscheidend, denn unter diesen Umständen sind manche Mitarbeiter möglicherweise nicht erreichbar. Außerdem sind viele Geschäftsanwendungen kompliziert aufgebaut und zum Teil abhängig voneinander, was auf den ersten Blick im Ernstfall vielleicht übersehen wird. Fehlen Automatismen, die die ganzen Anwendungen und ihre mehreren Schichten und Abhängigkeiten bereits kennen und entsprechend berücksichtigen, kann dies zu längeren und teuren Ausfallzeiten führen. Die gesamte Wiederherstellung mit Failover, Failback und Tests sollte daher vollständig automatisiert sein.
3. Testen des Prozesses
Wer wirklich wissen will, ob der Prozess funktioniert und wie schnell er abläuft, muss ihn testen. Das ist der Schlüssel und wird in einigen Branchen wie der Finanz- und Gesundheitsindustrie in Compliance-Vorgaben vorgegeben. Um sicherzustellen, dass der Recovery-Plan funktioniert, sollten Unternehmen den Disaster-Recovery-Prozess regelmäßig testen.
4. Flexible Szenerien aufsetzen
Wer die Cloud in seiner Recovery-Strategie einbindet, sollte flexibel festlegen dürfen, mit welcher Granularität er Anwendungen und Daten wiederherstellen möchte. Sollen nur wenige virtuelle Maschinen, eine große Zahl komplexer, mehrschichtiger Anwendungen oder gleich ein ganzes Rechenzentrum umgeschaltet werden? Die Recovery-Strategie sollte diese Szenarien flexibe und simpel abbilden können.
Die Granularität bei der Wiederherstellung ist hierbei essenziell, denn sie lässt am Ende zu, ob sich der ideale Plan pro Applikation und Szenario auch im Detail umsetzen lässt, angefangen bei der Wiederherstellung einzelner virtuellen Maschinen oder Anwendung bis hin zur vollständigen Wiederherstellung ganzer Rechenzentren.
5. Eine Strategie über Cloud-Grenzen hinweg festlegen
Es ist ineffizient, für jede Cloud-Umgebung ein anderes isoliertes Werkzeug einzusetzen. Es fehlt dann der Gesamtblick, da die Tools die IT-Struktur aus Disaster-Recovery-Sicht in Einzelfragmente aufsprengen. Das Risiko für höhere Betriebskosten und längeren Ausfällen steigt.
Setzt ein Unternehmen bereits unterschiedliche Clouds ein, mehrere Geschäftsanwendungen zu hosten, ist eine umfassende Disaster-Recovery-Strategie empfehlenswert, die über alle Cloud-Grenzen hinweg greift. Dadurch steigt die Effizienz im Betrieb erheblich und die laufenden Betriebskosten sinken.
Mathias Wenig ist Senior Manager TS und Digital Transformation Specialist bei Veritas