Stromausfälle zählen zu den klassischen Notfallszenarien für IT-Infrastruktur und Rechenzentren. Technische Vorsorge für den Ernstfall ist bis zu einem gewissen Grad möglich - etwa durch USV-Anlagen und Notstrom-Generatoren. Für ein umfassendes Business-Continuity-Management sind allerdings auch ein intelligentes Power-Management für die IT sowie ein automatisier-tes Alarmierungs-Management für die Belegschaft erforderlich.
Nicht nur in den Steuerungszentralen der Energieversorger und Netzbetreiber arbeiten die Verantwortlichen mit höchster Aufmerksamkeit am Thema Stromausfall, sondern auch in den Rechenzentren sowie den Produktions-Leitständen der Industrie und der kritischen Infrastrukturbetreiber. Als Vorreiter bei den Notfallplanungen kristallisiert sich immer mehr die öffentliche Hand heraus, die vor Cyberangriffen, Stromengpässen ("Blackouts") und den Folgen von Naturereignissen warnt und auch Katastrophenpläne einfordert. Internationale Vereinbarungen verpflichten Unternehmen außerdem zunehmend zu umfassenden Vorbereitungen, Übungen und Planspielen.
IT-Risk-Management definiert dabei zu Beginn eines Evaluierungsprozesses, welche Risiken abzusichern sind und welche sich bewusst in Kauf nehmen lassen - deren Folgen also voraussichtlich beherrschbar sind. Brandschutzvorsorge und Schutzmaßnahmen für Arbeitnehmer sind gesetzlich geregelt, andere Bereiche gilt es, im elementaren Interesse des Unternehmens oder der Verwaltung abzusichern. Bei derartigen Überlegungen treten jedoch immer bekannte Phänomene der Selbsttäuschung, verzerrten Wahrnehmungen, falschen Gewichtungen oder kollektiven Irrtümer auf. Ein Blick in die Statistiken von Branchenverbänden oder in die Veröffentlichungen der Versicherer hilft dabei, objektive Entscheidungen zu treffen. Es gibt zudem bereits Versicherungsangebote, die im gewerblichen und industriellen Umfeld immer höhere Anforderungen an Sorgfaltspflichten, permanentes Auditing und Monitoring der IT-Sicherheit sowie an den Datenschutz stellen.
Disaster-Tests erforderlich, aber unbeliebt
Verschiedene Vorgaben und internationale Standards sehen schon lange verpflichtend vor, dass umfassende Planungen für zu erwartende und laut Gerichtsurteilen auch der Lebenserfahrung entsprechende Ereignisse zu treffen sind. IT-Notfall-Management-Übungen, Shutdown-/Restart-Szenarien und Disaster-Tests sollten längst Routine sein, um im Fall der Fälle einen komplikationslosen Ablauf gewährleisten zu können. Konzepte und Pläne sind im Idealfall vorbereitet und liegen in den Schubladen - im Schadensfall jedoch meist nicht mehr auf aktuellem Stand.
Natürlich sind für die Notstromversorgung USV-Anlagen im Einsatz, Dieselaggregate stehen bereit und die verantwortlichen Mitarbeiter sind Profis in ihrem Umfeld. Viel getan - soweit die Theorie. Aber die meisten Unternehmen scheuen reale IT-Disaster-Tests ebenso wie die befürchtete Katastrophe selbst. Niemand kennt den aktuellen Status der IT-Landschaft zur "Stunde null am Tag X" oder die Anfälligkeit der Hardware. Von physikalischen Berechnungen und Annahmen wie etwa Hitzeeinwirkungen auf USV-Anlagen, derzeitigem Akkustand oder der Frage, auf welchem Server virtuelle Daten liegen, hält man sich lieber fern und verschiebt den geplanten Test erst einmal.
Wenn der Notfall im Rechenzentrum eintritt
Eine gute Vorbereitung auf einen konstruierten Krisenfall ist lediglich eine erste Basis. In Form eines Notfall-Handbuchs sind dann die Parameter, Organisationsabläufe und Prozesse festgelegt. Im nächsten Schritt geht es um die automatisierte Alarmierungs- und Kommunikationskette. Ob im Notfall das IT-Team selektiv oder ob eine ganze Unternehmensbelegschaft zu alarmieren ist, darf dabei keine Rolle spielen. Gilt es dann, nicht nur die Personen zu organisieren, sondern auch konkret die Daten, Server und Anwendungen live zu migrieren oder zu verschieben, so lässt sich dies ohne IT-Werkzeuge nicht mehr realisieren.
Wenn das Rechenzentrum bereits im Notbetrieb läuft, also per USVs und Generatoren am Leben gehalten wird, sollten diese Prozeduren automatisiert ablaufen, aber immer noch Möglichkeiten zum manuellen Eingriff bieten. Es gilt, unbedingt einen Schaden an den Geräten abzuwenden, Daten zu sichern oder zu evakuieren sowie einen Überblick über ein womöglich weit entferntes Geschehen zu behalten. Zusammenfassend lässt sich feststellen, dass ein funktionierendes Business-Continuity-Management auch eine Software für automatisierte Shutdown- und Restart-Szenarien erfordert, um Daten- sowie Zeitverluste zu minimieren. Denn zunehmend spielt das komplexe Thema eines "raschen und komplikationslosen Wiederanlaufs" eine wichtigere Rolle.
Power-Management für geordnetes Herunterfahren
Viele Szenarien können es erforderlich machen, die unternehmenskritischen Daten, aber auch die zugrunde liegende IT-Infrastruktur zu schützen, indem man diese herunterfährt. Jede Produktionsmaschine, jedes Kraftwerk und jede komplexe Anlage lässt sich auf Knopfdruck ein- und ausschalten. Genau dies ist im IT-Umfeld ebenfalls möglich, wenn sich Applikationen, Server, USV-Geräte und Sensoren überwachen lassen und eine umfassende Logik implementiert ist, die Abhängigkeiten berücksichtigt und zudem komplexe "Wenn, dann"-Überlegungen einbeziehen kann.
Auch für USV-Testszenarien, für komplette RZ-Ausfallübungen und Dieselaggregat-Probeeinsätze sollten Verantwortliche ein leistungsfähiges Power-Management ins Auge fassen. Wenn speziell Außenstellen dazu neigen, öfter stromlos zu werden, und somit auch Datenverlust droht, lässt sich dort eine autonome USV-Shutdown-Logik wie beispielsweise das Powernode-System von Iqsol installieren. Dieses sorgt auf einfache Weise dafür, dass ein geordnetes Herunterfahren jeglichen Schaden verhindert, selbst wenn keine IT-Profis zu diesem Zeitpunkt vor Ort sind.
Integratives Konzept für IT-Notfallplanung
Die Praxis zeigt, dass zwar Planungen für Katastrophenfälle, direkte IT-Angriffe und auch Compliance-Anforderungen vorliegen sowie teilweise entsprechende Maßnahmen getroffen sind. Unzulänglichkeiten, Kaskadeneffekte oder organisatorische Fehlleistungen werden aber oft nicht berücksichtigt, oder die Verantwortlichen stellen derartige Überlegungen aus Kostengründen nur schrittweise oder gar nicht an. Ein integratives Konzept für eine IT-Notfallplanung ("Business-Continuity-Management") sollte daher folgende Themen umfassen:
IT-Notfallhandbuch,
zentrales IT-Security-Information-Management ("SIEM und Vulnerability-Management"),
integrierte Honeypot-Systeme,
IT-Alerting/Emergency-Response-Management-System sowie
IT-Shutdown- und Restart-Management ("Power-Management").
Da sich auch die Anforderungen permanent ändern, die Personalressourcen beschränkt und das komplexe Know-how oft nur zeitlich begrenzt erforderlich sind, kann es sinnvoll sein, derartige Leistungen als IT-Managed-Security-Services außer Haus zu geben und in die Hände vertrauenswürdiger, am besten europäischer Softwarehersteller und deren Partner zu legen. Klar ist dabei, dass eine sorgfältige Auswahl bereits die wichtigste Grundlage darstellt für eine eher turbulentere IT-Zukunft.