Problem- und Change-Management

Wie Virtualisierung das ITSM unterstützt

6. Juli 2011, 6:00 Uhr | Daniel Baby/wg, Technical Sales Consultant bei Arrow ECS

Die Virtualisierung der IT-Welt schreitet weiter fort. Mehr Leistung, mehr Kapazität, mehr Connectivity - das sind die zentralen Anforderungen. Zudem lockt der Einsatz von Virtualisierungstechnik mit Kosteneinsparungen und Effizienzsteigerungen bei hoher Dynamik des Rechenzentrums. Ausgangspunkt ist eine Strategie und saubere Planung mit gut definierten Prozessen. Das hört sich nach etwas Selbstverständlichem an, doch wie bei jeder Anwendung komplexer Technik können Risiken auftreten, die es zu bedenken gilt.Die Best Practices aus ITILv3 (IT Infrastructure Library Version 3) zur Umschreibung einer möglichen Umsetzung des IT-Service-Managements (ITSM) haben gerade im IT-Umfeld vielfach für steigende Transparenz und Effizienz der benötigten Prozesse gesorgt. Nun ist es an der Zeit zu prüfen, wie das durch ITIL Erreichte im Betrieb virtueller Umgebungen umzusetzen ist und welche neuen Herausforderungen hier zu meistern sind.

ITIL wird in vielen Unternehmen zuallererst mit dem Incident-Management-Prozess assoziiert, also mit dem dazu nötigen Helpdesk für die kurzfristige Behebung von Incidents (Störungen).

Das Incident-Management soll hier der Vollständigkeit halber erwähnt sein, doch konzentriert sich dieser Beitrag auf die beiden bekannten ITIL-Prozesse Problem- und Change-Management. An ihrem Beispiel soll skizziert werden, wie eine IT-Organisation mit den Anforderungen und Funktionen für Best Practices wirkungsvoll umgehen kann.

Das Problem-Management gehört zur Phase Service-Operation aus dem ITIL-Service-Livecycle. Service Operation beschreibt kurz gesagt den Betrieb und Support der Services. Bei den Service-Operation-Prozessen handelt sich praktisch um das Tagesgeschäft der Systemadministratoren und des IT-Betriebs im Allgemeinen.

Das Problem-Management dient dabei der nachhaltigen Lösung und Vermeidung von Störungen (Incidents) sowie der proaktive Analyse aufgetretener Fälle. Aus dieser Analyse und der Ursachenforschung entstehen typischerweise Veränderungen (Changes), woraus sich nach ITIL so genannte Requests for Change (RFCs) ergeben. Eine nachhaltige Lösung im Rahmen des Problem-Managements wird also mittels eines geplanten Changes implementiert.

Change-Management

Das Change-Management gehört zur Phase Service-Transition aus dem ITIL-Service-Livecycle. Service-Transition beschreibt die Phase, in der die IT Services entwickelt, verbessert und geordnet in den Betrieb übergibt. Dies umfasst neben dem schon aus ITILv2 bekannten Change-Management unter anderem auch das Service-Asset- and Configuration-Management sowie planerische Kernkompetenzen (Transition Planning and Support).

Problem- und Change-Management gehören im IT-Umfeld zu den am häufigsten umgesetzten ITIL-Prozessen. Nun stellt sich die Frage, inwieweit die Virtualisierung einen Einfluss auf etablierte Prozesse hat, welche Funktionen der Virtualisierung diese Prozesse direkt unterstützen und welche unter Umständen ein Umdenken erforderlich machen.

Problem-Management virtuell

Betrachten wir zunächst das klassische Problem-Management. Leider verwechseln es manche immer noch mit dem Incident-Management nach ITIL. Daher sei noch einmal erklärt: Es geht um das nachhaltige Lösen von Incidents, kurzfristige Störungsbehebungen sind eher als Workarounds zu betrachten. Am schwierigsten ist dabei oft das Nachstellen des Störfalls. Es gestaltet sich nicht einfach, ein produktives System zum Problem-Management heranzuziehen, meist ist das im Live-Betrieb während der Hauptgeschäftszeiten kein gangbarer Weg. In einigen Fällen ist dies völlig unmöglich, vor allem, wenn die Herbeiführung des zugrunde liegenden Incidents zu starken Beeinträchtigungen der Services oder gar zum Absturz des gesamten Systems führen könnte.

Virtualisierung als praktisches Hilfsmittel

Gerade in solchen Fällen ist Virtualisierung die prädestinierte Lösung - vorausgesetzt, es stehen genügend Ressourcen im virtualisierten Rechenzentrum zur Verfügung. Dann kann die IT-Abteilung den Service oder Teile daraus clonen und so separate Analyse-VMs erstellen, um mit diesen völlig ungestört zu arbeiten. Da man hier praktisch mit Originaldaten umgeht, entfällt der mühsame Aufbau einer halbwegs analogen Testumgebung parallel zur Produktion.

Ein weiteres Hilfsmittel sind Snapshots von VMs. Diese helfen während der Analysephase als auch bei der Erstellung der Lösung und deren Test. Des Weiteren lässt sich, wenn das Produktivsystem dies zulässt, auch hier der fehlerhafte Zustand einfrieren, kopieren und anschließend weiter analysieren. Gegebenenfalls kann man diese Möglichkeit auch dem Helpdesk zur Verfügung stellen. Dieser kann sozusagen den Incident-Zustand einfrieren und anschließend einen Workaround suchen und den Incident auflösen, ohne den Störungszustand zu verfälschen. Vorsicht ist allerdings vor einem Snapshot-Wildwuchs in der Produktion geboten.

Allein diese wenigen Hinweise zeigen, dass die Virtualisierung dank Entkopplung von der darunterliegenden Hardware einige hilfreiche Möglichkeiten bietet, die das Problem-Management vereinfachen. Dieses betrifft weniger die eigentliche Analyse, als vielmehr die oft extrem aufwändige Bereitstellung einer Analyseumgebung. Durch den Einsatz von VMs (Virtual Machines) kann man leicht am Clone des Originals forschen und auch Analysestände archivieren, ohne die ursprüngliche Umgebung in irgendeiner Weise zu beeinflussen. Theoretisch kann ein Unternehmen eine fehlerhafte Umgebung damit sogar einem Softwarehersteller für entsprechende Analysen zur Verfügung stellen. Dabei ist natürlich der Datenschutz zu beachten.

Für das Problem-Management der Virtualisierungsplattform selbst stellt die Virtualisierung ebenfalls eine Vereinfachung dar. Da der Systemadministrator jeden physischen Host mit Hypervisor isolieren und die normalerweise darauf laufenden VMs auf andere Hosts migrieren oder kopieren kann, sind auch hier gefahrlose Forschungen und Untersuchungen für das Problem-Management möglich.

Change-Management virtuell

Im Change-Management-Prozess gibt es mehrere Möglichkeiten, Anforderungen durch Virtualisierung einfacher abzubilden. Ein Change ist nach ITIL jede Veränderung, die man an einer bestehenden Produktivumgebung durchführt. Dies betrifft nicht nur das klassische Patchen, sondern auch Konfigurationsänderungen sowie das Einbringen neuer Services oder das Ausphasen von Services, die nicht mehr benötigt werden. Laut ITIL muss jeder Change eine Möglichkeit aufzeigen, wie dieser im Fehlerfall wieder rückgängig gemacht werden kann. Das ist aber bei Betriebsystem-Changes, die auf Hersteller-Patches beruhen, extrem aufwändig. Doch innerhalb von VMs kann der Systemadministrator mit einem Snapshot arbeiten, den er vor einem Change erzeugt. Im Fehlerfall kann er darauf zurückgreifen. Sind nach einer gewissen Zeit (maximal zwei bis drei Tagen) keine Incidents aufgetreten, die auf diesen Change zurückgehen, ist der Snapshot wieder aufzulösen.

Fast alle Virtualisierungsplattformen bieten mächtige Skript- und Command-Line- Schnittstellen, über die derartige Aktionen auch im großen Stil überschaubar bleiben. Durch die Flexibilität, welche die Virtualisierung grundsätzlich bietet, können Administratoren viele Probleme im Prozess der Change-Entwicklung schon leicht und reproduzierbar erkennen und im tatsächlichen Change-Rollout vermeiden. Für die Virtualisierungsplattform selbst gestaltet sich ein Change und sogar ein Emergency Change oft recht einfach. Denn viele Lösungen bieten die Möglichkeit, eine Hochverfügbarkeitsumgebung mit mehreren Hypervisor-Hosts zu erstellen. Kommt es zum Ausfall eines Hosts, starten die VMs auf den verbleibenden Hosts automatisch neu. Der Aufwand für die Einrichtung einer Hochverfügbarkeitsumgebung kann sich also schnell lohnen.

Im Falle eines Changes bieten einige Plattformen die Möglichkeit, virtuelle Maschinen im laufenden Betrieb von einem physischen Host auf einen anderen zu verschieben (VMware Vmotion, Microsoft Live Migration usw.). Somit kann der Systemverwalter einen physischen Host für einen Change "leerräumen", in den Wartungsmodus versetzen und entsprechend dem Change bearbeiten. Nach erfolgreichem Change migriert er die VMs mit den gleichen Mitteln zurück. Hier bieten einige Hersteller sogar Load Balancer an, die selbsttätig eine ausgeglichene Plattform erstellen (zum Beispiel VMware DRS). Zudem existieren Hilfsmittel und Funktionen, um VMs je nach Situation sogar im laufenden Betrieb von einem Storage-System auf ein anderes zu verschieben. Dies ermöglicht für die VMs unterbrechungsfreie Changes an den Storage-Systemen.

Zusammenfassung

Wie die beiden zentralen ITIL-Prozesse Problem- und Change-Management zeigen, bietet die Virtualisierungstechnik etliche Vorteilen durch Standardfunktionen, die in fast allen Virtualisierungsplattformen vorhanden sind: Die Funktionen, welche die oft genannte Dynamik und Flexibilität im virtuellen Rechenzentrum ermöglichen, unterstützen und vereinfachen auch viele ITIL-Prozesse.

Die Entwicklung von Cloud Computing im geschäftlichen Umfeld bringt immer neue leistungsfähige Workflow- und Management-Lösungen als Add-ons zu den Virtualisierungsplattformen hervor. Diese lassen sich sehr gut für eine saubere, ITIL-konforme Prozessimplementierung nutzen. Die Automatisierungsmöglichkeiten, Freigabe- und Bestätigungsfunktionen innerhalb der Workflows ermöglichen es, viele sinnvolle, wenn auch in manchen Fällen ungeliebte von ITIL geforderte Schritte zu implementieren. Dies erleichtert es, neue vielversprechende Lösungen einzuführen und dabei entstehende Risiken in den Griff zu bekommen.

Die genannten Beispiele aus dem Problem- und Change-Management mögen trivial sein; sie zeigen aber allein schon in ihrer Einfachheit, welche Änderungen möglich und notwendig sind, um das Leben der IT deutlich zu erleichtern. Nimmt man weitere ITIL-Prozesse in Verbindung mit Virtualisierungsfunktionen unter die Lupe, so ergeben sie oft völlig neue Ansätze, die ITIL-Prozesse mit Leben zu füllen. Genannt seien hier die Zusammenfassung von ganzen Services zu Containern, die komplett konfiguriert und installiert sind (zum Beispiel VMware Vapps oder OVF-Container), oder die Entkopplung des physischen Speichers durch Storage-Virtualisierung (zum Beispiel mit Datacore oder Falconstor und anderen). Die Voraussetzung für den Erfolg ist, dass alle Prozesse genau durchdacht, implementiert und dokumentiert sind, sodass für alle Beteiligten eine hohe Akzeptanz erreicht wird. Dann ist ITIL erfolgreich in der virtuellen Welt angekommen.

Der Autor auf LANline.de: dbabline

Ein Unternehmen kann bei einem Incident eine geklonte VM zur Fehleranalyse an den Hersteller der betroffenen Softwarelösung weitergeben. Bild: Arrow ECS

Snapshots erlauben es, den Zustand eines Incidents zu konservieren. So lässt sich ein Workaround erarbeiten, wobei der Incident für das Problem-Management nachvollziehbar bleibt. Bild: Arrow ECS

Laut ITILv3 sind das Change- und das Problem-Management wesentliche ITSM-Prozesse aus den Bereichen Service-Transition beziehungsweise Service-Operation. Bild: Arrow ECS
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Imperva

Matchmaker+