Intelligente Softwareunterstützung für das Incident-Management kann die Systemadministratoren spürbar entlasten und gleichzeitig die Qualität der IT-Services steigern. Dreh- und Angelpunkt ist der Service-Desk, bei dem alle Informationen zusammenlaufen, hilfreiche Fakten abrufbar sind und adäquate Maßnahmen zur Behebung und Vermeidung von Störungen eingeleitet werden. Vieles lässt sich hier automatisieren oder an die Endbenutzer delegieren.
Kundendienst und Service gelten heutzutage als wichtige Wettbewerbsfaktoren. Das gilt speziell
auch für IT-Dienstleister, seien es nun unternehmensinterne Rechenzent-ren oder externe
Application-Service-Provider oder Outsourcer. Deshalb ist der Einsatz von Software-Tools sinnvoll,
um die Servicequalität zu steigern, dabei aber den nötigen Aufwand in vertretbaren Grenzen zu
halten. Im Idealfall kommt man so zu "selbstheilenden" Diensten (Self-Healing Services), begleitet
von Selbstbedienungs-(Self-Service-)Prozessen.
Gleichzeitig werden im Netzwerk- und Systemmanagement zunehmend Best Practices wie ITIL (IT
Infrastructure Library) Pflicht, deren Implementierung die IT-Experten vielfach vor Probleme
stellt. Denn zum einen ist Veränderung nie einfach, erst recht nicht, wenn sie im laufenden Betrieb
und ohne Nebenwirkungen an fundamentalen Prozessen erfolgen soll. Zum anderen sehen oft gerade die
erfahrenen Techniker keine zwingende Notwendigkeit für eine solche Änderung, weil sich Vorteile
einer Prozessumstellung im Vorfeld mitunter nur schwer transparent machen lassen. Allerdings bringt
die ITIL-Praxis dann meistens sehr schnell deutliche Verbesserungen bei Verfügbarkeit und
Performance und entlastet die IT-Abteilung von stressigen Routinearbeiten.
Oft sind gerade die ersten Schritte in Richtung ITIL nicht einfach. Es empfiehlt sich, mit der
ITIL-Implementierung am Service-Desk zu beginnen. Dafür sprechen mehrere Gründe: Das
Incident-Management ist als organisatorischer und technischer Prozess der Reaktion auf erkannte
oder vermutete Sicherheitsvorfälle und -störungen in IT-Bereichen in der Regel ohnehin schon gut
definiert. Diese Prozesse ähneln meistens schon den ITIL-Praktiken, sodass die notwendigen
Änderungen überschaubar bleiben. Zudem bleiben Prozessänderungen auf das Support-Team
beschränkt.
Allerdings bedeutet Incident-Management à la ITIL mehr und nicht etwa weniger Arbeit am
Service-Desk. Denn das Spektrum möglicher Vorfälle (Incidents) reicht von technischen Problemen und
Schwachstellen bis hin zu konkreten Angriffen auf die IT-Infrastruktur. Ziel des
Incident-Managements ist dann die schnellstmögliche Wiederherstellung der Serviceleistung. Das kann
durch die automatische Einleitung der Gegenmaßnahmen (Stichwort: Self-Healing) erfolgen, aber auch
über die detaillierte Information des zuständigen Administrators inklusive des Vorschlags
praktikabler provisorischer Lösungen (Workarounds) oder über die gezielte Unterstützung des
betroffenen Endbenutzers, der das Problem dann in Eigenregie behebt (Self-Service).
Für Mehrarbeit am Service-Desk im Zusammenhang mit ITIL sorgen vor allem zwei Tatsachen: Erstens
ist mit Blick auf die notwendige Compliance (Einhaltung gesetzlicher oder branchenspezifischer
Vorschriften) eine adäquate Dokumentation aller Vorgänge und Maßnahmen gefordert. Zweitens ist der
Begriff "Incident" hier weiter gefasst. Gemeint ist neben der reinen Störungsbearbeitung auch die
Reaktion auf jedes andere Ereignis, das mit IT zu tun hat – insbesondere alle Anfragen an den
Helpdesk oder Service-Desk. Zu solchen Incidents zählt zum Beispiel auch der Antrag zur Beschaffung
eines neuen PCs oder die Anfrage zur Veränderung einer bestimmten Software. Trouble Tickets
dokumentieren die Incidents. Für deren Erstellung oder Entgegennahme ist der Service-Desk ebenso
zuständig wie für die Überwachung der Ticket-Bearbeitung.
Der Service-Desk ist damit der Dreh- und Angelpunkt einer ITIL-Implementierung. Deshalb ist
wirkungsvolle Unterstützung durch Software entscheidend, um mit deren Hilfe die
Incident-Managementprozesse vereinheitlichen und vereinfachen zu können – zumal, wenn angrenzende
Bereiche wie Problem- und Change-Management eingebunden sind. Aber auch Themen wie
Inventarisierung, Fernwartung oder Softwareverteilung sollten integrierbar sein, sodass möglichst
wenig manuelle Eingriffe anfallen. Hilfreich ist zudem eine zentrale Managementdatenbank (MDB), in
der die gesamte Infrastruktur für das IT-Service-Management (ITSM) erfasst und abgebildet ist.
Der Ablauf am Service-Desk sieht dann so aus: Entweder meldet ein Mitarbeiter eine Störung, zum
Beispiel per Telefon, oder die Netzwerk- und Systemmanagementsoftware eröffnet regelbasiert ein
Trouble Ticket. Die Abarbeitung der Vorfälle unterliegt Prioritäten: Kritische Meldungen können
direkt entsprechende Eskalationsroutinen für das Problem-Management auslösen. Vier Hauptziele
lassen sich damit erreichen:
1. Höhere Servicequalität durch das Vermeiden, Erkennen und Beheben von IT-Problemen, bevor
diese überhaupt die Arbeit der Anwender stören können. Dazu kommen Automatismen in der
Systemverwaltung zum Einsatz.
2. Bessere Kostenkontrolle, da die Techniker dank der Automatismen weniger Zeit in
Fehlerdiagnose und -behebung investieren müssen. Es geht folglich nicht nur weniger Arbeitszeit von
Anwendern und Administratoren verloren, sondern die Zahl der Anfragen an den Service-Desk sinkt
ebenso wie die Notwendigkeit für Rückfragen und weiter gehende manuelle Analysen.
3. Weniger Risiken durch ständiges Monitoring kritischer Systeme. So kann zum Beispiel bei
Problemen ein Auto-Update erfolgen, um neue Software aufzuspielen oder Systemeinstellungen zu
korrigieren.
4. Gezielte IT-Investitionen in Bereiche, die in Reports wiederholt als Störungsursache
auftauchen.
Selbstheilungsmechanismen im Service-Support ergänzen also die unverzichtbare Automation durch
Scripting und Workflows sowie den möglichst reichhaltigen "Werkzeugkasten" mit Tools zur
Problemanalyse und Fehlerbehebung. Wenn eine solche Software webbasiert arbeitet, lässt sie sich
einfach in eine vorhandene Service-Desk-Infrastruktur einbauen. Dies senkt auch den
Ressourcenverbrauch und ermöglicht automatische Updates.
Um solche Selbstheilungskräfte der Support-Organisation freizusetzen, ist auf jedem Desktop ein
schlanker Softwaremonitor notwendig, der permanent die zentralen Systemeigenschaften beobachtet.
Dazu gehören auf dem Desktop zum Beispiel das Dateisystem, kritische Systemdateien wie die Registry
und Treiber, wichtige Voreinstellungen von Programmen wie Office und die Netzwerkverbindungen, aber
auch Performance-Infor- mationen wie Speicherbelegung und Antwortzeiten. Ein Monitor entdeckt
beispielsweise einen Systemabsturz, das Unterschreiten bestimmter Performance-Grenzwerte oder die
unerlaubte Veränderung sensibler Systemeigenschaften sofort. Automatismen analysieren diese
Ereignisse, um störende Fehlalarme zu vermeiden, und suchen parallel mögliche Lösungsansätze zur
Beseitigung des Problems.
Bei alltäglichen Routineproblemen lässt sich eine solche Software so einstellen, dass sie ihre
Vorschläge nicht dem Administrator oder dem Anwender unterbreitet, sondern selbst aktiv wird und
zum Beispiel automatisch ein Java-Script mit Korrekturmaßnahmen initiiert. Andernfalls löst sie
automatisch einen Request an den Service-Desk aus. Hier liefert sie die Problembeschreibung und die
besten Lösungsvorschläge direkt mit, was die Fehlerbehebung deutlich erleichtert.
Ein wichtiges Ziel ist die Vorbeugung vor jeglichen Störungen und Ausfällen von IT-Services.
Gelingt das nicht, versucht die Software, diese Störungen automatisch zu entdecken und zu beheben,
bevor der Anwender sie bemerkt. Dies entlastet den Service-Desk von der Masse der üblichen
Bagatellprobleme und steigert so seine Produktivität, reduziert die Ausfallzeiten und führt
letztlich zu einer höheren Zufriedenheit der Endanwender.
Überfordert ein Problem die Selbstheilungskräfte, kann automatisch zunächst der Anwender
alarmiert werden. Er erhält eine Problembeschreibung und findet in der Wissensdatenbank (Knowledge
Base) Lösungsvorschläge. Gelingt ihm die Lösung nicht selbst, kann er den Request an den
Service-Desk weiterleiten. Hier sucht dann ein Techniker mittels Mechanismen wie Chat oder
Desktop-Sharing und Rückgriff auf die Tools des Netzwerk- und Systemmanagements die Lösung. Dank
solcher Fernsteuerungfunktionen muss dann der IT-Fachmann im Optimalfall gar nicht erst vor Ort
beim Anwender erscheinen, um ein Problem zu lösen.