Fehleranalyse

Den Netzwerksupport intelligent entlasten

3. September 2020, 11:00 Uhr | Autor: Sebastian Hein / Redaktion: Alexandra Hose
© NetBrain

Komplexe Netzwerke produzieren bisweilen sehr vielfältige Fehler im Betrieb. Und die Analyse dieser Fehler wird immer schwieriger. Das liegt unter anderem daran, dass neben den üblichen PCs und Notebooks auch eine wachsende Zahl an mobilen Endgeräte integriert sind.

Neben dem Netzwerkausfall an sich belastet auch der Prozess der Fehlersuche das Budget der Unternehmen immer mehr. Je länger dieser andauert, desto teurer wird die Rechnung. Um die durchschnittliche Reparaturdauer möglichst vergleichbar aufzuzeichnen, vom Auftreten eines Fehlers bis zur vollständigen Wiederherstellung des Produktionsstands, wird die Kennziffer MTTR (Mean Time To Repair) verwendet. Sie wird ermittelt, indem man die gesamte Wartungszeit aller Ausfälle durch die Gesamtzahl der Netzwerkausfälle dividiert. Im Ergebnis erhält das Unternehmen eine MTTR für einen bestimmten Zeitraum.

Die MTTR hängt unter anderem ab vom Fehlertypus, dem Anwendungsfall und der Effizienz der IT-Abteilung bei der Problembehebung. Auch Prozesse bei abteilungsübergreifenden Handlungen sowie Eskalationsabläufe fallen dabei ins Gewicht. Besonders interessant sind dabei Anwendungsfälle mit einer niedrigen MTTR. Das deutet darauf hin, dass Prozesse aktiv sein können, die eine schnelle Behebung begünstigen. Dabei sollten Netzwerkexperten diese Prozesse erkennen und ihre Funktionsweise auf Fehlervorgänge mit einer hohen MTTR übertragen. Auch bei der Verhandlung von Wartungsverträgen oder Service-Level-Vereinbarungen kann die MTTR eine wichtige Rolle als Indikator spielen und Netzwerktechnikern bei der Planung von Wartungseinsätzen helfen.

Abschnitte der MTTR
Die MTTR kann in drei beziehungsweise vier Abschnitte unterteilt werden.

  1. Zunächst muss der Fehler passieren und erkannt werden, beispielsweise durch eine Abweichung von Netzwerkkomponenten von ihrer üblichen Funktionsweise. Je geringfügiger ein Netzwerkproblem ist, desto später fällt es unter Umständen auf. Häufen sich mehrere kleinere Fehler, kann dies zu größeren und weitaus komplexeren Störungen führen. Monitoring- und Event-Management-Lösungen helfen, diese schneller zu erkennen.
  2. Ist der Fehler aufgefallen, folgt Abschnitt zwei: die Identifizierung. Diese benötigt häufig die meiste Zeit, da die Netzwerktechniker den Fehler zunächst einkreisen müssen, um genauere Aussagen zur Ursache machen zu können. Die sogenannte „Mean Time To Identify“ (MTTI), die durchschnittliche Dauer dieses Vorgangs, bildet meist den längsten Abschnitt der MTTR. Diesen zu verkürzen ist schwierig, da er davon abhängt, wie erfahren die Netzwerkexperten sind. Da die Fehlersuche sehr individuell erfolgt, wird die  Normierung dieses Prozesses zusätzlich erschwert. Zudem können bei der Identifikation eines Fehlers mehrere Abteilungen involviert sein. Je nachdem, welche Abteilung mit der Analyse beginnt, kann sich die MTTI durch mehrere Übergaben an andere um ein Vielfaches erhöhen.
  3. Den dritten Abschnitt bildet die Fehlerbehebung. Die Dauer dieses Abschnitts hängt von der Art des Fehlers ab und ist dementsprechend variabel. Können ihn Netzwerkexperten gut eingrenzen und leicht beheben, nimmt er wenig Zeit in Anspruch. Falls der Fehler jedoch komplexer ist und das betraute Team an seine Grenzen stößt, wird der Fall eskaliert, was den gesamten Behebungsprozess verzögert und zu höheren Kosten führt.
  4. Einen zusätzlichen, vierten Abschnitt könnte die proaktive Phase bilden. Hierin würden sinnvollerweise Vorkehrungen getroffen, um die aufgetretenen oder ähnliche Probleme künftig aktiv zu vermeiden. Um dies zu schaffen, muss die durchgeführte Problembehebung gut dokumentiert werden und einen schnellen Zugriff auf relevante Informationen ermöglichen.

Komplexe Fragestellungen bedürfen intelligenter Lösungen

Es ist damit zu rechnen, dass Netzwerke künftig an Komplexität zunehmen, der Anspruch der Anwender wächst und die Verfügbarkeit kompetenter Netzwerkexperten kaum steigt. Daher ist es ratsam, dass sich IT-Entscheider frühzeitig mit der Automatisierung ihres Netzwerks befassen. Der Einsatz von Runbooks und Dynamic Maps sind dabei wichtige Faktoren, um einen stabilen und zuverlässigen Betrieb der Unternehmens-IT sicherzustellen. Nicht zuletzt entlastet ein automatisiertes Netzwerk auch die eigenen Support-Mitarbeiter, die sich dadurch intensiver komplexeren Problemen oder auch strategisch wichtigen, technischen Evaluierungen widmen können.

 


  1. Den Netzwerksupport intelligent entlasten
  2. Methoden zur Minderung der MTTR

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu NetBrain

Matchmaker+