ROI sind die drei magischen Buchstaben für jeden IT-Verantwortlichen: Hinter der Abkürzung für "Return on Investment" steht eine einfache Berechnung, die aufzeigen soll, in welchem Zeitraum sich eine Anschaffung amortisiert hat. Allerdings gibt es Investitionen, deren ROI nicht oder nur schwer zu berechnen ist. So wäre es auch bei der Evaluierung einer Monitoring-Software interessant zu wissen, bis wann der Kaufpreis über die diversen Nutzwertfaktoren der Software erwirtschaftet ist. Diese Aufgabe ist nicht trivial.Die Schwierigkeit bei der ROI-Berechnung einer Netzwerk-Monitoring-Lösung liegt weniger bei den Implementierungskosten. Diese lassen sich relativ einfach und zuverlässig berechnen: Lizenzpreis, Implementierungsaufwand, Hardware- und Wartungskosten stehen in der Regel recht präzise fest. Die Schwierigkeit liegt vielmehr in der Nutzenquantifizierung einer solchen Software. Schließlich erwirtschaftet Monitoring zunächst einmal kein Geld, sondern beugt in erster Linie Verlusten durch Ausfälle vor. Aber welche Schäden entstehen beim Ausfall eines Mail-Servers? Wie viel kosten zwei Stunden Downtime? Wie hoch ist der Verlust, wenn die Web-Seite einen Tag offline ist? Vor allem aber: Welche Ausfälle kann die Monitoring-Software letztlich verhindern? Zu den wichtigsten Aufgaben einer Monitoring-Lösung gehört das langfristige Sammeln von Daten, auf deren Basis Betreiber dann Optimierungsmaßnahmen planen und durchführen können. Sie können Hardware und Bandbreiten bedarfsgenau anschaffen und verteilen. Überflüssige Kosten durch ungenutzte Ressourcen und Ausfälle sind mittels langfristiger Optimierung vermeidbar. Doch gerade dabei zeigt sich bei der Berechnung des ROIs ein Dilemma: Denn woher weiß ein Betreiber im Voraus, was eine langfristige Optimierung einspart, wenn er gerade auf der Suche nach einem Tool ist, das ihm eben dieses Sparpotenzial ermitteln soll? Denn wie soll er sich jetzt orientieren, und wie kann er entscheiden, ob sich der Kauf einer Monitoring-Lösung letztlich rechnet? Es gibt dazu allerdings Orientierungshilfen durch Durchschnittswerte und Beispielzahlen, die bei der Einschätzung der Kosten und des Nutzens von Netzwerk-Monitoring-Lösungen helfen können. Statistische Kosten für IT-Ausfälle Der amerikanische Analyst Michael Krigsman bezifferte 2012 die globalen, durch IT-Ausfälle verursachten Kosten mit 3 Billionen Dollar pro Jahr [1]. Damit relativiert er eine Studie der British Computer Society, die 2009 die Kosten sogar mit mehr als 6 Billionen Dollar berechnet hatte. Laut einer anderen Studie des Softwareherstellers CA verursachen IT-Ausfälle jährliche Kosten von durchschnittlich 55.000 Dollar bei kleinen Unternehmen, 91.000 Dollar bei mittleren und 1.000.000 Dollar bei großen Unternehmen [2]. Gartner setzte 2014 den durchschnittlichen Schaden für Netzwerk-Downtime mit 5.600 Dollar pro Minute Ausfallzeit an und kommt so auf 336.000 Dollar pro Stunde [3]. Einen ähnlichen Wert ermittelt der Collaboration-Spezialist Avaya in einer Umfrage [4] bei europäischen Unternehmen. Dabei registrierten im Jahr 2013 81 Prozent der befragten Unternehmen Netzwerkausfälle, die wiederum bei 77 Prozent der Betroffenen durchschnittliche Kosten von rund 68.000 Euro verursachten. Als Nebeneffekt wurde bei jedem fünften betroffenen Unternehmen der verantwortliche IT-Mitarbeiter entlassen, in Deutschland gar bei jedem Vierten. Das deutsche Marktforschungsunternehmen Techconsult hat 2013 eine Studie zu den Kosten von IT-Ausfällen im deutschen Mittelstand erstellt [5]. Die Forscher befragten 300 Unternehmen mit 200 bis 5.000 Mitarbeitern. Auch dort ergibt sich ein jährlicher Schaden in beachtlicher Höhe: 380.000 Euro pro Jahr und Unternehmen. Eine Stunde Ausfall der IT-Systeme wird mit Kosten von etwa 20.000 bis 40.000 Euro veranschlagt, und die befragten Unternehmen hatten im Durchschnitt vier Ausfälle pro Jahr mit 3,8 Stunden Wiederherstellungsdauer zu verzeichnen. Unabhängig von ihrer Richtigkeit und ihrer Relevanz für das einzelne Unternehmen zeigen diese Zahlen in jedem Fall, dass IT-Ausfälle beträchtliche finanzielle Schäden verursachen und dass alles, was zu ihrer Vermeidung oder schnellen Behebung führen kann, grundsätzlich sinnvoll ist und einen gewissen (finanziellen) Aufwand durchaus lohnt. Um für die eigene Entscheidung eine Grundlage zu schaffen, ist jedoch mehr nötig. Dazu gilt es, unterschiedliche Faktoren zu berücksichtigen. Faktoren zur ROI-Abschätzung Da sind zunächst Faktoren, die sich relativ einfach quantifizieren lassen. Hier einige Beispiele: Kosten = Gehalt plus Gehaltsnebenkosten der IT-Mitarbeiter in der Administration, durchschnittlich aufgewendete Zeit zur Behebung von Ausfällen und Störungen des Netzwerks, Anzahl und Dauer von Störungen des Netzwerks, die Auswirkungen auf die Produktivität einzelner oder aller Mitarbeiter hatten, während eines bestimmten Zeitraums (das vergangene Jahr, die vergangenen fünf Jahre?), durchschnittliche Umsätze über den Web-Shop und vertraglich vereinbarte Entschädigungen bei Nichteinhalten von SLAs von Service-Providern. Andere Faktoren sind nur deutlich schwerer oder gar nicht zu quantifizieren. Sie gehören zu den angesprochenen "unsichtbaren" Faktoren wie beispielsweise: die Nicht-Erreichbarkeit des Kunden-Supports, die Nicht-Erreichbarkeit der Web-Seite als Image und Marketinginstrument oder der Ausfall einzelner Systeme, während andere funktionieren. Ganz schwierig wird es, wenn es sich nicht um Totalausfälle handelt, sondern lediglich um Performance-Einbrüche, also wenn die Website langsam wird oder die E-Mails sich verspäten: Wie viele Kunden kaufen bei einem langsamen Web-Shop dennoch, und wie viele springen ab, wenn die Seite sich zu langsam aufbaut? Was sind die Folgen, wenn die internen Systeme quälend langsam arbeiten, die Kollegen aber noch ihre Aufgaben wahrnehmen können? Welcher Schaden entsteht, wenn E-Mails nur verzögert ans Ziel gelangen? Oft unterschätzen Betreiber gerade unscheinbare Kosten, die sich aber relativ einfach konkretisieren lassen, weil sie im Tagesgeschäft untergehen, beispielsweise die Mehrbelastung, wenn sie regelmäßig bei kleineren Ausfällen umständlich die Ursachen suchen müssen. Verbringen sie damit im Durchschnitt nur vier Stunden in der Woche, sind dies schon zehn Prozent der Arbeitszeit - bei jährlichen Kosten für einen Arbeitsplatz von beispielsweise 75.000 Euro ergibt dies schon 7.500 Euro pro Jahr. Damit allein lässt sich schon so manche Monitoring-Lösung finanzieren, die eine solche Belastung übernehmen kann. Ein anderer wesentlicher Faktor der ROI-Berechnung: Umfassende Monitoring-Lösungen dienen nicht nur der kurzfristigen Fehlererkennung und Alarmierung, sondern bieten die Möglichkeit, über intelligentes Auswerten der gesammelten Daten die gesamte IT langfristig zu optimieren. Steht beispielsweise eine Virtualisierung von Teilen der Infrastruktur an, ist eine genaue Kenntnis der Anforderungen an Bandbreite und Speicher unerlässlich. Als Grundlage sind langfristige Daten erforderlich, um auch temporäre Lastspitzen einbeziehen zu können. Ein klassisches Beispiel ist eine Buchhaltungssoftware, die regelmäßig zum Quartalsende große Netzwerklasten produziert, den Rest der Zeit aber nur im Sparmodus läuft. Versteckte Kosten Die Kostenseite gilt als relativ einfach und zuverlässig berechenbar. Das ist zwar ebenfalls grundsätzlich richtig, allerdings gibt es auch dabei Faktoren, die zu berücksichtigen sind: Module und Add-ons: Viele Lösungen gleichen einem großen Baukasten aus zahlreichen Tools, Add-ons und Modulen. Was auf den ersten Blick vernünftig scheint - man kauft nur das, was man auch wirklich braucht -, stellt sich häufig als heikle Kostenfalle heraus. Es kann extrem schwer sein, alle später benötigten Module schon vorab zu überblicken und in die Kalkulation einzubeziehen. Hat ein Betreiber die Lösung erst einmal eingesetzt, wird er vermutlich lieber in den sauren Apfel beißen und die noch benötigten Module nachkaufen, als die gerade eingeführte Lösung unter großem Aufwand wieder abzulösen. Open Source vs. Lizenzkosten: Open-Source-Lösungen scheinen auf den ersten Blick enormes Sparpotenzial zu bieten, sparen sie doch die teils nicht unerheblichen Lizenzgebühren kommerzieller Software. Dafür aber fällt dabei in der Regel ein hoher Aufwand für Implementierung und Pflege an. Unter Zuhilfenahme eines neutralen Nagios-Experten hat der Monitoring-Anbieter Paessler eine Beispielrechnung erstellen lassen, die die Kosten für Lizenz, Implementierung, Anpassungen und ein Jahr Betrieb für eine Nagios-Installation und eine PRTG-Network-Monitor-Installation vergleicht: Während PRTG inklusive Lizenzgebühren mit 5.412,50 Euro zu Buche schlug, kam der Experte bei Nagios auf Kosten von über 10.000 Euro [6]. Verschärfend kommt hinzu, dass die hauseigenen Linux-Experten vermutlich bereits andere Aufgaben haben, als mit großem Aufwand ein Monitoring-System zu implementieren und zu warten. Fazit Die meisten verfügbaren ROI-Rechner ergeben keinen Sinn. Das menschliche Hirn ist immer noch deutlich leistungsfähiger als jeder Rechner, wenn es um Intuition, Abstraktion und Transferdenken geht. Wir sehen Dinge, die der Rechner nicht sieht. Besser ist es, auf den gesunden Menschenverstand zu vertrauen und verfügbare Zahlen zu sammeln, zu bewerten und zu vergleichen. Diese Zahlen können von Analysten berechnete Kosten für Ausfälle in der IT sein, Beispiele aus Kundenfallstudien, Durchschnittswerte für Ausfallzeiten von IT-Komponenten etc. Aber auch ganz konkrete Kosten spielen eine Rolle, etwa das Gehalt der zuständigen Kollegen, der Tagesumsatz des Web-Shops oder die Mitarbeiterzahl des Unternehmens. Auf der Kostenseite gilt es zu beachten, dass der Preis, den man auf der Web-Seite des Herstellers gefunden hat, nicht gleich den Kosten für die Monitoring-Lösung ist. Implementierung, Folgekosten für Upgrades und Module sowie Wartungskosten sind ebenfalls in die Kalkulation einzubeziehen. Nicht vergessen sollte ein Betreiber den möglichen Mehrwert, wenn eine umfassende Monitoring-Lösung ihm bei der langfristigen Optimierung seiner IT(-Kosten) hilft. Quellen [1] Michael Krigsman bei ZDNet: www.zdnet.com/article/worldwide-cost-of-it-failure-revisited-3-trillion [2] Artikel über CA-Studie bei InformationWeek: www.informationweek.com/it-downtime-costs-$265-billion-in-lost-revenue/d/d-id/1097919 [3] Gartner-Blog: blogs.gartner.com/andrew-lerner/2014/07/16/the-cost-of-downtime [4] Ergebnisse der Avaya-Studie bei manage it: ap-verlag.de/komplexe-netzwerke-und-ausfaelle-kosten-unternehmen-umsatz-und-arbeitsplaetze/6266 [5] Auswertung der Studie im CIO-Magazin: www.cio.de/a/it-ausfall-kostet-bis-zu-41-000-euro-pro-stunde,2918599 [6] www.de.paessler.com/nagios-alternative