Erfassung, Visualisierung und Analyse

Wer’s vorher weiß, den macht’s nicht heiß

3. Februar 2023, 7:00 Uhr | Autor: Christian Deponte / Redaktion: Diana Künstler
Observability
© iqoncept/123rf

Wie Observability geschäftsschädigende Ausfälle in Unternehmen verhindern kann.

Der Artikel liefert unter anderem Antworten auf folgende Fragen:

  • Welche Auswirkungen haben IT-Störungen auf den Unternehmensalltag in Deutschland?
  • Welche Rolle spielt Observability bei der Fehlerbehebung von IT-Störungen?
  • Wie grenzt sich Observability von Monitoring ab?
  • Wie kann Observability IT-Teams entlasten?

Server down : Nicht nur dieser Worst Case, sondern auch kleinere IT-Störungen gehören in Deutschland zum Unternehmensalltag. Das zeigt der „Observability Forecast Report 2022“ von New Relic1. Pro Woche erleben 89 Prozent der Befragten demnach einen IT-Ausfall kritischen Ausmaßes, 33 Prozent sogar täglich. Hochgerechnet bedeutet das einen Verlust von circa 2.000 Euro pro MitarbeiterIn2 und Jahr – das gilt für Deutschland, USA, Großbritannien und Frankreich. Ein wichtiger Faktor bei der Fehlerbehebung ist Observability: die Fähigkeit, den Tech-Stack möglichst ganzheitlich zu überwachen. Und – kaum verwunderlich – fast 80 Prozent der Befragten wünschen sich mehr davon.

Anbieter zum Thema

zu Matchmaker+
Observability

... zu deutsch „Beobachtbarkeit“, ist die Fähigkeit, die Leistung eines Systems zu messen und Probleme und Fehler auf Grundlage seiner Ausgabewerte zu identifizieren. Diese externen Ausgaben sind Telemetriedaten (Metriken, Ereignisse, Protokolle und Ablaufverfolgungen). Datengesteuertes Engineering nutzt Telemetriedaten wiederum, um Maßnahmen voranzutreiben. Observability erfordert Instrumentierungssysteme, um verwertbare Daten zu sichern, die einen Fehler identifizieren und detailliert angeben, wann, warum und wie ein Fehler auftritt. Observability beinhaltet auch das Sammeln, Analysieren, Ändern und Korrelieren dieser Daten, um die Verfügbarkeit und die Leistung zu verbessern. Software-Engineering, Entwicklung, Site Reliability Engineering, Operations und andere Teams nutzen Observability, um das Verhalten komplexer Systeme zu verstehen und Daten in maßgeschneiderte Erkenntnisse umzuwandeln.
Eine Teilmenge der Observability ist das Monitoring (Überwachung), welche reaktiv ist und anzeigt, was falsch ist und wann ein Fehler aufgetreten ist. Observability hingegen bestimmt proaktiv, warum und wie ein Fehler aufgetreten ist – zusätzlich zu den Fragen Was und Wann. Die Fähigkeit, alles im Tech-Stack zu sehen, was sich auf das Kundenerlebnis auswirken könnte, wird als Full-Stack-Observability oder End-to-End-Observability bezeichnet. Es basiert auf einer vollständigen Sicht auf alle Tele-
metriedaten. (DK)

IT-System mit Überblick

Die meisten Unternehmen nutzen viele verschiedene Tools und Services von unterschiedlichen Anbietern. Diese erzeugen eine Menge Daten: Events, Metrics, Logs und Traces. Bei deren Auswertung von Hand landet man schnell in einem Wirrwarr, in dem sich die Fehlerquelle und die passende Lösung nur schwer identifizieren lassen. Und genau hier setzt Observability an. Entsprechende Lösungen sammeln anfallende Daten von Ende zu Ende, werten sie aus und setzen sie in Kontext. Monitoring gibt hingegen oft nur Bescheid, wenn etwas schiefläuft, häufig verteilt auf viele verschiedene Dashboards. Observability soll es IT-Teams hingegen ermöglichen, die Frage nach dem Warum in einer Ansicht zu beantworten. Probleme, Ursachen und Symptome sind idealerweise auf einen Blick sichtbar.

Laut dem „Observability Forecast“ sehen 78 Prozent in Observability eine wichtige Voraussetzung für das Erreichen zentraler Geschäftsziele und 75 Prozent der Führungsebene befürworten Observability. 42 Prozent der befragten Unternehmen wollen mehr Geld in Observability investieren. Denn nur 27 Prozent überblicken mit Tools aktuell ihren gesamten Tech-Stack, und nur rund fünf Prozent geben an, eine ausgereifte Observability-Strategie zu haben. Die meisten Unternehmen (82 Prozent) nutzen vier oder mehr verschiedene Anwendungen. Dabei wünscht sich knapp die Hälfte, sie wäre nur auf eine einzige angewiesen. Etwa ein Drittel findet Fehler zum Großteil noch von Hand oder durch Beschwerden.

Monitoring gibt oft nur Bescheid, wenn etwas schief läuft, häufig verteilt auf viele verschiedene Dashboards. Observability hingegen ermöglicht den IT-Teams, die Frage nach dem Warum zu beantworten, in einer zusammenfassenden Ansicht.

Vom Problem- hin zum IT-Management

Observability
Anzahl der Tools, die für Observability-Funktionen verwendet werden: Auf die Frage nach der Anzahl der Tools, die sie verwenden, um den Zustand ihrer Systeme zu überwachen, gaben die Umfrageteilnehmer einer New Relic-Studie mit großer Mehrheit an, mehr als eines zu verwenden. Die meisten (82 Prozent) verwendeten vier oder mehr Tools. 94 Prozent verwendeten zwei oder mehr. Jeder Fünfte verwendete sieben Tools, die am häufigsten gemeldete Zahl. Nur 2 Prozent nutzten nur ein Tool, um ihre Observability-Anforderungen zu erfüllen. Der Zustand der Observability ist heute also meistens multitoolfähig – und daher fragmentiert – und wahrscheinlich von Natur aus komplex zu handhaben. Tatsächlich gaben 25 Prozent der Umfrageteilnehmer an, dass zu viele Überwachungstools eine primäre Herausforderung darstellen, die sie daran hindert, eine vollständige Beobachtbarkeit zu erreichen.
© New Relic

Dem Anwendungsbereich entsprechend geben 36 Prozent der Befragten weniger Downtime und eine bessere Verlässlichkeit des IT-Systems als wichtigsten Kernfaktor von Observability an. Viele der Befragten sehen sie zudem als Möglichkeit, Teams zu entlasten und sinnvoller einzusetzen.

Observability ist darüber hinaus eine Möglichkeit, um zeitintensive Arbeit und damit Druck von den Schultern der IT-Teams zu nehmen. KI-Systeme helfen gegebenenfalls dabei, die Kapazitäten der Fachkräfte auf die Vorfälle zu konzentrieren, die tatsächlich relevant sind und nehmen ihnen durch intelligente Empfehlungen gegebenenfalls die Sorge, ob sie bei der Implementierung der Monitoring-Software auch alles bedacht haben. Unternehmen können so die Erfahrung und das Wissen ihrer Belegschaft im Idealfall effizienter und zielgerichteter einsetzen.

Fehlende Fachkräfte ersetzen

Ein besseres, vor allem schnelleres und konkreteres Verständnis für unternehmensinterne Softwareprozesse kann Reaktions-, Identifizierungs- und Reparaturzeiten verringern. Und das nicht nur bei internationalen Tech-Giganten, wie der Observability Forecast zeigt. Auch kleine und mittelständische Unternehmen wissen um die Möglichkeiten der Technologie und wollen auch in Zukunft mehr investieren. Gerade für sie bietet Observability die Option, trotz des drohenden Fachkräftemangels mit der technischen Entwicklung Schritt zu halten: Künstliche Intelligenz ersetzt Fachkräfte, die händisch die Unmengen von Daten durchwühlen und nach einer Lösung suchen. Fachkräfte können dann effizienter eingesetzt und ihre Fähigkeiten besser genutzt werden.

Christian Deponte, Vice President EMEA Central, New Relic

1 https://newrelic.com/observability-forecast/2022/about-this-report
2 https://www.stud-it.de/post/it-probleme-und-ihre-folgen-zahlen-fakten


Das könnte Sie auch interessieren

Verwandte Artikel

connect professional

Matchmaker+