Übergreifendes Monitoring

Ganzheitlichkeit schafft Durchblick

15. Dezember 2011, 7:00 Uhr | Paul Günkel/pf, Spezialist für Monitoring und Virtualisierung bei Consol,

IT-Probleme frühzeitig zu erkennen, bevor negative Auswirkungen eintreten, stellt eines der Hauptziele von Server- und Applikations-Monitoring dar. Eine Grundvoraussetzung für den effektiven Einsatz einer Monitoring-Lösung ist dabei die Fähigkeit, plattformübergreifend Daten zu erfassen und zu korrelieren. Gerade in virtualisierten Server-Umgebungen kommt daher einem gesamtheitlichen Lösungsansatz für das Monitoring eine hohe Bedeutung zu.Für den wirtschaftlichen Erfolg von Unternehmen gewinnt der Begriff "Hochverfügbarkeit" in der IT immer mehr an Bedeutung. Dies gilt für Großkonzerne ebenso wie für Mittelständler und kleinere Unternehmen, die unternehmenskritische Anwendungen auf ihren Servern betreiben. Ist die Unternehmens-IT nicht funktionsfähig beziehungsweise ein wichtiger Dienst ausgefallen, läuft oft nichts mehr. Ein Komplettausfall ist dabei das schlimmste Szenario. Viel häufiger jedoch treten kleinere Störungen oder Performance-Probleme auf, die eine einwandfreie und performante Funktionsweise der IT beeinträchtigen.

Zu Letzteren gehören beispielsweise lange Antwortzeiten von Anwendungen, versursacht durch eine sehr hohe CPU-Auslastung des Hosts oder eine zu hohe Anzahl gleichzeitiger Sessions auf dem Web-Server. Um Störungen oder Fehlentwicklungen zu vermeiden, ist die Überwachung, also ein Monitoring der Systeme erforderlich. Damit können die Administratoren Probleme frühzeitig erkennen und Gegenmaßnahmen einleiten. Dies gilt in besonderem Maß für virtualisierte Umgebungen, da auf solch unternehmenskritischer Infrastruktur sehr viele Dienste zusammengefasst laufen. Eine initiale und häufig unterschätzte Frage stellt die nach dem erwarteten Nutzen einer Monitoring-Lösung dar. Eine differenzierte Betrachtung liefert mehrere Antworten, die jeweils verschieden Aspekte der Gesamtidee "Monitoring" abdecken. Das oberste Ziel der Anwender einer Monitoring-Lösung ist, Probleme so früh wie möglich zu erkennen. Das heißt, ein Problem sollte schon erkannt werden, bevor es tatsächlich Auswirkungen auf die Benutzer eines Systems hat, und diese in ihrer Arbeit behindert. Ein entsprechend eingestelltes Monitoring ermöglicht die proaktive Erkennung und Beseitigung von Problemen im Vorfeld.

Falls eine Störung dennoch eingetreten ist, beispielsweise durch einen nicht vorhersehbaren Hardwareausfall, dient Monitoring als Hilfsmittel zur Identifizierung der genauen Ursache des Problems. Liegt keine punktgenaue Darstellung der Fehlerursache vor, lassen sich durch geschickte Interpretation der verfügbaren Analysedaten Fehlerquellen besser eingrenzen und die Suche nach dem genauen Ort der Störung minimieren. So kann beispielsweise die Anzeige, dass alle Geräte in einem bestimmten Netzwerksegment nicht mehr erreichbar sind, auf ein Problem in der verbindenden Netzkomponente hinweisen.

Auch außerhalb der Fehlererkennung und -beseitigung kann Monitoring im störungsfreien Betrieb eine wertvolle Hilfe darstellen - und zwar durch die Historisierung erfasster Daten, auch wenn diese nicht zwingend den festgelegten Schwellenwert für Alarmierungen überschritten haben. Die automatische Erfassung der Zustände verschiedener Komponenten eines Gesamtsystems und deren Archivierung erlaubt eine Aussage zu bestimmten Ereignissen und Betriebszeiten: So lässt sich ein vom Benutzer gemeldetes Problem mit einer Website etwa auch im Nachhinein noch auf eine hohe Auslastung der Datenbank zurückführen. In dieser Hinsicht stellt Monitoring eine Hilfe zur besseren, lastgerechten Skalierung einer Infrastruktur dar. So genanntes "Performance Monitoring" bietet dabei die Möglichkeit, auf der Basis detailliert erfasster Daten eine bessere Auslastung herzustellen sowie Prognosen bezüglich Lastspitzen zu treffen - zum Beispiel bei Batch-Läufen oder aufgrund großer Marketing-Kampagnen.

Grundvoraussetzung für den effektiven Einsatz einer Monitoring-Lösung ist die Fähigkeit, plattformübergreifend Daten zu erfassen und zu korrelieren. Die Verwendung von einzelnen, disjunkten Lösungen erlaubt meist keine Erfassung von Zusammenhängen und der Interaktionen einer Systemlandschaft, was die Fehlersuche merklich erschwert. Im Bereich virtualisierter Systeme stellt ein übergreifendes Konzept allerdings auch eine Herausforderung an das Design des Monitorings dar.

Virtuelle Umgebungen stellen aufgrund ihrer hohen Dynamik und effektiven Abschirmung der darunter liegenden Hardwareebenen besondere Anforderungen an eine ganzheitlich orientierte Monitoring-Lösung. Diese muss von den beteiligten Hardwarekomponenten über die einzelnen Virtualisierungsebenen bis zu den Applikationen und Betriebssystemen innerhalb der Gastsysteme reichen. Viele kommerzielle Virtualisierungslösungen bieten inzwischen eine Reihe eigener Überwachungshilfsmittel an und erlauben auch das Auslesen der Daten von extern. VMware beispielsweise stellt dafür eine API (Application Programming Interface) zur Verfügung, die außer Performance- und Health-Informationen von ESX-Servern auch Information über den Status der Hardware der Host-Systeme bereitstellt, soweit sie sich über das CIM-Interface (Common Information Model) auslesen lassen. Microsofts Hyper-V stellt ähnliche Informationen über seine WMI API zur Verfügung.

Neben den genannten, von den Herstellern integrierten Lösungen bieten Fremdhersteller zahlreiche leistungsfähige Tools für das Monitoring in virtuellen Umgebungen. Dazu gehört zum Beispiel der EG VM Monitor (www.eginnovations.com), der ebenso wie Quest Vfoglight (www.questsoftware.de) den Schwerpunkt auf Performance Monitoring legt, um den Anwendern die Kapazitätsplanung zu erleichtern. Zudem erlauben diese Lösungen die Einbindung von Alarmierung bei Engpässen und voll- oder teilautomatisierte Reaktionen auf Hardware- und Softwareereignisse, die von den Virtualisierungsebenen erfasst werden. Im Gegensatz dazu bietet beispielsweise Vkernel Vops (www.vkernel.com) ein reines Performance Monitoring zur frühzeitigen Erkennung von Engpässen. Paessler PRTG (www.paessler.com) wiederum stellt ein Hilfsmittel zum Monitoring und Erfassen rein netzwerkbezogener Daten dar.

Jenseits dieser Überwachungsmöglichkeiten bis hin zur Virtualisierungsebene gibt es zusätzlich noch den Bedarf, das Verhalten innerhalb der Gastsysteme zu überwachen - und zwar Parameter, die über die reine CPU- und Netzwerklast hinausgehen.

Mit diesen Monitoring-Lösungen für die verschiedenen Ebenen von Hardware, Host- und Gastsystemen lässt sich jedoch das angestrebte Ziel einer plattformübergreifenden Lösung teils nur sehr schwer erreichen. Dabei würde Letztere einen erheblichen Vorteil bieten: die Kombination verschiedener Sichtweisen zu einem Gesamtbild, das präzise Analysen sowie schnelle Fehlererkennung und -korrekturen ermöglicht.

Ganzheitliches Monitoring mit Nagios

Um in einem heterogenen Umfeld wie dem einer hochvirtualisierten Landschaft technik- und softwareübergreifend Informationen zu erfassen und zu verknüpfen, ist ein integrativer Ansatz notwendig. Ein Beispiel für eine solche Lösung stellt die Open-Source-Software Nagios (www.nagios.org) dar, mit der sich verschiedenste Quellen innerhalb eines Monitoring-Frameworks erfassen lassen. Bei einem integrativen Ansatz werden die vorhandenen Monitoring-Lösungen und deren Informationen mit weiteren Daten aus den Virtualisierungsebenen - wie VMware Vcenter - angereichert und erlauben logische Verknüpfungen von Ereignissen sowie die Erfassung von Trends.

Die aktiven Abfragen über die einzelnen APIs können oft relativ ressourcenintensiv ausfallen, wie dies etwa bei der Verwendung der VMware Vsphere API über das Perl SDK der Fall ist. Daher ist es wichtig, bei der Planung einer Lösung auch die Ressourcenauslastung der Monitoring-Umgebung selbst im Blick zu behalten. Es sollte die Möglichkeit genutzt werden, Alarme aus der vorhandenen Monitoring-Infrastruktur mithilfe von Schnittstellen wie SNMP (Simple Network Management Protocol) oder über eigens entwickelte Mechanismen zu erfassen. Dabei führt die Kombination von selbstgeschriebenen Monitoring-Skripten für eigene Anwendungen und die Integration vordefinierter Monitoring-Elemente der Soft- und Hardwarehersteller zu einer hohen Flexibilität.

In dieser Hinsicht kommt der große Vorteil von Nagios gegenüber vielen anderen Lösungen zum Tragen: die Verbindung aus "Quelltext-offener" Software und modularem Aufbau. Durch den hohen Verbreitungsgrad von Nagios sind bereits für viele Virtualisierungsprodukte ausgereifte Plug-ins zur Überwachung verfügbar, die schon über viele Jahre im Unternehmensumfeld zum Einsatz kommen. Auch kommerzielle Ableger von Nagios wie der Op5 Monitor (www.op5.com) sind verfügbar. Dieser hat bereits alle nötigen Add-ons und Plug-ins mit an Bord und bietet einen Hersteller-Support für alle Bestandteile des Systems.

Alle Monitoring-Parameter auf einen Blick: So kann die Administration Probleme bereits im Vorfeld erkennen, wenn sich bestimmte Parameter ihren kritischen Werten nähern.

Bei der Überwachung von IT-Systemen lässt sich durch multiple Abfragen ein lückenloses und ganzheitliches Monitoring erreichen - hier am Beispiel von Nagios und VMware.
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Toshiba Mobile Communications Division

Weitere Artikel zu HFO Telecom AG

Matchmaker+