Ursachen für Netzprobleme schnell aufspüren

Paketverlust als Performance-Killer

17. Juli 2013, 6:00 Uhr | Jos Op ’t Root, Geschäftsführer bei Netcor./pf

Trotz 10-Gigabit-Netzwerk reagiert die SAP-Applikation nur schleppend, knackst es bei VoIP-Telefonaten und hängen Citrix-Anwendungen. Wie kann das sein? Häufig sind Paketverluste dafür verantwortlich. Die Ursachen dafür lassen sich mit den richtigen Werkzeugen schnell aufspüren. Agentenbasierende Monitoring-Lösungen zeigen bei dieser Aufgabenstellung etliche Vorteile gegenüber agentenlosen Überwachungssystemen.Wirkt sich eine Paketverlustrate von ein bis zwei Prozent negativ auf die Performance von Applikationen aus? Viele IT-Verantwortliche beantworten diese Frage mit Nein - und liegen damit leider falsch. Denn bereits ein kleiner Wert verringert den TCP-Durchsatz deutlich. TCP, das auf der Transportschicht Layer 4 des OSI-Referenzmodells implementierte "Transmission Control Protocol", gilt als ein bewährtes, verbindungsorientiertes und paketvermittelndes Regelwerk für die Datenübertragung in Computernetzwerken. Als Teil der Internet-Protokoll-Familie bildet es zudem die Grundlage des Internets. Die Performance der meisten über ein Netzwerk laufenden Anwendungen hängt zum großen Teil von TCP ab. Stockt dort der Durchsatz, lahmen auch die Applikationen. Doch wie kann es sein, dass sich eine auf den ersten Blick so geringe Fehlerrate stark auf die Leistung auswirkt? Warum sind Paketverluste solch ein Performance-Killer für Anwendungen? Ein Grund dafür ist die Art und Weise, wie TCP mit Paketverlusten umgeht.   Paketverlust und die möglichen Folgen Problematisch wird es, wenn TCP-Pakete verloren gehen oder bei der Übertragung starke Verzögerungen erleiden. Bestätigt der Empfänger ein gesendetes Datenpaket nicht innerhalb einer bestimmten Zeit, schickt der Sender es noch einmal auf den Weg. Diese Zeitspanne heißt Retransmission Timeout (RTO). TCP verdoppelt den RTO bei jeder Wiederholung. Die Folge: Die Antwortzeiten im Netzwerk verschlechtern sich - und damit die Performance. Während sich dieses Phänomen beim Abrufen von E-Mails oder beim Surfen praktisch nicht bemerkbar macht, ist bei anderen Applikationen mit spürbaren Auswirkungen zu rechnen. Besonders betroffen sind anspruchsvolle Geschäftsapplikationen und Anwendungen, die mit stark komprimierten Daten arbeiten - zum Beispiel Citrix-Umgebungen. Bereits der Verlust eines einzelnen Pakets und der dadurch erhöhte RTO können dazu führen, dass sich die Reaktionszeit des Systems auf Benutzereingaben beispielsweise auf 1,5 Sekunden verschlechtert. Derartige Wartezeiten empfinden die meisten Anwender zu Recht als störend.   Wie Paketverluste entstehen können Doch wie können Pakete überhaupt in einem Netzwerk "verloren gehen" oder sich verspäten? Sie fallen natürlich nicht physisch aus der Leitung. Vielmehr stellen überlastete Netzwerkressourcen, defekte Router und Switches, eine nicht ausreichende Pufferkapazität beim Empfänger oder Bit-Fehler während der Übertragung mögliche Ursachen dar. Erhebliche Verluste und Verzögerungen sind zudem in Server-Umgebungen zu verzeichnen. Dort kann es zum Beispiel vorkommen, dass ein Server Daten aus dem Backend nicht schnell genug erhält und die Empfangsbestätigung zum Client daher verzögert. Die IT-Performance-Spezialisten von Netcor beispielsweise stellen bei Projekten immer wieder fest, dass oft mehr als 50 Prozent der Paketwiederholungen durch Server bedingt sind. Speziell die Virtualisierung spielt dabei eine große Rolle. Viele Unternehmen setzen verstärkt Blade-Server-Systeme mit integrierten Switches ein. Solche Multi-Tier-Systeme sind sehr komplex. Häufig laufen in einem Blade-System zehn bis 20 Server, von denen jeder wiederum als Host für mehrere virtuelle Maschinen fungiert. Inklusive der integrierten Switch-Module bilden die Systeme Blackboxes mit extrem hoher funktionaler Packungsdichte - und geringer Transparenz. Bei solchen Systemen lässt sich nicht mehr ohne Weiteres ermitteln, ob Pakete im Server oder im Blade-Switch verloren gehen - oder möglicherweise doch im Wirts- oder Gastsystem. Blade-Server mit herkömmlichen Messverfahren zu analysieren ist zwar prinzipiell möglich, aber extrem aufwändig und teuer.   Paketverlust mit effizienten Methoden ermitteln Wenn Anwender sich über mangelnde Performance im Netzwerk beschweren, ist das quantitative und qualitative Ermitteln der Paketverluste bei der Fehlersuche häufig der erste Schritt. Denn neben Jitter und One-way Delay stellt die Paketverlustrate eine grundlegende Kenngröße für die Performance und Übertragungsqualität eines Netzwerks dar. IT-Administratoren müssen das Problem schnell eingrenzen können. Zum Beispiel, indem sie durch geeignete Monitoring Tools sicherstellen, dass ihr Netzwerk nicht für den Paketverlust verantwortlich ist. Wenn sie dabei auch noch in der Lage sind zu bestimmen, aus welcher Richtung oder aus welchem Teilbereich die gesendeten Pakete vor dem Verlust kamen, können sie auch den Verursacher, zum Beispiel den Client oder den Server, rasch dingfest machen. Mit geeigneten Software-Tools ist dies auch innerhalb von hochintegrierten Blade-Server-Systemen möglich. Dort lassen sich dann Switch-Modul, virtuelles Gast- oder Wirtssystem oder sogar einzelne Netzwerk-Stacks als eindeutige Ursache isolieren. In vielen Unternehmen versuchen IT-Verantwortliche die Ursachen für Performance-Verschlechterungen zunächst mit herkömmlichen Mitteln einzugrenzen. Zum Beispiel, indem sie die Auslastung einzelner Netzwerkschnittstellen beobachten. Doch die Auslastung ist kein ausreichender Indikator für die Übertragungsqualität und Performance eines Netzwerks. So kann ein zu 70 Prozent ausgelasteter WAN-Link eine gute Performance liefern - während Pakete im LAN verloren gehen, obwohl die LAN-Schnittstellen oft nur zu ein bis zwei Prozent ausgelastet sind.   Geeignete Verfahren für das Monitoring Grundsätzlich sind sowohl Appliance-basierende als auch agentenbasierende Monitoring-Lösungen für das Ermitteln von Paketverlusten geeignet. Appliances sind über Testzugangspunkte (Test Access Point, TAPs) oder Mirror Ports angekoppelt und untersuchen punktuell den laufenden Netzwerkdatenverkehr. Zu den Stärken vieler Appliances zählt deren Fähigkeit, die passiv gesammelten Netzwerkdaten zum Beispiel mit forensischen Verfahren sehr detailliert zu analysieren. Doch genau diese Informationsfülle kann ein Nachteil sein, wenn schnelle Aussagen gefragt sind. Einzelne Ereignisse können darin untergehen. Zudem besteht das Problem, dass Appliances anhand der Retransmissions zwar Paketverluste erkennen, aber nicht die Richtung und somit die Quelle dafür ermitteln können. Somit bleibt nur die Kenntnis, dass es Paketverluste gibt - nicht mehr.   Übertragungsweg von Ende zu Ende messen Ist eine schnelle Beurteilung wichtiger Netzwerk-Qualitätsparameter zum Eingrenzen von Performance-Problemen gefragt, spielen agentenbasierende Monitoring-Lösungen ihre Stärken aus: Diese messen den gesamten Übertragungsweg von Ende zu Ende und liefern Kerninformationen sofort. Innerhalb von nur einer Minute lässt sich damit die Fehlerquelle isolieren beziehungsweise das Netzwerk als Ursache ausschließen. Dazu lassen sich an jedem Ende einer Übertragungsstrecke kostengünstige, soft- oder hardwarebasierende Agenten installieren. Diese simulieren definierte, vorhersagbare Transaktionen. Der zusätzliche Bandbreitenverbrauch ist bei qualitätsrelevanten Messungen extrem gering und belastet das Netzwerk praktisch nicht. Da an jedem Ende der Messstrecke ein Agent arbeitet, kann das IT-Team die Richtung bestimmen, aus der Pakete wiederholt gesendet werden (Retransmissions). So ist es leicht möglich, den Übertragungskanal als Ursache auszuschließen und Teilstrecken zu identifizieren, die für die Paketverluste verantwortlich sind. Zudem können die IT-Administratoren die Netzwerklatenz (One-way Delay) in beide Richtungen sehr genau bestimmen. Auf diese Weise lässt sich feststellen, ob eher die Übertragung vom Client zum Server oder umgekehrt für eine Verzögerung verantwortlich ist. Darüber hinaus können die Endpunkte auch direkt auf den Clients, Gästen und Wirten in virtualisierten Umgebungen laufen - auch in Blade-Servern. Somit sind Messungen direkt zum Server und zum Client realisierbar - ein großer Vorteil, da sich so auch Probleme innerhalb einer virtuellen Maschine visualisieren lassen. Im Gegensatz zu Appliances arbeiten agentenbasierende Systeme unabhängig von der Netzwerkgeschwindigkeit. Appliances müssen hingegen mit den passenden Schnittstellen ausgestattet sein, wenn sie den gesamten Datenverkehr analysieren sollen. In schnellen Netzwerken, die zum Beispiel mit 10 GBit/s arbeiten, kann dies zu erheblichen Mehrkosten führen. Agentengestützte Monitoring-Lösungen sind im Vergleich preislich deutlich günstiger. Netcor beispielsweise bietet seine Software-Endpunkte kostenlos für alle gängigen Betriebssysteme wie Windows, Linux, Unix, Mac OS X, IOS und Android an. Daher lassen sich auch in großen Netzwerken die Rechner der Endanwender damit ausstatten. Bemängelt ein Benutzer die Performance, können IT-Administratoren gezielt die Übertragungsstrecke zu dessen PC überprüfen. Einmal installiert, können IT-Verantwortliche ein agentenbasierendes System zudem als proaktive Monitoring-Lösung verwenden.   Schwachstellen frühzeitig erkennen Die Performance-Management-Software Geniend2end Network von Netcor beispielsweise arbeitet auf Anwendungsebene und simuliert autark vordefinierte Ende-zu-Ende-Transaktionen. Sie ermittelt dabei wichtige Qualitätsmetriken wie One-way Delay, Jitter und Paketverluste. Werden einstellbare Schwellenwerte über- oder unterschritten, alarmiert das System die IT-Verantwortlichen. Performance-Beeinträchtigungen zum Beispiel durch lange Antwortzeiten lassen sich auf diese Weise ohne aufwändige Paketanalyse rasch erkennen und zuordnen. So überwacht das System die Performance konvergenter Triple-Play-Applikationen auf dem Netzwerk automatisch und kontinuierlich von Ende zu Ende. Es identifiziert dabei potenzielle Probleme, bevor Anwender davon betroffen sind. Über standardisierte Schnittstellen lässt sich ein solches System zudem in Netzwerk-Management-Konsolen einbinden.   Fazit Die Frage nach dem richtigen Netzwerk-Monitoring-Werkzeug für das Aufspüren von Paketverlusten stellt keine Entweder-oder-Entscheidung dar. Vielmehr können sich agentenlose und agentenbasierende Produkte sehr gut ergänzen. Letztere liefern auch in komplexen, hochintegrierten Umgebungen schnell Antworten, mit denen sich ein Performance-Problem rasch eingrenzen lässt. Die IT-Verantwortlichen profitieren dabei von einer deutlichen Zeitersparnis. Zudem sind diese Systeme kostengünstiger und arbeiten unabhängig von der physischen oder virtuellen Infrastruktur. Wenn hingegen besonders tief gehende Analysen des Netzwerkverkehrs erforderlich sind, können agentenlose Systeme ihre Stärken ausspielen.

Mit der Performance-Management-Software Geniend2end Network von Netcor lassen sich sporadisch auftretende Paketverluste sehr einfach ermitteln und darstellen - hier für einen Zeitraum von vier Tagen.

Schematische Darstellung der Positionierung Appliance-basierender Messtechnik (rot) und agentenbasierender Messtechnik (grün) zur Ermittlung von Paketverlust.

Als kostengünstiger Hardwareendpunkt für agentenbasierendes Monitoring lässt sich zum Beispiel der Genijack von Netcor einsetzen.
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Lampertz GmbH & Co. KG

Matchmaker+