Service-Provider, die Voice-over-IP-Techniken (VoIP) über ihr Netz anbieten, müssen dafür sorgen, dass die wahrgenommene VoIP-Dienstequalität beim Kunden stimmt. Diese hängt davon ab, wie gut ein Service-Provider die allgemeine Dienstqualität und den VoIP-Traffic in seinem Netz managt. Besonderen Raum nehmen dabei Methoden und Implementierungen von Prüf- und Überwachungskonzepten ein, mit denen sich Netzwerkverhalten und Dienstqualität bestimmen lassen.
Die Umstellung auf VoIP läuft bereits seit Jahren, und Netzwerke der nächsten Generation werden
ausschließlich mit VoIP realisiert. Dennoch wird es noch für eine ganze Weile nicht ohne Umwandlung
zwischen Leitungs- und Paketvermittlung gehen, um die Interoperabilität mit leitungsvermittelten
Netzen zu gewährleisten. Selbst wenn die Übertragung ausschließlich per IP erfolgt, werden nahezu
immer zwei Digital-Analog-Umwandlungen notwendig sein – und sei es nur im Endgerät des Anwenders.
Auch ein Transcoding zwischen verschiedenen Codec-Typen kann erforderlich werden, wenn im IP-Netz
abweichende Codecs zum Einsatz kommen.
Das Ziel beim Messen der VoIP-Qualität ist es, eine präzise Aussage über die Wahrnehmung des
Kunden zu erhalten, um diese zum Erstellen vergleichender Reports zu verwenden. Das verbreitetste
Maß für die Sprachqualität ist der Mean Opinion Score (MOS) gemäß der ITU-T-Empfehlung P.800.
Allerdings ist der MOS-Wert ein subjektives Maß der Hör- oder Gesprächsqualität. Besser wäre eine
objektive Methode, mit der sich eine hinreichende Annäherung an die subjektive Bewertung erzielen
ließe.
Es gibt mehrere passive und aktive Messmethoden, von denen einige durch Normungsinstitutionen
wie die Internationale Telekommunikations-Union (ITU-T) definiert wurden, während andere von
Anbietern entwickelt wurden, um bestimmte Messaspekte weiterzuentwickeln.
Passive Messmethoden
Die passive Überwachung untersucht einen Stream mit Sprach-Traffic und erzeugt daraus einen
Messwert zur Übertragungsqualität. Der Vorteil einer passiven, nicht referenzbasierten Methode ist
die wesentlich bessere Abdeckung aller möglichen Kombinationen von Anwenderendpunkten. Außerdem
überwachen diese Verfahren echte Datenströme zwischen wenigen ausgewählten Endpunkten in relativ
großen Zeitabständen. Damit kann der Administrator vorübergehende Probleme erkennen, die sich mit
simulierten Verbindungen nicht ohne Weiteres reproduzieren lassen. Die passive Überwachung nimmt
außerdem nur relativ wenige Ressourcen in Anspruch und setzt keine Interaktion mit den Endpunkten
voraus.
Die verbreitetste passive Methode spezifiziert das eModell der ITU-T-Richtlinie G.107. Sie
berücksichtigt die Eigenschaften und Beeinträchtigungen analoger und digitaler Netzwerke und
interpretiert zur Ermittlung des "Transmission Rating Factor" (R-Faktor) mehr als 20 verschiedene
Parameter. Zu den gemessenen Parametern gehören beispielsweise die Signallaufzeit, Jitter,
Paketverluste und Paketverlust-Bursts. Der R-Faktor ist ein Maß für die Gesprächsqualität des
modellierten Übertragungssystems im Schmalbandbereich mit einer Skala von 0 (schlechtester Wert)
bis 100 (bester Wert). Er lässt sich in eine genäherte Entsprechung zu einem MOS-Wert (für Hör-
oder Gesprächsbetrieb) umwandeln, was eine gute Korrelation (etwa 0,9) mit subjektiven
MOS-Messungen ergibt.
Aktive Messmethoden
Die aktive Überwachung basiert dagegen auf simuliertem Traffic. Dabei wird ein bekanntes
Testsignal über ein Netzwerk von einem Endpunkt zum anderen übertragen und der Ausgang mit dem
ursprünglichen Signal (Referenzwert) verglichen. Mit dieser Methode kann der Administrator zum
Beispiel Performance-Bezugslinien festlegen und überwachen, ohne zu riskieren, dass sich die
Testsignale von einer Testsequenz zur anderen ändern. Außerdem lassen sich auf diesem Weg
Punkt-zu-Punkt-Tests für Diagnosezwecke durchführen. Da aktive Methoden für die Messung eine
bekannte Größe, nämlich das Testsignal, heranziehen, ergibt sich eine bessere Korrelation: meist
über 0,9 bis zu 0,95 mit subjektiven MOS-Messungen. Doch das Generieren der Testverbindungen nimmt
zusätzliche Netzwerkressourcen in Anspruch und setzt eine spezifische Endpunktinteraktion voraus.
Die verbreitetste und als Industriestandard etablierte Methode ist im PESQ-Modell (Perceptual
Evaluation of Speech Quality) der ITU-T-Empfehlung P.862 spezifiziert. Hier kommt ein sensorisches
Modell zum Einsatz, um das ursprüngliche, unverarbeitete Signal mit dem von der Gegenstelle des
Netzwerks oder Netzwerkelements empfangenen schlechteren Signal zu vergleichen.
Prüfmethoden
Service-Providern wird empfohlen, wo immer möglich eine Prüfumgebung bereitzustellen, die
ihre Netzwerkumgebung widerspiegelt. Dies erlaubt die Simulation des Anwender-Traffics und eine
Emulation des Verhaltens von Geräten, die mit sprach-orientierten Applikationen interagieren. Dabei
geht es um das Herstellen von Verbindungen, die Verifikation von Features, das Messen der
Sprachqualität und die Bestimmung der Performance unter Last sowie den Nachweis der System- und
Multi-Vendor-Interoperabilität.
Das Testen der Features ist eine wichtige Qualitätssicherungsmaßnahme, wenn die korrekte
Implementierung und Funktionalität von VoIP-Produkten, -Netzwerken und -Applikationen verifiziert
werden soll. Feature-Testing umfasst Isolations, Regressions- und Interoperabilitäts-Tests für die
Anbieter, Konfigurations- und Technikverifikation. Als Ergänzung dient das Load-Testing dazu, die
korrekte Funktionalität in Belastungssituationen zu verifizieren. Dieses Verfahren erfasst die
simulierte maximale Anrufhäufigkeit, Massenanrufe, hohe Registrierungsaufkommen, System-attacken
und andere Situationen, die das Netzwerk zusätzlich belasten. Da die Tests mit simuliertem Traffic
stattfinden, basiert die Bewertung der Sprachqualität auf aktiven Messtechniken.
Prüflösungen setzen Flexibilität und Anpassungsfähigkeit voraus, einerseits um verschiedene
Netzwerk- und Dienstkonfigurationen abdecken zu können, andererseits aber auch, um sich auf neue
VoIP-Techniken, -Applikationen und -Deployment-Modelle einstellen zu können. Ein Beispiel hierfür
ist die Unterstützung einer großen Codec-Vielfalt.
In öffentlichen leitungsgebundenen Netzwerken haben zwei Codec-Typen die größte Verbreitung:
Waveform-Codecs wie G.711 oder G.726 und Source-Codecs wie G.723.1, G.728 oder G.729. Darüber
hinaus gibt es Hybrid-Codecs (zum Beispiel AMR, EVRC oder G.722.2) für den Einsatz in drahtlosen
Netzwerken und im Internet. Die Codecs unterscheiden sich hinsichtlich ihrer Attribute bei der
präzisen Wiedergabe von Sprache, der Verzögerung durch die Verarbeitung des Algorithmus, der
erforderlichen DSP-Performance, des Bandbreitenbedarfs (in KBit/s) und der Beeinträchtigungen
infolge des jeweiligen Netzwerktyps. Alle diese Faktoren kommen bei der Entscheidung des
VoIP-Dienstanbieters ins Spiel, welche Codecs mit Blick auf die Netzwerkbandbreite, die Kosten und
die Erwartungen des Kunden berücksichtigt werden sollen.
In einem Netzwerk mit den verschiedenen daran angeschlossenen Netzwerken existieren oft
mehrere Codec-Typen. In vielen Fällen wird deshalb ein Transcoding notwendig sein, um eine
Verbindung aufzubauen. Aus diesem Grund müssen Testlösungen die gesamte Codec-Palette und deren
Verhalten abdecken. In diesen Netzen fungiert ein Trunking-Media-Gateway als bidirektionale
Querverbindung und Transcoder zwischen TDM und RTP.
Folgende Elemente sind notwendig, wenn es sich beim Prüfling (Device Under Test – DUT) um ein
Media Gateway handelt:
Media-Gateway-Controller (MGC) oder emulierter MGC mit einem Media-Gateway-Control-Protokoll
wie zum Beispiel H.248,
Emulation von PSTN-Teilnehmern, die Anrufe an das Gateway auslösen oder TDM-Anrufe vom
Gateway entgegennehmen und dabei zum Beispiel DSO Bearer Channel Media (E1, T1) oder ISDN User Part
(ISUP) via SS7 MTP oder SIGTRAN gemäß IETF RFC 2719 nutzen, und
Emulation von Core-IP-Devices, die Anrufe an das Gateway auslösen oder Anrufe vom Gateway
erhalten und dazu RTP/RTCP-Media oder SIP nutzen.
Über die Messungen zur VoIP-Qualität erfährt der Administrator, ob die Meldungen korrekt sind
und das Steuerungsprotokoll sich erwartungsgemäß verhält. Er weiß, ob die Querverbindung von einem
PSTN- und/oder IP-Port zum anderen gemäß den Signalisierungsbefehlen arbeitet. Zudem ist die
Codierung der RTP-Medien überprüft, Codec- und Payload-Typ sind korrekt ausgehandelt und die
Inter-Packet-Verzögerung entspricht den Signalisierungsattributen.
Über die Performance-Werte erfährt der Systembetreuer, ob zum Beispiel die
erwarteten/geforderten Audio-/Sprachqualitätsstufen (PESQ oder MOS) eingehalten werden und ob die
Verzögerung zwischen Anforderungs- und Reaktions-Transaktion in einem akzeptablen Bereich liegt. Er
kennt die Paketlaufzeiten bei der Weiterleitung oder beim Routing von Medien durch den Gateway und
sieht die Steuerungssignalisierung und kann die Medien durch den Gateway übertragen, ohne den
Traffic zu beeinträchtigen.
Proaktive Überwachung
Um Probleme mit der Dienstqualität bereits vorbeugend zu vermeiden, gehen viele Provider die
Überwachung des VoIP-Netzwerks und der Dienste proaktiv an. So lassen sich Ereignisse rasch
identifizieren und auf eine Ursache zurückführen. Messungen der Dienstqualität können mit passiven
oder aktiven Methoden angestellt werden. Bei großen Netzen ist es ratsam, das gesamte Netz passiv
zu überwachen und die aktive Methoden nur für die Fehlerdiagnose oder bei der Installation
einzusetzen.
Wichtige Kenndaten für die Überwachung der VoIP-Dienstqualität sind zum Beispiel
zusammengefasste Anrufsignalisierungsmesswerte wie Answer Size Ratio, Network Efficiency Ratio,
Busy Hour Call Attempts, erfolgreiche und fehlgeschlagene Versuche sowie der durchschnittliche,
minimale und maximale Post Dial Delay, die Verbindungslatenz oder auch die Verbindungsabbauzeit.
Ebenfalls interessant ist eine Aufstellung wichtiger Mediamesswerte wie beispielsweise die Zahl der
empfangenen, verlorenen, doppelten oder außer der Reihe angekommenen Pakete, der durchschnittliche,
minimale und maximale MOS, Jitter oder auch die Laufzeit. Das eingesetzte System sollte die
Messwerte auch verbindungsbezogen anzeigen können – zum Beispiel den Post Dial Delay, die
Verbindungslatenz und die Medienqualität wie etwa der MOS für alle RTP-Streams einer Verbindung.
Weiterhin können auch Faktoren, die nicht der Kontrolle des Service-Providers unterliegen,
Auswirkungen auf die vom Anwender wahrgenommene VoIP-Qualität haben wie beispielsweise ungewollte
Flood-Events. Hier kann das Verhalten eines Service-Provider-Netzwerks negative Konsequenzen für
die angeschlossenen Partner haben.
Allerdings liefert die Feststellung eines solch hohen Aufkommens an Invite-Messages für sich
genommen noch nicht genügend Information, um Aufschluss über das Geschehen zu bekommen. Damit das
Überwachungssystem solche Ereignisse melden kann, muss der Administrator ein reguläres
Verbindungsverhalten und entsprechende Grenzwerte dafür festlegen, um eine Bezugslinie zu schaffen,
an der die Dienstqualität fortlaufend gemessen werden kann.
Solche Benchmarks sollte er für mehrere Segmente des Netzen festlegen, damit er zum Beispiel
Probleme im Zugangsbereich, im Kern oder an den Verbindungspunkten des Netzwerks einkreisen und die
Auswirkungen einer Invite-Flut minimieren kann.
Ein weiterer wichtiger Aspekt der Überwachung ist die Nutzung detaillierter Diagnosen der
erfassten Daten, um festzustellen, ob Systemattacken mit dem Ziel durchgeführt werden, die
Dienstqualität negativ zu beeinflussen. Wichtig ist, dass sich eine gezielte Attacke zum Zeitpunkt
der Erkennung nicht von einem Flood-Event unterscheidet, das keinen böswilligen Ursprung hat.
Es kommt auf eine schnelle und präzise Ursachenermittlung an, da je nach der Quelle der
Attacken sehr verschiedene Abhilfemaßnahmen erforderlich sind – zum Beispiel das Blockieren von
Traffic aus der Quelle eines Angreifers anstelle einer Rekonfiguration von Equipment an einem
Netzwerkverbindungspunkt.
Es ist einem Service-Provider kaum möglich, sämtliche Faktoren zu kontrollieren, die sich auf
die Dienstqualität auswirken. Innerhalb des eigenen Kontrollbereichs sollten jedoch alle störenden
Faktoren bekannt sein und berücksichtigt werden.
Daniel Teichman ist Senior Product Marketing -Manager des Testsystemherstellers Empirix.