Bei der Übermittlung von Echtzeitdaten muss man folgende unterschiedliche Arten der Paketverluste unterscheiden:
Der Verlust von mehreren aufeinander folgenden Datenpaketen (Daten-Burst) ist vom Empfänger nicht mehr kompensierbar und wirkt sich als Übertragungsstörung aus. Vereinzelte Paketverluste werden vom Gehör/Gehirn interpoliert und fallen dem Zuhörer nicht auf. Paketverluste wirken sich jedoch um so stärker aus, je länger der so genannte Payload (Sprach-/Videoanteil im Paket) ist. Codecs weisen eine gewisse Toleranz gegenüber Paketverlusten auf. In Abhängigkeit vom genutzten Codec der Anwendung bemerkt der Nutzer die unterschiedlich stark aufgetretenen Paketverluste nicht.
Einzelne VoIP-Geräte nutzen die so genannte Packet-Loss-Concealment- (PLC-) Technik zur Unterdrückung der Auswirkung von Paketverlusten. Kurzfristige Aussetzer im digitalen Datenstrom werden dadurch überbrückt. Die Aufgabe der PLC-Technik im Empfänger besteht darin, eine möglichst gute Schätzung des fehlenden Signalabschnitts zu generieren und somit die hörbare Störung weitgehend gering zu halten. Die dabei erzielbare Qualität hängt von mehreren Faktoren ab, insbesondere von der Länge des verlorenen Segments, der Stationarität des Sprachsignals zum Zeitpunkt des Verlusts, sowie der Menge verfügbarer Informationen von den umliegenden Sprachrahmen. Die Ersetzung verlorener Sprachrahmen wird im Falle stark komprimierender Sprachcodecs noch dadurch erschwert, dass es aufgrund der
Abhängigkeiten zwischen aufeinander folgenden Rahmen zu Fehlerfortpflanzung über die verlorenen Rahmen hinaus kommt.
Das einfachste PLC-Verfahren ersetzt die verlorenen Daten durch Stille. Aufwändigere Verfahren halten den letzten übertragenen Ton oder versuchen den Ton zu interpolieren.
Ältere Systeme nutzen die so genannte Waveform-Substitution wodurch die verloren gegangenen Signale durch künstlich erzeugte Ersatzsignale aufgefüllt werden. Dieses Verfahren führt bei hohen Paketverlusten jedoch oft zu einer unnatürlichen Roboterstimme. Neuere Algorithmen interpolieren die entstandenen Signallücken und erzielen eine bessere Klangqualität. Diese geht jedoch auf Kosten der hierfür notwenigen Rechenkapazitäten. Im Allgemeinen können Aussetzer mit einer Länge von bis zu 30 ms beziehungsweise mit einer Verlustrate von bis zu 20 Prozent überbrückt werden, ohne dass dies der Empfänger wahr nimmt.
Bei Videoströmen liegen die Toleranzgrenzen erheblich niedriger, da sich Paketverluste direkt durch eine fragmentarische Darstellung des Videosignals bemerkbar machen.
Bestehen mehrere parallele Übertragungsstrecken zwischen Sender und Empfänger, kann es vorkommen, dass die Pakete auf den jeweiligen Wegen unterschiedlich lang verzögert werden. Dadurch empfängt der Sender die Datenpakete in unterschiedlicher Reihenfolge. Die Ursache für Sequenzfehler ist meist auf das Routing der Pakete zurückzuführen. Auf dem Weg zwischen Sender und Empfänger werden die Pakete über unterschiedliche IP-Netzwerke/Subnetze übermittelt. So ergeben sich unterschiedliche Verzögerungszeiten. Diese pfadbezogenen Verzögerungen resultieren darin, dass eine geringe Anzahl an Paketen verspätet beim VoIP-Endpunkt eintrifft. In der Regel werden die Pakete in einem Eingangspuffer (Jitter-Buffer) zwischengespeichert. Dadurch hat der Endpunkt die Möglichkeit, die empfangenen Pakete wieder in die richtige Reihenfolge zu bringen und somit den Originaldatenstrom wieder herzustellen.
Bei der klassischen Datenkommunikation stellen Sequenzfehler kein Problem dar. Der Empfänger ordnet die Datenpakete anhand der TCP-Sequenznummer in der richtigen Reihenfolge und übergibt der höheren Anwendung einen korrekten Datenstrom. Aufgrund der Echtzeitbedingungen von VoIP-Systemen muss Sequenzfehlern beziehungsweise Problemen bei der Übermittlung von Sprache über IP-Netze mit einer vollkommen anderen Strategie begegnet werden. Einige VoIP-Systeme verwerfen alle außerhalb der Reihenfolge empfangenen Pakete. Andere VoIP-Systeme verwerfen empfangene Pakete mit Sequenzfehlern nur dann, wenn deren Größe die Länge des internen Puffers übersteigt. Dieses Verwerfen der Pakete hat einen gewissen Jitter und natürlich auch Paketverluste zur Folge.
Darüber hinaus kann auch ein Jitter auf dem Netzwerk zu Paketverlusten führen. Als Jitter bezeichnet man allgemein ein Taktzittern bei der Übertragung von Digitalsignalen beziehungsweise eine leichte Genauigkeitsschwankung im Übertragungstakt. In der Netzwerktechnik wird mit Jitter außerdem die Varianz der Laufzeit von Datenpaketen bezeichnet. Dieser Effekt ist insbesondere bei interaktiven Multimedia-Anwendungen störend, da dadurch Pakete zu spät eintreffen können, und dann nicht mehr zeitgerecht ausgegeben werden. Dies wirkt sich wie eine erhöhte Paketverlustrate aus, weshalb man diese Paketverluste auch als „jitter-bedingte Paketverluste“ bezeichnet. Treffen die Pakete regelmäßig beim Empfänger ein, können diese direkt in Audio-/Videosignale umgesetzt werden. Da die Verzögerungen bei der Übertragung nicht konstant sind, entstehen Lücken im abgespielten Signal. Zur Vermeidung von Lücken im Sig-nal werden die empfangenen Daten in einem Zwischenspeicher abgelegt. Dieser Zwischenspeicher hat die Aufgabe, die Lücken zwischen verspäteten Paketen zu kompensieren. Die Größe dieses Zwischenspeichers (Synchronisationspuffer oder Jitter-Buffer) kann ein oder mehrere Frames umfassen. Durch die Pufferung mehrerer Sprachpakete/Video-Frames kann ein größerer Jitter ausgeglichen werden. Durch den Einsatz von einem größeren Jitterbuffer wird jedoch die Gesamtverzögerung negativ beeinflusst. Hier liegt die Kunst darin, die optimale Abstimmung der Puffergröße zu finden.