Bei der klassischen Telefonie wird eine direkte Verbindung zwischen den Teilnehmern geschaltet und die Sprache in Echtzeit analog oder – im Falle von ISDN – digital übertragen. Bei Voice-over-IP wird die Sprache zunächst digitalisiert, dann werden kurze Sequenzen in Paketen zusammengefasst und als Sprachpakete verschickt. Die Datenmenge ist dabei im Vergleich zu Videos relativ gering, allerdings können in Einzelfällen Laufzeitverzögerungen oder Paketverluste aufgrund einer starken Netzauslastung zu Echos, Aussetzern oder Störgeräuschen führen. Einige Anbieter reservieren daher feste Bandbreiten für Sprachpakete oder priorisieren diese, um eine konstante Sprachqualität garantieren zu können.