Konferenz-Headset-Messverfahren

Prüfung an modernstem Messequipment

Konferenz-Headsets sollen Sprache unter allen Bedingungen verständlich übertragen. Zudem hilft es, wenn sich Gesprächspartner gegenseitig an der Stimme erkennen können und aus Stimmnuancen den Subtext des Gesagten erhören. Wie solche Details messtechnisch erfasst werden, erläutert dieser Artikel.

Autor: Bernd Theiss / Redaktion: Sabine Narloch • 31.3.2025 • ca. 6:25 Min

Bei Consumer Headsets sind es drei Kriterien, die die Qualität eines Kopfhörers maßgeblich bestimmen: Da ist der Frequenzgang bei Medienwiedergabe. Experten sprechen vom Amplitudenfrequenzgang, aber der Einfachheit halber bleiben wir bei der umgangssprachlichen Bezeichnung. Der Frequenzgang gibt an, wie gleichmäßig der Kopfhörer Eingangsspannungen in Schalldrücke verschiedener Tonhöhen umsetzt. Er ist damit ein Maß für die Neutralität der Wiedergabe, also ob sie neutral oder verfärbt, ausgewogen, hell oder dunkel klingt.

Ein weiteres Qualitätsmerkmal sind geringe Verzerrungen. Sie geben an, welche Signale ein Kopfhörer zu seinem Eingangssignal hinzufügt. Sie nehmen in der Regel mit steigendem Pegel zu.

Ab einem bestimmten Pegel werden sie als unangenehm empfunden. Überschreiten sie ein gewisses Maß, wird als drittes Qualitätsmerkmal der maximale Schalldruck erreicht. Spätestens ab diesem Maximalschalldruck werden Verzerrungen deutlich und störend hörbar.

Neben dem Frequenzgang bei Medienwiedergabe gibt es noch die Frequenzgänge beim Telefonieren in Empfangs- wie auch in Senderichtung. Bemerkenswert: Obwohl in Empfangsrichtung dieselben Schallwandler zum Einsatz kommen, wie bei der Medienwiedergabe, können die Frequenzgänge erheblich voneinander abweichen. Das liegt zum einen an unterschiedlicher Kodierung für Sprache und Musikwiedergabe, zum anderen daran, dass Sprache oft Bandbreiten- und Datenreduziert übertragen wird.

Diese und viele andere Merkmale misst das für connect professional tätige, verlagseigene Messlabor Testlab seit langem. Um für die neueste Generation von Konferenz-Headsets die Grenzen des messtechnisch Erfassbaren auszuloten, wandte sich das Testlab an den international renommierten Audio-Messtechnik-Spezialisten HEAD acoustics. In den 2024 bei HEAD acoustics gerade errichteten Räumlichkeiten mit neuem, zusätzlichem schallarmem Raum mussten die Headsets ihre Qualitäten an modernstem Messequipment unter Beweis stellen.

Messaufbau

Zentraler Bestandteil des Aufbaus ist das Kunstkopf-Messsystem HMS II.3 LN HEC von HEAD acoustics, das mit seinem künstlichen Mund und anatomisch geformten Ohren die Sprachqualität in Sende- und Empfangsrichtung misst. Allein über den HMS II und seine nahen Familienmitglieder, etwa in Varianten mit Nase für VR-Equipment, Knochenschallerzeugern für bestimmte In-Ear-Headsets und vieles mehr, ließe sich ein ganzer Artikel schreiben. Hier sei nur erwähnt, dass die Kunstkopf-Ohren einen riesigen Frequenz- (3 Hz bis 20 kHz) wie auch Dynamikbereich abdecken, der von extrem leisen 16 dBSPL bis hin zu Raketenstart-lauten, maximal messbaren 148 dBSPL reicht. Der künstliche Mund deckt einen Frequenzbereich von 50 Hz bis 20 kHz ab. Mund und Ohren sind nach ITU-T P.58 und P.57 standardisiert.

Hardware-Plattform des Messsystems ist das labCORE von HEAD acoustics. Seine analogen Ein- und Ausgänge bieten über 100 dB Verzerrungsabstand (THD+N) und bis zu 112 dB Rauschabstand. Daneben unterstützt das modular aufgebaute Gerät bei Bedarf zahlreiche Interfaces von Bluetooth und Bluetooth LE, über USB, ADAT, GPIO und mehr. Damit lassen sich neben Headsets ohne oder mit ANC, Freisprecheinrichtungen und Smart Speakern praktisch alle Arten von Audio-Messungen durchführen. Via Ethernet-Schnittstelle lässt sich zudem eine Verbindung zu Communication-Testern herstellen, um die Sprachqualität von Smartphones via Mobilfunk zu testen.

Doch so universell und qualitativ ausgefuchst dieses Mess-Interface auch ist, endgültig eine Klasse für sich ist die Expertise von HEAD acoustics, die in der Mess- und Analyse-Software ACQUA (Advanced Communication Quality Analysis) steckt. Diese bietet neben den klassischen Messungen von Frequenzgang, Klirrfaktor, Rauschabstand und Geräuschdämpfung auch eine große Anzahl an Tests zur gehörrichtigen objektiven Er-fassung der Sprach-Qualität. Dabei wird sowohl nach internationalen Standards, an denen HEAD acoustics federführend mitentwickelt hat, als auch nach von HEAD acoustics selbstentwickelten Qualitäts-Standards gemessen. Für die Headset nahm die Redaktion besonders die nachfolgend aufgeführten Aspekte ins Augenmerk.

POLQA

Über eine erfolgreiche Kommunikation während einer Konferenz entscheidet maßgeblich die Sprachqualität des Headsets. Diese lässt sich mit dem ITU-Standard P.863 messen, der häufig auch POLQA (Perceptual Objektive Listening Quality Assessment) genannt wird. Der Standard nutzt reale Sprachsignale weiblicher und männlicher Sprecher und vergleicht das übertragene Signal mit dem ungestörten Originalsignal. Die Bewertung findet nach dem sogenannten Mean Opinion Score (MOS) auf einer Skala von 1 (schlecht) bis 5 (ausgezeichnet) statt. MOS-Skalen finden üblicherweise immer dort Anwendung, wo es um die Bewertung von Bild- und Tonsignalen geht, sie sind aber nicht auf diese beschränkt. Der POLQA-Algorithmus wurde dabei so abgestimmt, dass seine Ergebnisse sehr nah an die Bewertung einer großen Anzahl von Testhörern in einem Hörversuch herankommen. Die Sprachqualität bestimmten wir sowohl in Sende- wie auch in Empfangsrichtung, also beim mit dem Headset gesprochenen wie empfangenen Wort.

EQUEST

Neben der Sprachqualität gibt es noch einen weiteren Faktor, der sich störend auf die Kommunikation mit Headsets auswirken kann, und das sind Echos. Jeder hat schon einmal erlebt, wie schwer es zu sprechen fällt, wenn das eigene Wort gut hörbar mit geringer Verzögerung ans Ohr gelangt. Neben Intensität und Verzögerung spielt auch die Frequenzverteilung des Echos eine Rolle, wie störend wir es wahrnehmen. Der durch Hörversuchsdaten trainierte, perzeptive Bewertungsalgorithmus EQUEST (ETSI TS 103 802) analysiert die einzelnen Aspekte in den Echo-Aufnahmen und beurteilt die Performance ebenfalls auf einer MOS Skala.

3QUEST

Da Kommunikation selten in geräuschfreier Umgebung stattfindet, misst 3QUEST (ETSI TS 103 281) die Sprachqualität unter definiertem Störschall. Man denke nur an Großraum-Büros mit dutzenden Arbeitsplätzen und Kollegen, die mit ihrem Lärm die Kommunikation erschweren. Moderne Konferenz-Headsets nutzen daher Multi-Mikrofon-Arrays, die durch ihre Richtwirkung zwischen dem vom Nutzer gesprochenen Wort und dem umgebenden Störschall unterscheiden können.

Der Kunstkopf mit dem zu testenden Headset wird dazu im schallarmen Messraum von einem Surround-Lautsprechersystem inklusive Subwoofer von genau definierten Stör-Signalen beschallt, wodurch sich Auswirkungen auf die Sprachqualität exakt erfassen lassen.

Für die Untersuchung entschieden wir uns für standardisierte Störgeräusche (ETSI TS 103 224), z.B. aufgezeichnet in einem Café oder an einer befahrenen Straße. Das Verfahren ermöglicht es, die Qualität des übertragenen Störschalls (N-MOS), der übertragenen Sprache (S-MOS) und im Gesamten (G-MOS) zu bewerten. Da sich aggressive Störgeräuschunterdrückung über Verzerrungen in der Sprache bemerkbar macht oder umgekehrt, klare Sprach-Übertragung teils nur mit hohem Restgeräuschpegel gelingt, sollten N- und S-MOS-Werte idealerweise nicht nur hoch, sondern auch nah beieinander liegen, und dann zu einer hohen Gesamtqualität des Signals führen.

Dieser letztgenannte G-MOS-Wert liegt für alle Headsets im Test im Bereich von „ordentlich“ bis „gut“. Bemerkenswert: Vor 20 Jahren waren MOS-Werte von 2,4 bis 2,7 („dürftig“ bis „ordentlich“) beim mobilen Telefonieren selbst in ruhiger Umgebung noch ganz normal. Man verstand seinen Gesprächspartner oft nur, weil das Gehirn in der Lage ist einen gewissen Anteil an unverstandenen Silben automatisch zu ergänzen. Interessant zu wissen ist auch, das Consumer-Headsets in dieser Disziplin oft deutlich schlechter abschneiden als für Konferenzen spezialisierte Geräte. Ihnen fehlen fast immer die langen Bügelmikrofone, die die Sprache an einer akustisch günstigen Stelle, nahe dem Mund aufnehmen.

ANC

Was in der Senderichtung die Störschallunterdrückung durch Multi-Mikrofon-Arrays und ggfs. zusätzliche Störgeräusch-Reduktion bewirkt, schaffen in Empfangsrichtung die Ohrmuscheln und bei entsprechend ausgestatteten Headsets das ANC (Active Noise Cancelling). Die Stärke der Lärmreduktion ist maßgeblich für den Komfort in lauten Umgebungen. Erstere wird in der psychoakustisch richtigen Einheit Phon und nicht in der technisch einfacher messbaren Einheit Dezibel (dB) angegeben. Nur bei einer Frequenz von 1000 Hertz sind dB und Phon gleich groß, bei sehr tiefen und sehr hohen Frequenzen sind deutlich höhere Dezibel-Werte für den gleichen, in Phon angegebenen Lautstärkeeindruck nötig. Neben der absoluten Lärmminderung ist zudem die Abhängigkeit der Dämpfung von der Frequenz interessant.

Die Geräuschunterdrückung wird deshalb auch in Abhängigkeit der Frequenz gemessen, in der Regel steigt sie durch die Dämpfung der Ohrmuscheln zu höheren Frequenzen an, durch eine ANC Funktionalität werden die Dämpfungen gerade im tieffrequenten Bereich aber noch deutlich verbessert. Viele ANC-Headsets bieten zudem einen Transparenz-Modus, der aktiviert, Sprache aus der nahen Umgebung oder auch Durchsagen ungedämpft dem Hörer zuleitet, so dass der Kopfhörer für direkte Unterhaltungen nicht abgenommen werden muss. Da die Realisierung der ANC-Funktion bei vielen Headsets auch Einfluss Frequenzgang und Verzerrungen hat, messen wir bei entsprechenden Exemplaren diese Größen jeweils mit und ohne ANC.

Fazit

Je nach Einsatzzweck spielen eine ganze Reihe von Eigenschaften eine Rolle, wie sich ein Headset im täglichen Gebrauch bewährt. Wer sein Konferenz-Headset auch zum Musikhören nutzen will, sollte auf einen geraden Frequenzgang und ein niedriges Verzerrungsniveau achten, oft kann per Equalizer in der herstellereigenen App eine persönliche tonale Feinabstimmung vorgenommen werden. Für die geforderte perfekte Kommunikation ist eine hohe Sprachqualität essenziell, wenn es im Gespräch auch auf Nuancen in Ausdruck und Tonfall ankommt. Wer das Headset im Großraumbüro oder unterwegs aus dem Zug nutzen möchte, sollte auf hohe 3QUEST-Werte achten, um vom Gegenüber bestens verstanden zu werden. Im Zug oder im Flugzeug ist ein leistungsfähiges ANC wichtig – weniger Lärm bedeutet nicht nur mehr Komfort, sondern auch höhere Leistungsfähigkeit und Regeneration.

Gerade wenn auch der Kaufpreis eine Rolle spielt ist es wichtig hier die Präferenzen richtig zu setzen.

Bernd Theiss ist Ingenieur für Nachrichtentechnik und Testlab-Leiter bei Weka Media Publishing