Während einerseits das Thema Spracherkennung derzeit großes Medieninteresse erfährt, hat sich andererseits fast unbemerkt eine Technologie verbreitet, die genauso spektakulär ist: die Sprachsynthese. funkschau beleuchtet, auf welchen Prinzipien sie basiert und sagt Ihnen, ob diese Technik auch für Sie in Frage kommt.
Hätten Sie’s gewusst? Ansagen auf Bahnhöfen und Flughäfen werden längst nicht mehr von Menschen gesprochen. Das, was durch die Lautsprecher ertönt, wird bis auf wenige Ausnahmen durch Sprachsynthese erzeugt. Die Technik hat sich so weit entwickelt, dass nicht mehr blecherne und abgehackte Stimmen unser Hörorgan schädigen, sondern dass diese künstlichen Stimmen kaum bis gar nicht mehr von menschlichen Stimmen zu unterscheiden sind. Das hat wiederum zur Folge, dass Sprachsynthese mittlerweile auch in Callcentern von Banken, Hotlines, Telekommunikationsunternehmen und Fluglinien eingesetzt wird.
Es gibt jedoch nicht das universelle Sprachsynthese- System, da die Einsatzgebiete stark variieren. Die Entscheidung, welches System einzurichten ist, muss am Einsatzziel und dem Geschäftsmodell des Unternehmens ausgerichtet werden. Wenn es beispielsweise darum geht, Anrufe zu automatisieren, sind gute Verständlichkeit von Zahlen und Buchstabenkombinationen sehr wichtig. Werden dagegen längere Texte vorgelesen, ist das ermüdungsarme Zuhören sicherlich oberstes Entscheidungskriterium für die Entwicklung des Text-to-Speech-Systems.
Nicht nur das Gesamtdesign des Systems, auch die Stimme, die auf dem System erzeugt wird, sollte dem Geschäftsziel angepasst werden. Eine Stimme, die einem jugendlichen Publikum Computerspiele verkauft, sollte diese Zielgruppe auch in ihrer Sprache ansprechen – im doppelten Sinne. Mehr Seriosität braucht eine Stimme, die bei einer Bank zum Einsatz kommt. Auch regionale Aspekte sollten berücksichtigt werden.
Fazit
Grundlage für den zunehmend breiteren Einsatz von Sprachsynthesesystemen sind hauptsächlich zwei Faktoren. Zum einen der Wettbewerb: Viele Hersteller bieten vergleichbare Services an und müssen daher gleichzeitig ihre Kosten begrenzen sowie sich von den Mitbewerbern abheben. Zum anderen ermöglichen die ständig steigenden Rechen- und Speicherkapazitäten, dass Text-to- Speech immer natürlicher klingen wird.
Weitere Informationen zum Thema, zum Beispiel Bewertungskriterien für Sprachsynthese-Systeme, finden Sie in der aktuellen funkschau (#23, Seite 6-9)