Beim Abrufen der Kontodaten, für das Diktieren von Patientenberichten oder bei der Einstellung des Navigationssystems – täglich arbeiten Millionen von Benutzern und Tausende von Unternehmen mit Spracherkennung und -synthese von Nuance ohne es zu wissen.
Michael-Maria Bommer, General Manager Dach bei Nuance, spricht mit funkschau über den aktuellen Stand der Sprachautomation und die Pläne des Unternehmens.
funkschau: Laut einer Studie von Nuance verlassen sich immer mehr Autofahrer auf die Sprachsteuerung von Navigations- und Infotainment- Systemen. Wo liegen die Vorteile?
Michael-Maria Bommer: Sprachsteuerung im Auto erhöht die Verkehrssicherheit. Die von der TU Braunschweig durchgeführte Studie belegt eine dreimal kürzere Reaktionszeit und bis zwölfmal weniger Korrekturen der Fahrspur, wenn Fahrzeugführer Kommunikations-, Navigations- und Unterhaltungssysteme mit Sprachbefehlen bedienen.
funkschau: Welche Branchen können darüber hinaus von Spracherkennung profitieren?
Bommer: Unsere Sprachlösungen werden inzwischen in den unterschiedlichsten Bereichen für Unternehmen und Privatkunden eingesetzt. Ein wichtiger Bereich ist die Automatisierung von Kundenanfragen im Callcenter, etwa bei Vodafone, T-Mobile und Payback. Nuance bietet darüber hinaus mit Dragon Naturally Speaking eine Diktierlösung für den täglichen Bürogebrauch mit entsprechendem Fachvokabular. Mit dem Einsatz von Spracherkennung oder -steuerung werden vor allem die Produktivität der Unternehmen sowie die Zufriedenheit der Nutzer gesteigert.
funkschau: Wie ist die Akzeptanz dieser verschiedenen Lösungen?
Bommer: Kunden und Unternehmen nehmen Sprachlösungen sehr gut an. Wir haben zu diesem Zweck verschiedene Studien in Deutschland aber auch weltweit durchführen lassen. Diese bestätigen uns, dass Sprachlösungen einen immensen Beitrag leisten, Kosten im Unternehmen zu senken und die Qualität im Kundenservice sowie die Zufriedenheit von Kunden zu erhöhen. T-Mobile spart allein in einem Jahr mehr als zehn Millionen Euro durch ihr Sprachportal ein. Auch wenn es Unternehmen im deutschen Markt gibt, die in ihren Marketing-Kampagnen darlegen, dass sie keinerlei Sprachautomatisierung nutzen. Die Alternative zu Sprachautomatisierung sind lange Warteschleifen und frustrierte Anrufer. So etwas kann sich heute kein Unternehmen mehr leisten.
funkschau: Einige Verbraucher wollen partout nicht mit einem Computer reden. Wie sollen Unternehmen vorgehen, damit diese Kunden nicht verloren gehen?
Bommer: Selbstverständlich sollte kein Unternehmen seine Kunden nötigen, mit einer Sprachapplikation zu sprechen. Es geht ja auch nicht darum, den Kundenservice komplett zu automatisieren. Vielmehr geht es darum, Agenten im Callcenter intelligent und sinnvoll zu unterstützen. Wichtig für die Akzeptanz sind die Einführung und Vermarktung der neuen Lösung. Damit wird den Kunden die Scheu genommen, einen komplett neuen Service zu nutzen.
funkschau: Mittlerweile bieten einige News-Portale im Web die Möglichkeit, sich die Nachrichten vorlesen zu lassen. Wann ist mit Systemen zu rechnen, die auch wirklich wie ein Mensch klingen?
Bommer: Text-to-Speech klingt nicht so flüssig wie ein aufgenommener Prompt - das stimmt. Jedoch ist der Klang von Text-to- Speech durchaus natürlich und kann durch Tuning verbessert werden. Ein Beispiel ist die Custom Voice der Swisscom. Diese individuelle Text-to-Speech-Stimme hebt die Marke Swisscom akustisch im Markt hervor.