Sprachsteuerung und maschinelles Lernen haben in den vergangenen Jahren enorme Fortschritte gemacht, berichtet Google-Manager Scott Huffman. Die Worterkennung funktioniert immer besser. Und die Geschwindigkeit beim Sprechen sei ein großer Vorteil gegenüber dem Eintippen. »Die Herausforderung ist, die Kommunikation so natürlich wie möglich zu gestalten«, sagt Huffman.
Assistenten können sogar über ein Kurzzeitgedächtnis verfügen. Ist beispielsweise eine Fahrt von München nach Hamburg geplant, kann man den Google Assistant fragen: »Wie lange brauche ich nach Hamburg?« Er nutzt den aktuellen Standort, berechnet den Verkehr auf der Route und gibt die Antwort. Und er merkt sich, worum es geht und nimmt dieses Wissen mit in das folgende Gespräch.
Lautet dann die zweite Frage »Wie ist das Wetter dort?«, gibt der Assistent die Vorhersage für die Stadt an der Elbe an. Das mag einfach klingen. Ist es aber nicht. Bis vor kurzem hätte die zweite Frage noch »Wie ist das Wetter in Hamburg?« lauten müssen. Mittlerweile erinnert sich der Assistent daran: Es geht um Hamburg. Ein Schritt hin zu einer natürlichen Kommunikation mit Maschinen.
Natürlich klingen mittlerweile auch die Stimmen - weil dahinter oft Menschen stecken. Um einen virtuellen Sprachassistenten zu bauen, der jedes Wort sagen kann, muss die Software weiter mit Wörtern gefüttert werden. Dazu stehen Sprecher Hunderte von Stunden in Tonstudios und nehmen oft zusammenhanglose Sätze in verschiedenen Stimmungen auf: fröhlich, ernst, neutral, fragend. Die synthetische Stimme kann dann später Beliebiges sagen - und es klingt wie ein Mensch.