Tausend Wörter verbessern Spracherkennung
Wenn Computer Texte oder gesprochene Sprache verarbeiten, analysieren sie meist nur einzelne Wörter und Sätze. Das will der Wissenschaftler Dietrich Klakow ändern und damit die Funktion von Suchmaschinen oder Sprachdialogsysteme verbessern.

Der Saarbrücker Wissenschaftler will bei der automatischen Spracherkennung stärker berücksichtigen, was in den letzten tausend Wörtern gesagt oder geschrieben wurde. Für seine Forschungsarbeiten in diesem Bereich erhält er jetzt den mit 70.000 Dollar dotierten GoogleResearch Award. Der Professor für Sprachsignalverarbeitung der Universität des Saarlandes setzt statistische Verfahren ein, um Sprachen automatisch zu verarbeiten. »Bei unseren Methoden kommt es weniger darauf an, ob es sich nun um Englisch oder Ungarisch handelt. Wichtiger ist, dass der Computer über große Textmengen die Muster und Strukturen einer Sprache erfasst«, sagt Klakow. Sein Ziel ist es, dass der Computer automatisch den Sinn von Texten erkennt und auf eine Frage selbständig die passende Antwort findet. »Wir wollen dafür keine großen Wissensdatenbanken wie etwa Wikipedia aufbauen, sondern der Computer soll in einem großen, aber unstrukturierten Textbestand die richtigen Informationen zusammensuchen«, sagt der Forscher. Die dabei eingesetzten maschinellen Lernverfahren könnten auch dazu beitragen, gesprochene Sprache etwa in Übersetzungsprogrammen oder Diktiergeräten besser zu verarbeiten.
Der Wissenschaftler meint, dass die meisten Sprachdialogsysteme bislang zu wenig beachtet haben, in welchem Zusammenhang die Sätze gesprochen werden. Er geht davon aus, dass die zuletzt gesprochenen oder geschriebenen tausend Wörter viel über den Kontext aussagen. Diese Textmenge müsse der Computer daher genauer unter die Lupe nehmen und automatisch einordnen können. »Der Mensch hat beim Reden oft Gedankensprünge und wechselt von einem Thema zum nächsten. Dennoch schweift man in der Regel nicht völlig von den Inhalten ab, die etwa tausend Wörter zuvor gesprochen wurde«, so Klakow. Beim automatischen Übersetzen könnte der Computer dann zum Beispiel schneller erkennen, ob von der »Decke« die Rede ist, die noch gestrichen werden muss, oder der warmen Bettdecke.