Voice Interfaces in Form von Smart Speakern verfügen über keine Displays, die die Nutzung visuell und damit logisch unterstützen – eine Herausforderung für Voice UX Designer, die sich dazu noch einer enormen Anzahl von Varianten menschlicher Aussagen und Äußerungen gegenübersehen. Schon bei einem vermeintlich einfachen Befehl gibt es viele Möglichkeiten: “Alexa, Musik!”, “Alexa, ich möchte Musik hören!” oder “Alexa, würdest du bitte Musik abspielen” sind nur einige der Varianten, auf die der Sprachassistent reagieren muss. Ein Design- und Entwicklerteam kann daher das komplexe, menschliche Verhalten in einem bestimmten Kontext unmöglich vollständig vorhersehen. Aus diesem Grund bedarf es während der Entwicklung einer Sprachanwendung einer ganzen Reihe von Usability-Testings mit Nutzern. Dabei gibt es unterschiedliche Möglichkeiten, Usability-Tests durchzuführen – von Eye-Tracking über Fokusgruppen bis hin zu Rapid Prototyping. Eine besonders erfolgreiche und seit vielen Jahren bewährte Methode ist das sogenannte Wizard-of-Oz (WoZ)-Testing. Nach dieser Methode wird ein fertiges System simuliert, bevor einzelne Funktionen und Dialoge überhaupt erst implementiert wurden.
Wizard-of-Oz-Experiment |
---|
Als Wizard-of-Oz-Experiment wird in der Mensch-Computer-Interaktion ein Experiment bezeichnet, bei dem ein Mensch annimmt, mit einem autonomen System zu kommunizieren. Tatsächlich liegt nur ein Prototyp eines interaktiven Systems vor, das technisch noch nicht funktionsfähig ist. |
Das Wizard-of-Oz-Testing ist an die Idee der Geschichte des Zauberers von Oz angelehnt, der vorgibt, ein mächtiger Zauberer mit magischen Kräften zu sein, obwohl er in Wahrheit nur ein normaler Mensch ist, der – hinter dem Vorhang versteckt – Maschinen steuert. Er kreiert eine Illusion der Wirklichkeit. Übertragen auf die Anwendung im Interface-Design bedeutet das, dass Testpersonen in der Interaktion mit einem System beobachtet werden, obwohl dieses System noch nicht wirklich existiert. Einfache Maßnahmen erzeugen die Illusion eines voll funktionierenden Anwendungsszenarios. Voice UX Designer lernen, indem sie direkt mit den Testpersonen interagieren.
WoZ-Testing in der Praxis
Das eingangs erwähnte Küchenmodell könnte also die Kulisse für ein WoZ-Testing sein, mit der sich die Usability einer neuen Voice-Anwendung für Einkaufslisten überprüfen lässt. Die Testperson wird gebeten, beim tatsächlichen Hantieren in der fiktiven Küchenumgebung Sprachbefehle für Einkaufslisten zu geben.
Die Tests selbst können auf verschiedenen Umsetzungs-Level erfolgen. So kann die Testperson beispielsweise mit besagter Klopapierrolle, die den Smart Speaker symbolisiert, sprechen und dabei mit einem “Zauberer hinter dem Vorhang” kommunizieren, der auf die Nutzereingaben hin fertige Texte abliest. Der “Wizard” muss jedoch nicht unbedingt persönlich antworten. Er kann auch mit situativ eingespielten Audios arbeiten. Diese können zuvor eingesprochen oder durch die Text-to-Speech-Engine des jeweiligen Sprachassistenten generiert werden. Dadurch gelingt eine greifbare, realistische Testsituation. Ersetzt man zusätzlich die Kulisse durch eine richtige Küche mit Lebensmitteln und die Klopapierrolle durch einen zylindrischen Lautsprecher, welcher die Systemantworten auf Knopfdruck des ‚Zauberers’ wiedergibt, ist die Illusion perfekt.
Im Vergleich zu vielen anderen Usability-Test-Methoden, bringt das WoZ-Testing einige signifikante Vorteile mit sich:
Selbstverständlich ist das klassische Testing in Usability Labs mit dem tatsächlichen System in der fortgeschrittenen Projektphase nicht per se überflüssig. In Kombination mit WoZ-Testings lassen sich jedoch deutlich früher und schneller aufschlussreiche Erkenntnisse gewinnen und so letztlich effektiv bessere Voice-Anwendungen verwirklichen – nämlich, indem von Beginn an der Anwender und die von ihm ausgehende Interaktion in den Mittelpunkt des Designprozesses gestellt wird.
Empathie schlägt KI
Für Voice UX-Testing ist menschliche Intelligenz nötig. Vor dem Hintergrund, dass sich menschliche Intelligenz noch nicht komplett von einer KI oder einer Software ersetzen lässt, ist es durchaus sinnvoll, auf die eher traditionellen, vermeintlich überholten Testszenarien der WoZ-Methode zurückzugreifen oder zumindest damit zu ergänzen. Da “biologische” oder “organische” Intelligenz, wie sie in der menschlichen Kommunikation vorkommt – zum Beispiel im Umgang mit Ironie oder Sarkasmus – bei Voice Interfaces eine wesentlich bedeutendere Rolle spielt als bei einem grafischen User Interface, erweisen sich diese Methoden gerade bei Entwicklung von Voice User Interfaces als sehr wertvoll. Folglich sind ein empathisches Eingehen auf menschliche Fehler und Denkweisen und ein intuitives Interagieren für ein gutes User Interface Design wichtiger und erfolgsversprechender als eine ausgeklügelte KI.