Google will seine Künstliche Intelligenz zu einem Allzweck-Werkzeug für den Alltag machen. Das bringt den Internet-Riesen auf Kollisionskurs mit ChatGPT und Co.
Chatbots wie ChatGPT haben Google zuletzt oft in den Schatten gestellt – doch der Internet-Riese holt jetzt zum Gegenschlag aus. Auf der Entwicklerkonferenz Google I/O zeigte der Konzern seine Vision, wie seine KI die Nutzer im Alltag auf Schritt und Tritt begleiten beziehungsweise überwachen und ihnen das Leben – im besten Fall – erleichtern könnte. Eine zentrale Rolle spielen dabei auch Kameras von Smartphones und Computer-Brillen, dank denen die KI sehen kann, worauf der Mensch gerade schaut.
Das Herzstück des Plans heißt Gemini – Googles Antwort auf ChatGPT und Co. Unter der Haube von Gemini steckt ein Wirrwarr von KI-Modellen für verschiedene Aufgaben von der personalisierten Websuche bis zur automatisierten Kaufberatung.
Google-Manager ließen bei der I/O keinen Zweifel an den Ambitionen des Konzerns. „Die ultimative Vision für die Gemini-App ist, sie in ein universelles KI-System umzuwandeln“, sagte etwa der für Künstliche Intelligenz zuständige Topmanager Demis Hassabis. Dieses KI-System soll auf die Nutzer zugeschnitten sein und ihnen seine Dienste proaktiv anbieten, statt nur auf ihre Anfragen zu reagieren.
Die Basis für Googles Vorstoß ist die Rolle als seit Jahren dominierende Suchmaschine, die so gut wie alle Informationen im Netz erfasst und einen direkten Draht zu den Nutzern hat. Im Wettbewerb mit den neuen KI-Rivalen bessert Google seine Websuche zugleich mit Künstlicher Intelligenz auf. Die Vision ist, dass man statt einer Liste von Weblinks häufiger ausführlichere Antworten bekommt und auch weitere Nachfragen dazu stellen kann.
Den ersten Schritt in diese Richtung machte Google vor einem Jahr mit der KI-Zusammenfassung von Informationen oberhalb der anderen Suchergebnisse. Diese Funktion, die in Deutschland „Übersicht mit KI“ heißt, erreicht laut Konzernchef Sundar Pichai bereits mehr als 1,5 Milliarden Nutzer.
Die nächste Stufe ist der KI-Modus, der ausführlichere und argumentierte Antworten auf Suchanfragen geben kann. So könnte der KI-Modus zum Beispiel lernen, bei der Suche nach einem Hausgerät die Kaufberatung zu übernehmen.
Schaut man sich nach einer Wohnung oder Tickets für ein Event um, soll die Software in der Lage sein, eigenständig das Web zu durchsuchen, um die beste Auswahl zu finden. Wenn man das wolle, könnte das Programm in diesem sogenannten „Agent Mode“ auch gleich den Besichtigungstermin für ein Apartment buchen. Hat man einen Preisalarm zur Produktsuche eingerichtet, soll Gemini auch zuschlagen können.
KI von Google soll auch bei der Reparatur eines Fahrrads helfen können. Dabei kann man Gemini nicht nur nach passenden Ersatzteilen fragen und bitten, sie zu besorgen, sondern auch die Kamera des Smartphones auf einzelne Schrauben richten und fragen, welches Werkzeug man dafür braucht. Damit die Hände frei bleiben, soll diese Rolle die Kamera in Computer-Brillen übernehmen. Google zeigte auf der I/O auch Prototypen schlanker Brillen, die Informationen ins Blickfeld der Nutzer einblenden können. Wann die Geräte auf den Markt kommen könnten, ist allerdings offen.
KI steht auch im Mittelpunkt anderer Google-Ankündigungen bei der I/O. So steigt der Konzern ins Geschäft mit der virtuellen Anprobe ein. Die Software versucht dabei, mit dem Wissen über den Körperbau der Nutzer und das Material der Kleidung so gut wie möglich zu berechnen, wie die Stücke sitzen werden. Mit „Veo 3“ verbessert Google seine KI-Software, die Videos generiert, so dass sie auch für den professionellen Einsatz geeignet sein soll. Das Modell kann erstmals auch automatisch die passenden Töne zum Bild erzeugen.