Grok erweitert Interaktionsfähigkeiten durch visuelle Analyse

Musks KI-Chatbot erhält Kamerazugriff und multilinguales Sprachverständnis, während die Premium-Version mit Echtzeitsuche aufgewertet wird.
Visuelle Intelligenz ausschließlich für iOS-Nutzer
xAI hat seine Grok-Plattform um eine wesentliche sensorische Dimension erweitert: Die neue "Grok Vision"-Funktion ermöglicht es dem Chatbot, über die Smartphone-Kamera seine Umgebung zu erfassen und auf visuelle Anfragen zu reagieren. Diese Technologie erlaubt die Analyse von Produkten, Dokumenten, Schildern und sogar Bildschirminhalten – bleibt jedoch vorerst Apple-Nutzern vorbehalten, wie xAI-Mitarbeiter Ebby Amir auf X mitteilte.
Sprachliche Expansion und Echtzeitfähigkeiten
Parallel zur visuellen Erweiterung vollzieht Grok eine bedeutende sprachliche Diversifizierung. Der Sprachmodus unterstützt jetzt neben Englisch auch Spanisch, Französisch, Türkisch, Japanisch und Hindi, während Deutsch noch auf die Implementierung wartet. Die ebenfalls neue Echtzeitsuche im Sprachmodus ist allerdings dem Premium-Segment vorbehalten – Nutzer müssen für den "Super-Grok-Tarif" monatlich 30 US-Dollar investieren.
Positionierung im KI-Assistenzmarkt
Die kontinuierliche Funktionserweiterung, darunter auch die Gesprächserinnerung, deutet auf Musks Ambitionen hin, Grok als persönlichen KI-Assistenten zu etablieren. Die im Februar eingeführte Grok-3-Familie mit differenzierten Modellgrößen und speziellen Reasoning-Fähigkeiten unterstreicht diese strategische Ausrichtung.
Bemerkenswert bleibt Musks bewusst liberaler Umgang mit Sprachbeschränkungen – der Voice-Mode kann im Gegensatz zu Wettbewerbern auch Stöhnen und Fluchen. Diese permissive Haltung hat zusammen mit den Trainingsmethoden bereits die Aufmerksamkeit der irischen Datenschutzbehörde geweckt, die untersucht, wie personenbezogene Daten europäischer Nutzer für das Training von Grok verwendet wurden.