Google hatte seine Robotiksparte einst geschlossen, doch mit KI wagt Alphabet nun einen Neuanfang. Google DeepMind stellte am Dienstag zwei neue Modelle vor, die Roboter intelligenter und anpassungsfähiger machen sollen. Gemini Robotics ist ein neuer Zweig des Vorzeigemodells Gemini, der auf interaktive und geschickte Maschinen abzielt. Die KI hilft Entwicklern, Roboter für komplexe Szenarien zu trainieren – eine bislang große Herausforderung. Start-ups wie Agility Robotics setzen bereits auf Googles KI, um Roboter leistungsfähiger zu machen. Mit diesen Innovationen könnte Alphabet den Robotik-Markt erneut aufmischen.
Was Google konkret präsentiert hat
Während eines Medienbriefings stellte Google DeepMind vorab aufgezeichnete Demonstrationen der neuen Modelle vor. Dabei zeigte sich, dass Roboter mit Gemini Robotics nicht nur auf einfache Befehle reagieren, sondern auch eigenständig logische Schlussfolgerungen ziehen können.
In einer Demonstration stand ein Roboter vor einer Reihe von Buchstabenkacheln. Als er aufgefordert wurde, ein Wort zu bilden, sagte er "Ace" – ein Hinweis darauf, dass er die visuelle Information mit sprachlicher und kontextueller Bedeutung verknüpfen konnte. In einem anderen Experiment wurde ein Roboter mit einer Basketball-Challenge konfrontiert: Er sollte einen Slam Dunk ausführen. Obwohl er zuvor nie mit einem Basketball in Kontakt gekommen war, konnte er das Konzept des Spiels erfassen und einen kleinen Plastikball durch den Ring befördern.
Laut Google-Ingenieur Kanishka Rao basiert diese Fähigkeit auf der generativen KI von Gemini, die Robotern ein tiefgehendes Verständnis von Aufgaben vermittelt – selbst wenn sie zuvor keine spezifischen Erfahrungen damit gesammelt haben.
Die neuen KI-Modelle im Überblick
Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell, das Robotern hilft, komplexe Aufgaben zu bewältigen. Die KI erlaubt es Maschinen, visuelle, sprachliche und physische Informationen miteinander zu verknüpfen, wodurch sie in der Lage sind, eigenständig Probleme zu lösen. Das Modell zeigt insbesondere in unstrukturierten Umgebungen seine Stärken, da es flexibel auf neue Situationen reagiert.
Gemini Robotics-ER (Embodied Reasoning) erweitert diese Fähigkeiten um ein tiefgehendes Verständnis für räumliche Zusammenhänge. Dadurch können Roboter nicht nur Objekte erkennen und greifen, sondern auch logisch planen, wie sie diese sicher bewegen. Das eröffnet neue Möglichkeiten für den Einsatz in der Industrie, Logistik und im Gesundheitswesen.
Eine Schlüsselrolle in der Entwicklung spielte ALOHA 2, eine bi-armige Robotikplattform, die für das Training der Gemini-Modelle genutzt wurde. ALOHA 2 ermöglichte es, die KI so zu trainieren, dass sie nicht nur mit einzelnen Greifarmen arbeitet, sondern auch komplexe Bewegungsabläufe mit zwei Armen synchronisieren kann. Das System wurde speziell entwickelt, um Roboter in der präzisen Manipulation von Objekten zu schulen – eine essenzielle Fähigkeit für industrielle und logistische Anwendungen.
Technologische Weichenstellung für die Robotikindustrie
Die Vorstellung der neuen Modelle kommt zu einem Zeitpunkt, an dem der Robotik-Sektor an Dynamik gewinnt. Laut Experten wächst der Markt für KI-gesteuerte Robotik jährlich über 20 % bis 2030 und große Technologieunternehmen wie Google, Tesla, Meta und OpenAI investieren massiv in diesen Bereich.
Alphabet, die Muttergesellschaft von Google, hat bereits eine wechselhafte Vergangenheit in der Robotik. Vor über einem Jahrzehnt erwarb das Unternehmen mehrere Robotikfirmen, darunter Boston Dynamics. Später wurden einige dieser Projekte eingestellt, doch mit Gemini Robotics scheint Google einen Neustart zu wagen – dieses Mal mit generativer KI als treibender Kraft.
Kooperationen mit führenden Robotik-Unternehmen
Google DeepMind arbeitet eng mit mehreren Partnern zusammen, um die neuen Modelle in realen Szenarien zu testen. Dazu gehören:
- Apptronik – spezialisiert auf humanoide Roboter für industrielle Anwendungen
- Agile Robots – entwickelt KI-gesteuerte Robotiklösungen für Fertigungsprozesse
- Boston Dynamics – bekannt für hochentwickelte Roboter wie Spot und Atlas
Diese Kooperationen sind entscheidend, um Gemini Robotics für den kommerziellen Einsatz zu optimieren. Dabei liegt ein besonderer Fokus auf der Sicherheit der Technologie. Google betont, dass die Roboter zunächst in kontrollierten Umgebungen getestet werden, bevor sie in direkten Kontakt mit Menschen kommen.
Ausblick: Wo liegt das Potenzial?
Die Einführung von Gemini Robotics könnte weitreichende Folgen für die Robotik-Branche haben. Experten sehen vor allem in den Bereichen Automatisierung, industrielle Fertigung, Logistik und Gesundheitswesen großes Potenzial für den Einsatz smarter Roboter.
Während Google die Technologie noch als "frühe Erkundungsphase" bezeichnet, deutet die starke Partnerschaft mit führenden Robotikunternehmen darauf hin, dass der Konzern langfristig in diesem Bereich Fuß fassen möchte. Für Investoren und Technologieunternehmen könnte dies eine der wichtigsten Entwicklungen der nächsten Jahre sein.
Mit der Kombination aus generativer KI und Robotik könnte Google DeepMind nicht nur den Markt aufmischen, sondern auch neue Standards für künstlich intelligente Maschinen setzen.