Gemini Flash, AI Overviews und mehr: Google stellt auf seiner Entwicklerkonferenz neue und effiziente KI-Modelle vor
Google hat seine jährliche Entwicklerkonferenz genutzt, um seine nach eigenen Angaben leichtesten und effizientesten Modelle für Künstliche Intelligenz vorzustellen. Auf der Google I/O am Dienstag, den 14. Mai, hat der Suchmaschinenriese etwa "Gemini 1.5 Flash" angekündigt, die neueste Ergänzung der Gemini-Serie. Das Unternehmen erklärte in einem Blogbeitrag, dass das neue Modell schnell Gespräche zusammenfassen, Bilder und Videos beschriften und Daten aus großen Dokumenten und Tabellen extrahieren könne.
Viele der von Google vorgestellten Funktionen oder Tools befinden sich laut CNBC noch in der Testphase oder sind auf Entwickler beschränkt. Das Technologieunternehmen verdiene Geld mit KI, indem es Gebühren für Entwickler erhebt, die seine Modelle verwenden, und von Kunden, die für Gemini Advanced bezahlen, hieß es in dem CNBC-Bericht.
Gemini 1.5 Pro soll große Dokumente und E-Mails zusammenfassen können
Google hat ein verbessertes Modell namens "Gemini 1.5 Pro" angekündigt, das nach Unternehmensangaben mehrere große Dokumente (bis 1.500 Seiten) oder 100 E-Mails zusammenfassen könne. Das KI-Tool soll außerdem bald in der Lage sein, eine Stunde an Videoinhalten oder Programmcode mit mehr als 30.000 Zeilen zu verarbeiten.
Laut Google liefert Gemini im Handumdrehen Antworten und Erkenntnisse aus umfangreichen Dokumenten. Anwender könnten schnell Antworten und Einblicke in dichte Dokumente wie z.B. die Details der Haustierrichtlinien in ihrem Mietvertrag oder den Vergleich der Hauptargumente mehrerer Forschungsarbeiten erhalten, zitierte CNBC Sissie Hsiao, Vizepräsidentin von Google.
Gemini 1.5 Pro werde für Abonnenten von Gemini Advanced in mehr als 150 Ländern und in über 35 Sprachen verfügbar sein – dazu werde auch Deutschland zählen, so der US-Konzern. Im neuen Modell sei das lokale Denken, die Planung und das Bildverständnis verbessert worden, zitierte CNBC Führungskräfte des Unternehmens. Es biete das längste Kontextfenster aller bisherigen Grundmodelle, hieß es hier weiter. Alphabet-CEO Sundar Pichai habe auf der Veranstaltung folgendes Anwendungsbeispiel genannt: Ein Elternteil bittet Gemini, alle aktuellen E-Mails von der Schule des Kindes zusammenzustellen. Laut dem Nachrichtenmedium wird Gemini 1.5 Pro zunächst in den Workspace Labs zum Testen verfügbar sein.
Gemini Flash – das neueste und schnellste Modell der Gemini-Familie
Zudem wurde das neueste und schnellste Modell der Gemini-Familie "Gemini Flash" angekündigt. Das KI-Tool ist laut Google ideal für große, anspruchsvolle Aufgaben, kosteneffizienter in der Bereitstellung und bietet ein erweitertes Kontextfenster für noch bessere Ergebnisse. Sowohl Gemini 1.5 Pro als auch Gemini 1.5 Flash seien in einer öffentlichen Vorschau mit einem 1-Mio.-Token-Kontextfenster via Google AI Studio und Vertex AI verfügbar, so der Konzern.
AI Overviews für eine schnelle Zusammenfassung von Antworten aus Suchanfragen
Der Techgigant führt laut CNBC in den USA "AI Overviews" in der Google-Suche ein. Laut Liz Reid, Leiterin der Google-Suche, würden die KI-Übersichten eine schnelle Zusammenfassung der Antworten auf die komplexesten Suchanfragen zeigen. Wenn ein Nutzer beispielsweise nach der besten Methode zur Reinigung von Lederstiefeln sucht, könne auf der Ergebnisseite eine "KI-Übersicht" mit einem mehrstufigen Reinigungsprozess angezeigt werden, der aus Informationen aus dem Internet zusammengestellt wurde.
Das Unternehmen kündigte an, direkt in der Suche assistentenähnliche Planungsfunktionen einführen zu wollen. Nutzer sollen in der Lage sein, nach etwas wie "Erstelle mir einen 3-Tage-Essensplan für eine Gruppe, der leicht zuzubereiten ist" zu suchen, und dann einen Ausgangspunkt mit einer breiten Palette von Rezepten aus dem gesamten Web erhalten.
KI-Assistent – Project Astra
Project Astra ist laut CNBC Googles neuester Schritt in Richtung eines KI-Assistenten, der von Googles KI-Einheit "DeepMind" entwickelt wird. Im Moment sei es nur ein Prototyp, aber man könne es als Googles Ziel betrachten, seine eigene Version von J.A.R.V.I.S. zu entwickeln, Tony Starks allwissendem KI-Assistenten aus dem Marvel-Universum, hieß es in der Meldung. In dem auf der Google I/O vorgestellten Demovideo habe der Assistent dem Nutzer helfen können, sich daran zu erinnern, wo er seine Brille liegen gelassen hat und ihm dabei geholfen Code zu überprüfen und Fragen zu beantworten, wie ein bestimmtes Teil eines Lautsprechers heißt, wenn dieser auf Video gezeigt wurde.
Ankündigung der bisher leistungsstärksten und effizientesten TPU "Trillium"
Google hat außerdem Trillium angekündigt, seine TPU der sechsten Generation (Tensor Processing Unit) - eine Hardwarekomponente, die für die Ausführung komplexer KI-Operationen unerlässlich sei, die Ende 2024 für Cloudkunden verfügbar sein soll. Die TPUs seien nicht dazu gedacht, mit anderen Chips wie Nvidias Grafikprozessoren zu konkurrieren. Gemini wurde laut Google vollständig auf den TPUs der vierten und fünften Generation trainiert. Und auch andere führende KI-Unternehmen, darunter Anthropic, hätten ihre Modelle auf TPUs trainiert. Trillium sei die bisher leistungsstärkste und effizienteste TPU und biete eine 4,7-fache Verbesserung der Rechenleistung pro Chip im Vergleich zur vorherigen Generation – TPU v5e, hieß es in einem Blogbeitrag von Google.