Gemini Live erhält größtes Update: Google startet Gemini 3.1 Flash Live mit verbesserter KI-Sprachqualität
Google hat Gemini 3.1 Flash Live vorgestellt – das bisher hochwertigste Audio- und Sprachmodell für Gemini Live. Das Update bringt schnellere Reaktionszeiten, besseres Sprachverstehen und Support für über 90 Sprachen.
Google bringt Gemini Live auf ein neues Level
Google hat ein bedeutendes Update für seinen KI-Assistenten angekündigt: Mit Gemini 3.1 Flash Live erhält Gemini Live das "bislang größte Upgrade" in der Geschichte des Sprachassistenten. Das neue Modell ist ab sofort über die Gemini Live API in Google AI Studio in der Vorschau verfügbar und soll in Kürze für alle Nutzer ausgerollt werden.
Was steckt hinter Gemini 3.1 Flash Live?
Gemini 3.1 Flash Live ist Googles "höchstqualitatives Audio- und Sprachmodell" und löst das bisherige 2.5 Flash Native Audio ab. Das neue Modell erkennt akustische Nuancen wie Tonhöhe und Sprechtempo zuverlässiger und reagiert mit deutlich geringerer Latenz. Besonders beeindruckend ist die verbesserte Fähigkeit, relevante Sprache von Umgebungsgeräuschen – etwa Verkehrslärm oder laufendes Fernsehen – zu unterscheiden. Hintergrundgeräusche werden jetzt effektiver herausgefiltert, was die Sprachverständlichkeit in lauten Umgebungen erheblich verbessert.
Mehr als 90 Sprachen und längere Gesprächskontexte
Das Modell unterstützt mehr als 90 Sprachen für Echtzeit-Gespräche im Multi-Modal-Modus – ein großer Sprung für internationale Nutzer. In der Gemini Live-App auf Android und iOS liefert 3.1 Flash Live schnellere Antworten mit "weniger unangenehmen Pausen" und kann dem Gesprächsfaden doppelt so lange folgen wie zuvor. Google beschreibt das als Vorteil bei längeren Brainstorming-Sitzungen: Das Modell hält Gedankengänge auch über mehrere Minuten hinweg zusammen und verliert den roten Faden nicht.
Zudem passt Gemini Live die Antwortlänge und den Ton dynamisch der Gesprächssituation an – kurze Fragen bekommen präzise Antworten, während komplexere Anfragen ausführlichere Erklärungen erhalten. Auch Search Live profitiert vom neuen Modell mit verbesserten Sprachsuche-Funktionen.
Einordnung: Googles KI-Reaktion auf den Wettbewerb
Der Wettbewerb im KI-Assistenten-Markt ist so intensiv wie nie zuvor. Während OpenAI mit ChatGPT verstärkt auf Business-Anwendungen setzt, konzentriert sich Google mit Gemini Live auf alltägliche Sprachinteraktionen. Für Nutzer von Android 17 ist das besonders relevant, da Gemini tiefer als je zuvor in das Betriebssystem integriert ist. Ähnlich wie der KI-Boom die Hardware-Preise beeinflusst, verändert er auch die Erwartungen an Sprachassistenten grundlegend.
Gemini 3.1 Flash Live ist zunächst über die API in Google AI Studio verfügbar. Ein breiter Rollout für alle Gemini Live-Nutzer auf Android und iOS dürfte in den kommenden Wochen folgen.
Kommentare (0)
Kommentar verfassen
Noch keine Kommentare vorhanden. Seien Sie der Erste, der kommentiert!