Google hat mit Gemini 3.5 Live Translate ein eigenes Audiomodell vorgestellt, das gesprochene Sprache simultan überträgt. Das Modell läuft ab sofort in der Translate-App, kommt über eine Live-API zu Entwicklern und wandert demnächst in Google Meet. Für international arbeitende Teams verschiebt sich damit die Grenze zwischen Telefonat und Dolmetscher.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenMit Gemini 3.5 Live Translate übersetzt Google gesprochene Sprache jetzt fortlaufend, statt auf das Ende eines Satzes zu warten. Vor einem halben Jahr lief diese Funktion nur als Android-Beta in drei Ländern. Heute rollt Google das Modell global aus und öffnet es zugleich für Entwickler und Workspace-Kunden.
Das Wichtigste in Kürze
- Gemini 3.5 Live Translate erkennt automatisch mehr als 70 Sprachen und behält Tonfall und Sprechtempo des Sprechers bei.
- Das Modell dolmetscht fortlaufend und bleibt nur wenige Sekunden hinter dem Gesprochenen, ohne hörbare Pausen.
- Entwickler erreichen das Modell ab sofort als Public Preview über die Gemini Live API und Google AI Studio.
- Google Meet bekommt die Funktion zunächst in privater Vorschau für ausgewählte Workspace-Kunden, der breite Rollout folgt später im Jahr.
Was unterscheidet 3.5 Live Translate von der bisherigen Beta?

Bisherige Systeme arbeiten Schritt für Schritt und warten, bis ein Sprecher seinen Satz beendet hat. Gemini 3.5 Live Translate verarbeitet den Audiostrom dagegen schon während des Sprechens und entscheidet dabei laufend, ob es auf mehr Kontext wartet oder sofort übersetzt. Fortlaufende Ausgabe heißt im Alltag, dass das Gespräch fließt, weil die Übersetzung nur wenige Sekunden nachläuft. Auch in lauten Umgebungen arbeitet das Modell nach Angaben von Google zuverlässig.
Was bedeutet das für internationale Meetings?

In Google Meet ersetzt das Modell die bisherige Sprachübersetzung und hebt sie von fünf auf über 70 Sprachen. In einer einzigen Besprechung werden damit mehr als 2000 Sprachkombinationen möglich, während Meet bislang nur von und nach Englisch übersetzte. Dank der zusätzlichen Sprachpaare sprechen Teams mit Kollegen in Asien oder Lateinamerika, ohne einen externen Dolmetscher zuzuschalten.
Für deutsche Mittelständler mit Standorten in Asien wird die Sprachbarriere im Videocall zur Fußnote. Offen bleibt, ob die IT die Sprachdaten DSGVO-konform in der Cloud verarbeitet.
— Michael Dobler, Herausgeber Dr. Web
Wie steht es um Datenschutz und Manipulation?

Google verarbeitet die Sprachdaten in der Cloud. Das setzt eine stabile Verbindung voraus, und die Gespräche laufen über Google-Server. Für Unternehmen mit sensiblen Inhalten gehört dieser Punkt in jede Auftragsverarbeitung, ähnlich wie bei der Debatte um Gemini in Gmail. Jede erzeugte Audioausgabe trägt zudem ein unhörbares SynthID-Wasserzeichen, mit dem Google KI-generierte Stimmen erkennbar halten und Missbrauch erschweren will.
Ab wann können Sie es nutzen?
In der Translate-App steht das Modell ab sofort weltweit auf Android und iOS bereit. Verbinden Sie beliebige Kopfhörer und tippen Sie auf „Live translate“, dann hören Sie die Übersetzung in Ihrer Sprache. Android-Nutzer bekommen zusätzlich einen Listening Mode: Sie hören die Übersetzung direkt über den Telefonhörer und halten das Gerät wie bei einem normalen Anruf ans Ohr. Für den eigenen Einbau stehen die Gemini Live API und Beispielcode in Google AI Studio bereit. Eine Modell-Landkarte der aktuellen KI-Systeme liefert der LLMs-Ratgeber.
Prüfen Sie vor einem Pilotversuch zwei Punkte. Klären Sie mit der IT, ob sie die Sprachdaten datenschutzkonform in der Cloud verarbeiten kann, und testen Sie die App in einer typischen Gesprächssituation Ihres Teams. Für reine Reise- und Vor-Ort-Gespräche genügt die kostenlose Translate-App schon heute.
Mehr Newshunger?
