Gemini 3.5 Live Translate leva a tradución oral en tempo real a máis de 70 idiomas

martes, 9 de xuño do 2026 Redacción

Google presentou Gemini 3.5 Live Translate, un novo modelo de audio para tradución oral en tempo real que busca ofrecer conversas máis naturais entre persoas que falan idiomas diferentes. A tecnoloxía, que comeza a despregarse desde hoxe en distintos produtos da compañía, permite traducir a voz mentres se fala, mantendo aspectos como a entoación, o ritmo e o ton do interlocutor.
A tradución automática foi un dos primeiros proxectos de aprendizaxe automática de Google hai dúas décadas. Segundo a compañía de Mountain View, actualmente tradúcense máis dun billón de palabras cada mes para miles de millóns de usuarios a través dos seus servizos.
Gemini 3.5 Live Translate é capaz de detectar automaticamente máis de 70 idiomas e de xerar audio traducido de forma continua. A diferenza dos sistemas tradicionais por quendas, que agardan a que unha persoa remate de falar antes de ofrecer a tradución, o novo modelo procesa a fala mentres se produce, procurando un equilibrio entre a necesidade de obter suficiente contexto para mellorar a precisión e a de manter a conversa sincronizada. O resultado é unha tradución cunha latencia de apenas uns segundos e sen pausas artificiais.
O modelo tamén destaca pola súa capacidade para traballar con entradas multilingües sen configuración previa e pola súa resistencia ao ruído ambiental, o que facilita o seu uso en contornas concorridas. Google apunta a aplicacións como interpretación en directo durante chamadas, reunións, clases, emisións ou outros eventos.
A tecnoloxía xa está dispoñible para desenvolvedores en fase de vista previa pública a través da API Gemini Live e de Google AI Studio. Empresas como Agora, Fishjam, LiveKit, Pipecat ou Vision Agents integran esta infraestrutura para facilitar a creación de aplicacións de tradución por voz en tempo real.
Entre os primeiros casos de uso figura Grab, que está a probar o sistema para facilitar a comunicación multilingüe entre condutores e usuarios nos puntos de recollida. A plataforma xestiona máis de 10 millóns de chamadas de voz mensuais.
Google tamén anunciou a chegada de Gemini 3.5 Live Translate a Google Meet. A actualización permitirá ampliar o número de idiomas soportados de cinco a máis de 70 e ofrecer comunicación entre máis de 2.000 combinacións lingüísticas nunha mesma reunión, sen limitarse ás traducións desde ou cara ao inglés. Ademais, incorporarase unha nova interface que facilitará o acceso inmediato á función. A fase de vista previa privada para determinados clientes empresariais de Google Workspace comezará este mes, mentres que a despregadura máis ampla está prevista para finais de ano.
A aplicación Google Translate para Android e iOS tamén incorpora progresivamente esta tecnoloxía a nivel global. A función Live Translate permitirá utilizar auriculares para recibir traducións que reproduzan o ton e a expresividade do falante orixinal.
Os dispositivos Android recibirán ademais un novo modo de escoita que permite escoitar a tradución directamente polo auricular interno do teléfono. O usuario só ten que achegar o dispositivo á orella como se estivese nunha chamada convencional para recibir o audio traducido en tempo case real, unha opción pensada para situacións nas que non se dispoña de auriculares ou se prefira unha experiencia máis discreta.
Todo o audio xerado polo modelo incorpora marcas de auga dixitais mediante a tecnoloxía SynthID. Estas marcas, imperceptibles para os usuarios, quedan integradas directamente no son para permitir a identificación posterior de contidos xerados por intelixencia artificial e contribuír á loita contra a desinformación.

Vídeo de presentación de Gemini 3.5 Live Translate