Seguinos

Actualidad

Google lanza Gemini 3.5 Live Translate: traducción de voz en tiempo real en más de 70 idiomas

La nueva tecnología de inteligencia artificial permite conversaciones fluidas entre personas que hablan distintos idiomas, conservando el tono y la naturalidad de la voz.

Publicado

el

Google presentó Gemini 3.5 Live Translate, un nuevo modelo de inteligencia artificial capaz de traducir conversaciones de voz en tiempo real entre más de 70 idiomas. La herramienta busca eliminar barreras lingüísticas mediante traducciones casi instantáneas que mantienen la entonación, el ritmo y el tono del hablante original.  

A diferencia de los sistemas tradicionales que esperan a que una persona termine de hablar para ofrecer una traducción, la nueva tecnología genera la voz traducida de manera continua mientras escucha el discurso original. Según Google, esto permite conversaciones más naturales y con menos interrupciones.  

La compañía indicó que el modelo detecta automáticamente los idiomas utilizados y funciona incluso en entornos con ruido ambiental, sin necesidad de configuraciones previas.  

Cómo funcionará la nueva traducción en vivo

Gemini 3.5 Live Translate comenzó a desplegarse desde este martes en distintos productos de Google. Los desarrolladores podrán acceder a través de la API Gemini Live y Google AI Studio, mientras que las empresas tendrán una versión preliminar privada en Google Meet. Además, la función llegará a la aplicación Google Translate para Android e iOS.  

Uno de los cambios más importantes se verá en Google Meet. La plataforma de videollamadas ampliará su capacidad de traducción de cinco idiomas a más de 70, permitiendo más de 2.000 combinaciones lingüísticas dentro de una misma reunión.  

Google también anunció un nuevo “modo escucha” para Android. Esta función permitirá escuchar la traducción directamente desde el auricular del teléfono, sin necesidad de utilizar auriculares externos.  

Aplicaciones para empresas y usuarios

La empresa aseguró que la tecnología está diseñada para reuniones de trabajo, clases, llamadas internacionales, transmisiones en vivo y otras situaciones donde participan personas que hablan distintos idiomas.  

Entre las compañías que ya prueban la herramienta figura Grab, plataforma de transporte y servicios digitales del sudeste asiático. La empresa evalúa utilizarla para facilitar la comunicación entre conductores y pasajeros en diferentes idiomas. Según Google, los usuarios de Grab realizan más de 10 millones de llamadas de voz al mes.  

Una apuesta de largo plazo

Google recordó que trabaja en tecnologías de traducción desde hace más de dos décadas y considera esta nueva versión como un paso importante hacia conversaciones multilingües más naturales. La compañía sostiene que el sistema puede traducir mientras la persona sigue hablando, manteniendo la sincronización con apenas unos segundos de diferencia respecto a la voz original.  

Con este lanzamiento, Google busca reforzar su posición en el mercado de herramientas impulsadas por inteligencia artificial y acercar la traducción simultánea a millones de usuarios en dispositivos móviles, videollamadas y aplicaciones empresariales.