Gemini integra un novo modelo de creación musical

mércores, 18 de febreiro do 2026 Redacción

Google dá un novo paso na integración da intelixencia artificial xerativa nas ferramentas creativas de Gemini coa incorporación de Lyria 3, un modelo desenvolvido por Google DeepMind que permite xerar pistas musicais personalizadas a partir de descricións textuais ou mesmo de imaxes e documentos. A funcionalidade estréase en fase beta na versión web e chegará nos vindeiros días á aplicación móbil para usuarios de todo o mundo.
Tras introducir opcións para crear imaxes e vídeos, Gemini amplía agora as súas capacidades cara ao ámbito musical. O funcionamento é sinxelo: abonda con describir o que se quere escoitar para que o sistema xere, en cuestión de segundos, unha pista de audio de alta calidade. Un exemplo sería solicitar «unha balada cómica de R&B sobre un calcetín que atopa a súa parella», que o modelo transforma automaticamente nun tema musical completo.
A ferramenta permite crear pistas a partir de texto, especificando xénero, estado de ánimo ou características concretas como o tempo ou os instrumentos. Tamén admite a subida de fotografías, presentacións, documentos PDF ou outros arquivos para que Gemini analice o seu contido e compoña unha melodía acorde ao contexto. Así, unha serie de imaxes pode converterse nunha canción temática cunha letra adaptada ao ambiente descrito.
As pistas xeradas teñen unha duración de 30 segundos e inclúen portadas personalizadas creadas mediante o modelo Nano Banana. Os usuarios poden descargalas ou compartilas a través dunha ligazón directa. Desde a compañía subliñan que o obxectivo non é producir obras mestras musicais, senón ofrecer unha vía accesible e divertida de expresión creativa.
Ademais da integración en Gemini, os creadores poden probar Lyria 3 en Pista Fantástica de YouTube. Esta opción está orientada á mellora das bandas sonoras de vídeos curtos, permitindo personalizar versos, melodías ou pistas de acompañamento para os Shorts.
Lyria 3 introduce melloras salientables respecto á xeración anterior. En primeiro lugar, xa non é preciso escribir a letra das cancións, xa que o modelo pode xerala automaticamente. En segundo termo, ofrece maior control creativo sobre aspectos como o estilo musical, o tipo de voz ou os pulsos por minuto (BPM). Finalmente, permite producir composicións máis realistas e con maior complexidade musical.
No eido da transparencia, todas as pistas creadas inclúen SynthID, unha marca de auga imperceptible que identifica o contido xerado por intelixencia artificial de Google. A compañía ampliou tamén as súas funcións de verificación para incluír o audio, de xeito que os usuarios poden subir un arquivo e consultar se foi creado coa súa IA. O sistema analiza a presenza de SynthID e emprega o seu propio razoamento para ofrecer unha resposta.
Google asegura que o desenvolvemento de Lyria 3 realizouse en colaboración coa comunidade musical e tendo en conta cuestións como os dereitos de autor e os acordos cos seus socios. Aseguran contar con mecanismos para evitar que se xere contido que imite de maneira directa a artistas concretos. Se unha solicitude menciona un creador específico, o modelo emprega esa referencia como inspiración estilística, pero sen reproducir de forma literal a súa identidade sonora. En todo caso, habilítanse canles para denunciar posibles infraccións de dereitos.
Desde Google defenden que esta tecnoloxía non substitúe o labor dos músicos, senón que pretende complementar a creatividade humana e facilitar novas formas de expresión.

Vídeo co que anuncian a chegada de Lyria 3 a Gemini