Gemini integra un novo modelo de creación musical
mércores, 18 de febreiro do 2026
Google dá un novo paso na integración da intelixencia artificial xerativa nas ferramentas creativas de Gemini coa incorporación de Lyria 3, un modelo desenvolvido por Google DeepMind que permite xerar pistas musicais personalizadas a partir de descricións textuais ou mesmo de imaxes e documentos. A funcionalidade estréase en fase beta na versión web e chegará nos vindeiros dÃas á aplicación móbil para usuarios de todo o mundo.
Tras introducir opcións para crear imaxes e vÃdeos, Gemini amplÃa agora as súas capacidades cara ao ámbito musical. O funcionamento é sinxelo: abonda con describir o que se quere escoitar para que o sistema xere, en cuestión de segundos, unha pista de audio de alta calidade. Un exemplo serÃa solicitar «unha balada cómica de R&B sobre un calcetÃn que atopa a súa parella», que o modelo transforma automaticamente nun tema musical completo.
A ferramenta permite crear pistas a partir de texto, especificando xénero, estado de ánimo ou caracterÃsticas concretas como o tempo ou os instrumentos. Tamén admite a subida de fotografÃas, presentacións, documentos PDF ou outros arquivos para que Gemini analice o seu contido e compoña unha melodÃa acorde ao contexto. AsÃ, unha serie de imaxes pode converterse nunha canción temática cunha letra adaptada ao ambiente descrito.
As pistas xeradas teñen unha duración de 30 segundos e inclúen portadas personalizadas creadas mediante o modelo Nano Banana. Os usuarios poden descargalas ou compartilas a través dunha ligazón directa. Desde a compañÃa subliñan que o obxectivo non é producir obras mestras musicais, senón ofrecer unha vÃa accesible e divertida de expresión creativa.
Ademais da integración en Gemini, os creadores poden probar Lyria 3 en Pista Fantástica de YouTube. Esta opción está orientada á mellora das bandas sonoras de vÃdeos curtos, permitindo personalizar versos, melodÃas ou pistas de acompañamento para os Shorts.
Lyria 3 introduce melloras salientables respecto á xeración anterior. En primeiro lugar, xa non é preciso escribir a letra das cancións, xa que o modelo pode xerala automaticamente. En segundo termo, ofrece maior control creativo sobre aspectos como o estilo musical, o tipo de voz ou os pulsos por minuto (BPM). Finalmente, permite producir composicións máis realistas e con maior complexidade musical.
No eido da transparencia, todas as pistas creadas inclúen SynthID, unha marca de auga imperceptible que identifica o contido xerado por intelixencia artificial de Google. A compañÃa ampliou tamén as súas funcións de verificación para incluÃr o audio, de xeito que os usuarios poden subir un arquivo e consultar se foi creado coa súa IA. O sistema analiza a presenza de SynthID e emprega o seu propio razoamento para ofrecer unha resposta.
Google asegura que o desenvolvemento de Lyria 3 realizouse en colaboración coa comunidade musical e tendo en conta cuestións como os dereitos de autor e os acordos cos seus socios. Aseguran contar con mecanismos para evitar que se xere contido que imite de maneira directa a artistas concretos. Se unha solicitude menciona un creador especÃfico, o modelo emprega esa referencia como inspiración estilÃstica, pero sen reproducir de forma literal a súa identidade sonora. En todo caso, habilÃtanse canles para denunciar posibles infraccións de dereitos.
Desde Google defenden que esta tecnoloxÃa non substitúe o labor dos músicos, senón que pretende complementar a creatividade humana e facilitar novas formas de expresión.
VÃdeo co que anuncian a chegada de Lyria 3 a Gemini
