nVIDIA presenta un modelo de IA para a xeración de son

luns, 25 de novembro do 2024 Marcus Fernández

nVIDIA anuncia hoxe Fugatto, un modelo fundacional de intelixencia artificial para a xeración de son, que mediante a introdución de ordes de texto e ficheiros de audio permite a creación de música, voces e outros sons, podendo converterse na ferramenta máis completa até o momento para a creación sonora.
Dende nVIDIA comentan as posibilidades de Fugatto para crear prototipos ou editar ideas para unha canción, probando diferentes estilos, voces e instrumentos, así como para engadir efectos e mellorar a calidade sonora dunha pista existente. Tamén destacan a posibilidade de poder facer que unha voz se exprese con distintos acentos e amosando distintas emocións (o que pode resultar de grande utilidade para campañas internacionais).
A versión completa de Fugatto utiliza 2.500 millóns de parámetros e adestrouse nun sistema de servidores nVIDIA DGX con 32 tarxetas nVIDA H100. Desenvolveuse coa colaboración de persoas de todo o mundo (para conseguir maiores capacidades multilingües e multiacento).
Para facernos unha idea das moitas posibilidades de Fugatto podemos ver o vídeo de presentación elaborado pola propia nVIDIA: