OpenAI presenta un modelo de IA para a creación de vÃdeo
xoves, 15 de febreiro do 2024
OpenAI, creadores do célebre ChatGPT, están a sorprender ao mundo coa presentación da súa última creación: Sora, un modelo de IA capaz de crear escenas imaxinativas e realistas partindo de instrucións de texto.
En contraste con outras solucións semellantes, como Gen-2 Runway ou o Lumiere de Google, as creacións con Sora van máis aló duns poucos segundos de vÃdeo, sendo capaz de crear actualmente pezas visuais de grande calidade de até un minuto de duración axustándose ao indicado nas instrucións de texto, o que supón un impresionante nivel de comprensión da IA do mundo que nos rodea para ser capaz de simulalo en movemento.
Sora aÃnda non está aberto ao público, aÃnda que OpenAI está a compartir esta tecnoloxÃa con outras persoas fóra da compañÃa para poder recibir feedback de artistas visuais, deseñadores e creadores de vÃdeo para asà mellorar na evolución deste modelo que pode ser de grande utilidade para os profesionais creativos.
O modelo actual é capaz de xerar complexas escenas con múltiples personaxes, tipos de movemento especÃficos, e mesmo marcando detalles moi concretos dos suxeitos e o fondo, grazas ao grande coñecemento que ten do mundo e a súa profunda comprensión da linguaxe, sorprendendo o feito de que nun único vÃdeo poida compoñer diferentes tomas, conseguindo uns resultados moi cinematográficos á vez que consegue manter o estilo visual e a persistencia dos personaxes.
Dende OpenAI recoñecen que o modelo actual aÃnda ten puntos febles, como dificultades para simular a fÃsica dunha escena complexa, non poder entender certas reaccións de causa-efecto, dificultades para manter o raccord, ou mesmo chegar a confundir detalles espaciais (como mesturar esquerda e dereita).
Pero antes de ofrecer Sora ao mundo, unha das principais preocupacións de OpenAI é a súa seguridade, xa que unha ferramenta asà pode facilitar a creación de contidos para xerar desinformación, manipular á poboación ou vulnerar a propiedade intelectual, polo que están a traballar na elaboración dunhas polÃticas de uso e unhas salvagardas ante malos usos da ferramenta, asà como tamén prevén a incorporación de metadatos nos contidos para que poida saberse de xeito doado que foron creados sinteticamente.
Estamos ante unha tecnoloxÃa realmente revolucionaria, que en poucos meses abrirase ao público, e que polo que amosaron até agora pode supor toda unha revolución para a creación audiovisual.