OpenAI presenta Sora 2, o seu novo modelo de xeración de vídeo e audio

mércores, 1 de outubro do 2025 Redacción

OpenAI anunciou o lanzamento de Sora 2, a evolución do seu modelo de vídeo presentado en 2024, que agora ofrece unha maior precisión física, realismo e capacidade de control. A compañía destaca que esta nova versión é quen de sincronizar diálogos e efectos de son, así como de manter a coherencia visual en escenas complexas.
Segundo explica o equipo responsable, o primeiro Sora supuxo «o momento GPT-1 para o vídeo», ao demostrar que era posible xerar imaxes en movemento con comportamento básico de permanencia de obxectos. Con Sora 2, aseguran, a tecnoloxía chega a un nivel equiparable ao «momento GPT-3.5», xa que pode representar accións extremadamente difíciles para modelos anteriores, como rutinas olímpicas de ximnasia ou saltos acrobáticos nunha táboa de paddle que respectan a flotabilidade e a rixidez do material.
Un dos avances máis salientables é a súa mellor obediencia ás leis da física. Mentres modelos previos podían deformar obxectos ou teletransportar elementos para satisfacer unha orde textual, Sora 2 reacciona de maneira máis natural: se un xogador de baloncesto erra un tiro, o balón rebota no taboleiro en lugar de aparecer directamente dentro do aro.
Ademais da precisión, o novo modelo destaca pola súa capacidade de control. É capaz de seguir instrucións complexas que abarcan varias tomas mantendo a continuidade do estado da escena. Funciona tanto en estilos realistas e cinematográficos como en estéticas propias do anime. Tamén incorpora xeración de son realista, incluíndo voces, efectos e paisaxes sonoras de fondo.
Outra das funcións máis rechamantes é a posibilidade de introducir persoas reais nas escenas creadas. Cunha gravación previa de vídeo e audio, Sora 2 pode inserir a un usuario en calquera contorna xerada, reproducindo fielmente a súa aparencia e voz. OpenAI presenta esta opción como unha evolución natural das formas de comunicación dixital, comparándoa coa transición de mensaxes de texto a emoticonas, notas de voz e agora cameos en vídeo.
O modelo estréase acompañado dunha nova aplicación social para iOS chamada simplemente Sora, que permite crear e compartir contidos, descubrir vídeos nun feed personalizable e aparecer en escenas alleas mediante a función de cameos. O acceso será progresivo mediante invitación, con lanzamento inicial en Estados Unidos e Canadá, e co obxectivo de estenderse axiña a outros países.
OpenAI asegura que deseñou a aplicación para priorizar a creación por riba do consumo pasivo e que incorpora ferramentas de control para os usuarios, incluídos límites por defecto para menores e opcións de supervisión paterna a través de ChatGPT. Tamén subliñan que a única forma prevista de monetización, polo momento, será permitir o pagamento por xeracións adicionais se a demanda supera a capacidade dispoñible.