OpenAI presenta Sora 2, o seu novo modelo de xeración de vÃdeo e audio
mércores, 1 de outubro do 2025
OpenAI anunciou o lanzamento de Sora 2, a evolución do seu modelo de vÃdeo presentado en 2024, que agora ofrece unha maior precisión fÃsica, realismo e capacidade de control. A compañÃa destaca que esta nova versión é quen de sincronizar diálogos e efectos de son, asà como de manter a coherencia visual en escenas complexas.
Segundo explica o equipo responsable, o primeiro Sora supuxo «o momento GPT-1 para o vÃdeo», ao demostrar que era posible xerar imaxes en movemento con comportamento básico de permanencia de obxectos. Con Sora 2, aseguran, a tecnoloxÃa chega a un nivel equiparable ao «momento GPT-3.5», xa que pode representar accións extremadamente difÃciles para modelos anteriores, como rutinas olÃmpicas de ximnasia ou saltos acrobáticos nunha táboa de paddle que respectan a flotabilidade e a rixidez do material.
Un dos avances máis salientables é a súa mellor obediencia ás leis da fÃsica. Mentres modelos previos podÃan deformar obxectos ou teletransportar elementos para satisfacer unha orde textual, Sora 2 reacciona de maneira máis natural: se un xogador de baloncesto erra un tiro, o balón rebota no taboleiro en lugar de aparecer directamente dentro do aro.
Ademais da precisión, o novo modelo destaca pola súa capacidade de control. É capaz de seguir instrucións complexas que abarcan varias tomas mantendo a continuidade do estado da escena. Funciona tanto en estilos realistas e cinematográficos como en estéticas propias do anime. Tamén incorpora xeración de son realista, incluÃndo voces, efectos e paisaxes sonoras de fondo.
Outra das funcións máis rechamantes é a posibilidade de introducir persoas reais nas escenas creadas. Cunha gravación previa de vÃdeo e audio, Sora 2 pode inserir a un usuario en calquera contorna xerada, reproducindo fielmente a súa aparencia e voz. OpenAI presenta esta opción como unha evolución natural das formas de comunicación dixital, comparándoa coa transición de mensaxes de texto a emoticonas, notas de voz e agora cameos en vÃdeo.
O modelo estréase acompañado dunha nova aplicación social para iOS chamada simplemente Sora, que permite crear e compartir contidos, descubrir vÃdeos nun feed personalizable e aparecer en escenas alleas mediante a función de cameos. O acceso será progresivo mediante invitación, con lanzamento inicial en Estados Unidos e Canadá, e co obxectivo de estenderse axiña a outros paÃses.
OpenAI asegura que deseñou a aplicación para priorizar a creación por riba do consumo pasivo e que incorpora ferramentas de control para os usuarios, incluÃdos lÃmites por defecto para menores e opcións de supervisión paterna a través de ChatGPT. Tamén subliñan que a única forma prevista de monetización, polo momento, será permitir o pagamento por xeracións adicionais se a demanda supera a capacidade dispoñible.
