Qwen-Image compite con Nano Banana Pro mellorando en realismo
venres, 2 de xaneiro do 2026
O lanzamento do modelo Nano Banana Pro marcou un punto de inflexión no ámbito da xeración de imaxes mediante IA, por facilitar a produción de infografÃas densas, diapositivas e materiais visuais de uso empresarial a partir de linguaxe natural, con textos extensos e practicamente sen erros ortográficos.
En contraposición chega agora Qwen-Image-2512, o novo modelo de xeración de imaxe do equipo Qwen de Alibaba, que se presenta como unha alternativa aberta e de uso comercial baixo licenza Apache 2.0, dispoñible tanto para desenvolvedores como para grandes organizacións.
O modelo pode empregarse directamente a través de Qwen Chat e conta cos seus pesos completos publicados en Hugging Face e ModelScope, ademais de poder ser inspeccionado ou integrado desde o código fonte en GitHub. Para probas sen instalación, o equipo ofrece demostracións en navegador, mentres que as empresas que prefiran un servizo xestionado poden acceder ás capacidades de xeración mediante a API de Alibaba Cloud Model Studio.
Melloras clave da versión 2512
A actualización do modelo de xeración de imaxes céntrase en tres ámbitos que xa se consideran irrenunciables para o uso empresarial. En primeiro lugar, mellora de maneira notable o realismo humano e a coherencia dos escenarios, reducindo o aspecto artificial que tradicionalmente afectaba aos modelos abertos. As faccións, posturas e contornas amosan unha maior fidelidade semántica, un aspecto relevante para usos en formación, simulacións ou comunicación interna.
En segundo termo, destaca o avance na fidelidade das texturas naturais. Paisaxes, auga, materiais ou pelaxes animais preséntanse con maior detalle e transicións máis suaves, facilitando o uso de imaxes sintéticas en comercio electrónico, educación ou visualización sen necesidade de corrección manual intensiva.
Por último, Qwen-Image-2512 reforza a xeración de texto estruturado e a consistencia do deseño, tanto en chinés como en inglés. A mellora na lexibilidade de diapositivas, carteis ou infografÃas sitúa o modelo nun terreo no que ata agora destacaban sobre todo as solucións pechadas de Google.
Segundo probas a cegas con avaliación humana realizadas no Alibaba AI Arena, o modelo sitúase como o máis forte entre as alternativas de código aberto e mantense competitivo fronte a sistemas pechados, afastándose da etiqueta de simple prototipo experimental.
Código aberto e cálculo da despregadura
O principal factor diferencial de Qwen-Image-2512 reside na súa licenza. Ao estar publicado baixo Apache 2.0, permite o seu uso, modificación, axuste fino e despregue comercial sen restricións relevantes. Isto abre opcións estratéxicas para as empresas, desde un maior control dos custos mediante autoaloxamento, ata unha mellor gobernanza dos datos en sectores regulados ou a adaptación a linguas e normas culturais especÃficas.
Para quen opte por un servizo xestionado, Alibaba ofrece o modelo como qwen-image-max cun prezo de 0,075 dólares por imaxe xerada. A API admite cargas de produción e combina cotas gratuÃtas iniciais cun sistema de facturación unha vez esgotados os créditos.
