DeepSeek provoca un terremoto no sector da IA

luns, 27 de xaneiro do 2025 Marcus Fernández

Hai unha semana a compañía chinesa de intelixencia artificial DeepSeek lanzou un novo modelo de IA de código aberto chamado R1, que podería terse considerado como un rival de ChatGPT dos moitos que xurdiron nos últimos meses, pero conseguindo captar unha atención inusual, coándose as súas aplicacións móbiles nos primeiros postos das tendas de aplicacións, adiantando incluso a ChatGPT na App Store de Apple, aínda que durante a xornada de hoxe o servizo tivo problemas para poder aceptar novas altas (supostamente por mor de «ataques maliciosos a grande escala»).
DeepSeek-R1 forma parte dunha nova xeración de grandes modelos de razoamento que fan máis que responder ás consultas dos usuarios: reflexionan sobre a súa propia análise mentres producen unha resposta, tentando detectar erros antes de ofrecerllos ao usuario. Nese ámbito DeepSeek-R1 iguala ou supera o modelo de razoamento de OpenAI, o1 en varias áreas, o que é toda unha sorpresa polo feito de que esta solución asegura precisar dun investimento moi inferior: aseguran que o seu adestramento custou menos de 6 millóns de dólares.
Aseguran que DeepSeek viuse obrigada a ser máis eficiente debido á escaseza e ao uso de GPU máis antigas como consecuencia das restricións de exportación dos Estados Unidos na venda desta tecnoloxía a China, afirmacións que non poden verificarse, pois hai quen apunta que, aínda que aseguran non ter empregado o último hardware de nVIDIA, na práctica poderían ter conseguido ilegalmente material da compañía (polo que tamén os investimentos realizados serían moi superiores ao anunciado publicamente).
A posibilidade de que a eficiencia, o aforro de custos e o rendemento do modelo de IA de DeepSeek fose unha realidade provocou todo un terremoto no sector tecnolóxico, pois pon en dúbida os xigantescos investimentos que se están a proxectar (lembremos que o Proxecto Stargate busca xuntar 500.000 millóns de dólares en só 4 anos para a infraestrutura de IA de OpenAI). Os mercados temen que DeepSeek pinche a burbulla da IA, e as empresas que se estaban a beneficiar deste boom están a experimentar grandes caídas na súa cotización bolsista. nVIDIA é a compañía que máis está a notar esta perda de confianza, cunha grande caída no valor da súa acción (que chegou a unha perda de capitalización de 600.000 millóns de dólares, converténdose na maior caída nun único día na historia dos EE.UU.), arrastrando a outras tecnolóxicas como Broadcom, AMD ou Microsoft, que tamén estaban a medrar moito nos últimos meses polo grande pulo da IA.
Cómpre salientar que o interese por DeepSeek pode ser esaxerado, xa que pode estar baseado en falsidades que buscan manipular o mercado, aínda que tamén existe a posibilidade de que se teña forzado a apertura dun novo ciclo na carreira da IA, na que os resultados brutos non sexan dabondo e se force ao sector a apostar por unha maior eficiencia para que a industria poida ser sustentable económica e enerxeticamente (o que tamén podería supor un importante pulo para os modelos abertos de IA).
Tampouco podemos esquecer que DeepSeek non é superior ao que actualmente hai no mercado, senón que nalgunhas categorías comparativas consegue puntuacións equiparables, o que tería moito mérito se o seu custo sexa o anunciado, pero non podemos esquecer que se alimentou de información censurada polo goberno chinés, polo que tamén é razoable que haxa grandes reticencias ante esta compañía (que tamén envía datos dos seus usuarios a China).
Aproveitando o bo momento que están a vivir, dende DeepSeek presentaron hoxe Janus-Pro, un novo xerador de imaxes que entraría a competir con DALL-E e Stable Difussion (entre outros), que podería captar moita atención de manter a liña de eficiencia do resto de desenvolvementos de DeepSeek.

Comparación entre Janus Pro e a versión anterior do modelo de xeración de imaxes de DeepSeek