DeepSeek provoca un terremoto no sector da IA
luns, 27 de xaneiro do 2025
Hai unha semana a compañÃa chinesa de intelixencia artificial DeepSeek lanzou un novo modelo de IA de código aberto chamado R1, que poderÃa terse considerado como un rival de ChatGPT dos moitos que xurdiron nos últimos meses, pero conseguindo captar unha atención inusual, coándose as súas aplicacións móbiles nos primeiros postos das tendas de aplicacións, adiantando incluso a ChatGPT na App Store de Apple, aÃnda que durante a xornada de hoxe o servizo tivo problemas para poder aceptar novas altas (supostamente por mor de «ataques maliciosos a grande escala»).
DeepSeek-R1 forma parte dunha nova xeración de grandes modelos de razoamento que fan máis que responder ás consultas dos usuarios: reflexionan sobre a súa propia análise mentres producen unha resposta, tentando detectar erros antes de ofrecerllos ao usuario. Nese ámbito DeepSeek-R1 iguala ou supera o modelo de razoamento de OpenAI, o1 en varias áreas, o que é toda unha sorpresa polo feito de que esta solución asegura precisar dun investimento moi inferior: aseguran que o seu adestramento custou menos de 6 millóns de dólares.
Aseguran que DeepSeek viuse obrigada a ser máis eficiente debido á escaseza e ao uso de GPU máis antigas como consecuencia das restricións de exportación dos Estados Unidos na venda desta tecnoloxÃa a China, afirmacións que non poden verificarse, pois hai quen apunta que, aÃnda que aseguran non ter empregado o último hardware de nVIDIA, na práctica poderÃan ter conseguido ilegalmente material da compañÃa (polo que tamén os investimentos realizados serÃan moi superiores ao anunciado publicamente).
A posibilidade de que a eficiencia, o aforro de custos e o rendemento do modelo de IA de DeepSeek fose unha realidade provocou todo un terremoto no sector tecnolóxico, pois pon en dúbida os xigantescos investimentos que se están a proxectar (lembremos que o Proxecto Stargate busca xuntar 500.000 millóns de dólares en só 4 anos para a infraestrutura de IA de OpenAI). Os mercados temen que DeepSeek pinche a burbulla da IA, e as empresas que se estaban a beneficiar deste boom están a experimentar grandes caÃdas na súa cotización bolsista. nVIDIA é a compañÃa que máis está a notar esta perda de confianza, cunha grande caÃda no valor da súa acción (que chegou a unha perda de capitalización de 600.000 millóns de dólares, converténdose na maior caÃda nun único dÃa na historia dos EE.UU.), arrastrando a outras tecnolóxicas como Broadcom, AMD ou Microsoft, que tamén estaban a medrar moito nos últimos meses polo grande pulo da IA.
Cómpre salientar que o interese por DeepSeek pode ser esaxerado, xa que pode estar baseado en falsidades que buscan manipular o mercado, aÃnda que tamén existe a posibilidade de que se teña forzado a apertura dun novo ciclo na carreira da IA, na que os resultados brutos non sexan dabondo e se force ao sector a apostar por unha maior eficiencia para que a industria poida ser sustentable económica e enerxeticamente (o que tamén poderÃa supor un importante pulo para os modelos abertos de IA).
Tampouco podemos esquecer que DeepSeek non é superior ao que actualmente hai no mercado, senón que nalgunhas categorÃas comparativas consegue puntuacións equiparables, o que terÃa moito mérito se o seu custo sexa o anunciado, pero non podemos esquecer que se alimentou de información censurada polo goberno chinés, polo que tamén é razoable que haxa grandes reticencias ante esta compañÃa (que tamén envÃa datos dos seus usuarios a China).
Aproveitando o bo momento que están a vivir, dende DeepSeek presentaron hoxe Janus-Pro, un novo xerador de imaxes que entrarÃa a competir con DALL-E e Stable Difussion (entre outros), que poderÃa captar moita atención de manter a liña de eficiencia do resto de desenvolvementos de DeepSeek.
- Comparación entre Janus Pro e a versión anterior do modelo de xeración de imaxes de DeepSeek