DeepSeek podería ter violado a propiedade intelectual de OpenAI

mércores, 29 de xaneiro do 2025 Marcus Fernández

OpenAI comunicou ao Financial Times que atopou probas de que a chinesa DeepSeek utilizou os modelos propietarios da compañía estadounidense para adestrar o seu propio competidor de código aberto, nun contexto de crecente preocupación por unha posible infracción da propiedade intelectual.
Aseguran ter detectado evidencias de destilación, coa sospeita de que esta técnica para obter un mellor rendemento en modelos máis pequenos aproveitando as saídas de modelos maiores e máis potentes foi realizado por DeepSeek. Falamos dunha práctica común na industria, pero ao realizarse para construír un modelo rival infrinxiríanse os termos do servizo de OpenAI (que recollen a prohibición de «usar as saídas para desenvolver modelos que compitan con OpenAI»).
OpenAI e Microsoft investigaron o ano pasado contas que se cría que pertencían a DeepSeek e que estaban a utilizar a API de OpenAI. Bloqueáronlles o acceso ao sospeitar que estaban a empregar a destilación de maneira que infrinxía os termos de servizo, segundo publicou tamén Bloomberg.
Non sería o único punto escuro de DeepSeek, compañía que asegura que que utilizou só 2.048 tarxetas nVIDIA H800 e gastou 5,6 millóns de dólares para adestrar o seu modelo V3 con 671.000 millóns de parámetros, aínda que hai sospeitas de que en realidade empregaron máis 50.000 tarxetas nVIDIA H100 adquiridas ilegalmente, polo que, aínda que o resultado de DeepSeek sexa notable, está lonxe do comunicado oficialmente.