
Un laboratorio de inteligencia artificial poco conocido de China ha desatado el pánico en Silicon Valley después de lanzar modelos de IA que pueden superar a los mejores de Estados Unidos a pesar de estar construidos de forma más barata y con chips menos potentes.
DeepSeek, como se llama el laboratorio, presentó a fines de diciembre un modelo de lenguaje grande, gratuito y de código abierto que, según afirma, tomó solo dos meses y menos de 6 millones de dólares para construirse, utilizando chips de capacidad reducida de Nvidia.llamados H800s.
Los nuevos acontecimientos han hecho saltar las alarmas sobre si el liderazgo mundial de Estados Unidos en inteligencia artificial se está reduciendo y han puesto en tela de juicio el enorme gasto de las grandes tecnológicas en la construcción de modelos de IA y centros de datos.
En un conjunto de pruebas comparativas de terceros, el modelo de DeepSeek superó a MetaLlama 3.1 de ’s, GPT-4o de OpenAI y Claude Sonnet 3.5 de Anthropic en precisión que abarca desde la resolución de problemas complejos hasta matemáticas y codificación.
DeepSeek lanzó el lunes R1, un modelo de razonamiento que también superó al último o1 de OpenAI en muchas de esas pruebas de terceros.
“Ver el nuevo modelo de DeepSeek es muy impresionante en términos de cómo han logrado crear un modelo de código abierto que realiza este cálculo en tiempo de inferencia y es súper eficiente en términos de computación”, dijo Microsoft.El director ejecutivo de la compañía , Satya Nadella, dijo en el Foro Económico Mundial de Davos, Suiza, el miércoles: “Deberíamos tomar muy, muy en serio los acontecimientos que se están produciendo en China
DeepSeek también tuvo que sortear las estrictas restricciones a los semiconductores que el gobierno estadounidense impuso a China, impidiéndole al país acceder a los chips más potentes, como los H100 de Nvidia. Los últimos avances sugieren que DeepSeek encontró una forma de sortear las normas o que los controles a las exportaciones no fueron el estrangulamiento que Washington pretendía.
“Pueden tomar un modelo grande y realmente bueno y utilizar un proceso llamado destilación”, dijo Chetan Puttagunta, socio general de Benchmark. “Básicamente, se utiliza un modelo muy grande para ayudar a que el modelo pequeño sea inteligente en lo que uno quiere que sea inteligente. Eso es realmente muy rentable”.
Se sabe poco sobre el laboratorio y su fundador, Liang WenFeng. DeepSeek nació de un fondo de cobertura chino llamado High-Flyer que administra alrededor de 8 mil millones de dólares en activos, según informes de los medios .
Pero DeepSeek no es la única empresa china que está haciendo avances.
El destacado investigador de inteligencia artificial Kai-Fu Lee ha dicho que su startup 01.ai se entrenó utilizando solo 3 millones de dólares. La empresa matriz de TikTok, ByteDance, publicó el miércoles una actualización de su modelo que afirma superar al o1 de OpenAI en una prueba comparativa clave.
“La necesidad es la madre de la invención”, afirmó Aravind Srinivas, director ejecutivo de Perplexity. “Como tuvieron que encontrar soluciones alternativas, acabaron construyendo algo mucho más eficiente”.
Lea más sobre DeepSeek
La inteligencia artificial china DeepSeek destrona a ChatGPT en la App Store
DeepSeek sufre un ciberataque a gran escala y dice que está limitando los registros
Cómo el nuevo modelo de inteligencia artificial chino DeepSeek amenaza el dominio de EE.UU.
Nvidia alcanza un nuevo mínimo en la sesión por la amenaza del modelo de inteligencia artificial DeepSeek
El rumor sobre el modelo chino de inteligencia artificial DeepSeek provoca una liquidación masiva en el Nasdaq
Moraleja: si le aprietas el gaznate a tu enemigo no esperes más que se defienda y trate de deshacerte de ti, la Casa Blanca ha decidido hace tiempo boicotear por tierra, mar y aire a China y claro ha provocado que cada día sea menos dependiente y más eficiente para poder competir.