
Nos hemos puesto a mirar de qué demonios se trata esto de DEEPSEEK y por qué hoy todo el mundo se da cuenta a la vez de que existe ..
DeepSeek es el nombre de una empresa china especializada en inteligencia artificial. También es el nombre de su chat de IA, una alternativa propia a ChatGPT, Gemini, Copilot y compañía. Por lo tanto, puedes escuchar y leer menciones a DeepSeek refiriéndote a ambas cosas.
En este artículo nos vamos a centrar en el chatbot de inteligencia artificial, que es un Gran Modelo Lingüístico o Large Language Model (LLM), creado para ayudar con el desarrollo de software, el procesamiento del lenguaje natural y la automatización empresarial.
DeepSeek destaca por ser de código abierto. Esto quiere decir que cualquier persona puede ver cómo funciona internamente, es totalmente transparente, y cualquiera puede instalarse esta IA de forma local o usarla con total libertad. Un desarrollador o investigador puede descargarlo de GitHub y modificarlo para diversos escenarios, incluyendo algunos comerciales.. Esto contrasta totalmente con el secretismo de unos modelos privados.
Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.
Otra de las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado.
Si lo comparamos con ChatGPT haciendo las mismas preguntas, DeepSeek puede ser un poco más escueto a la hora de responder, va más al grano. Sin embargo, tiene la misma flexibilidad que otros modelos, y puedes pedirle que explique las cosas más ampliamente o que las adapte a ti.
DeepSeek ha dado mucho que hablar a finales del 2024 y principios del 2025 por dos modelos de IA concretos. Primero está DeepSeek V3, un modelo de larga escala LLM que supera a la mayoría de IA, y también supera a algunos propietarios. En pruebas como la de programación, este modelo logró superar a Llama 3.1 405B, a GPT-4o y a Qwen 2.5 72B, aunque todos ellos tienen muchos menos parámetros y eso puede influir en el rendimiento y las comparaciones.
Pero lo que realmente ha sorprendido de este modelo es que «solo» necesitó 2,788 millones de horas de entrenamiento, y este proceso costó tan solo 5,5 millones de dólares. Por poner un ejemplo, con el GPT-4 de OpenAI se inviertieron cerca de 80 millones de dólares. Vamos, que costó muchísimo menos de entrenar, lo que le convierte en un modelo muy eficiente, y un 60% más grande que Llama 3.1 405B, de Meta.
El otro gran modelo ha sido DeepSeek R1, que está especializado en razonamiento, y ha sido capaz de alcanza o superar el rendimiento de los modelos más avanzados de OpenAI en pruebas clave de matemáticas y programación. Con él, es la primera vez que un modelo chino de código abierto y gratuito iguala a los líderes occidentales, rompiendo el monopolio de Silicon Valley.
Por poner algunas cifras, este modelo R1 ha costado de desarrollar entre un 90% y 95% menos que sus competidores, y tiene 671.000 millones de parámetros. Además, en pruebas matemáticas MATH-500 ha conseguido un 97,3% de aciertos, frente al 96,4% de OpenAI.
Sin embargo, no todo es bueno. Igual que pasa con Gemini o ChatGPT, DeepSeek también está sujeto a los valores del país donde ha sido desarrollado. En este caso ha sido desarrollado en china, y se adapta a su regulación, debiendo «encarnar valores socialistas fundamentales». Por poner un ejemplo, esto hace que no responda a preguntas sensibles sobre política y geopolítica, como esas sobre Tiananmen o la autonomía de Taiwán.
En este aspecto, en China son más férreos a la hora de controlar las respuestas, hay un mayor control estatal. Por lo tanto, mientras que los modelos occidentales pueden tener más liebrtad para discutir temas polémicos para los valores con los que ha sido entrenado, en los modelos chinos deben alinearse siempre con la ideología y la narrativa del Partido que gobierna el país.
Cómo funciona DeepSeek
DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Esta es una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.Este aprendizaje por refierzo permite que el modelo sea capaz de aprender por si mismo mediante prueba y error, igual que tú puedes aprender a montar en bici o a realizar algunas tareas. Esto hace que el resultado inicial sea más errático e impreciso, pero el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.
Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.
De cara al usuario su funcionamiento es igual que el de otros modelos. Tienes una pantalla de inicio con una campo de escritura y varias opciones de funcionamiento, y luego a la hora de ver los resultados tienes una columna izquierda con un historial de todos tus chats.
Para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.
Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además, también puede ir aprendiendo y mejorando. Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.
Con este modelo de IA puedes hacer prácticamente lo mismo que con otros modelos. Puedes hacerle todo tipo de preguntas, y re responderá en tiempo real. Puedes preguntarle por personajes famosos, por lugares, puedes preguntarle el significado de cosas, y todo lo que se te ocurra.
También sirve para explicarte temas complejos de manera sencilla, siempre y cuando le pidas que lo haga así. También puedes enviarle documentos para que extraiga información clave sobre ellos, y hacerle preguntas relacionadas cobre su contenido.
Sirve para la programación, permitiéndote escribir o depurar código, así como para resolver problemas matemáticos. Además, si eres un creador de contenido puedes pedirle que te genere ideas, textos, que componga poesía, o que te cree plantillas o estructuras para artículos. También puede revisar y corregir textos.
En el cuadro donde escribes tu prompt o pregunta, tienes tres botones. El del clip es para adjuntar archivos. Pero además tienes el botón de DeepThink R1 para hacer que la IA «piense» en lo que te ha respondido antes o en tu contexto, y te de una respuesta razonada. Y luego, el botón Search sirve para obtener la información de Internet, aunque de momento no te va a indicar las fuentes de donde la ha sacado.
72 cursos gratis online de todo tipo para empezar el 2025 aprendiendo algo nuevo
Luego, con cada respuesta que te da tienes botones para copiar el texto, dos botones para calificarlo positiva o negativamente dependiendo de la calidad de la respuesta, y otro para recargar la respuesta y que te la vuelva a generar desde cero basándose en tu mismo prompt.
Conclusión K.O. chino a la IA estadounidense donde el sector se tendrá que replantear y resetear desde el inicio porque aunque en tecnología no la supere lo de código abierto y gratis, en costes la diferencia es abismal, pongan el ejemplo de un avión si al pasaje se le reduce el 75% y nos lleva al mismo sitio aunque sea de forma incómoda los pasajeros no darán importancia al factor comodidad frente a tamaña bajada del pasaje.
En fin cuidado con el sectorial IA porque lo puede pasar mal a partir de hoy con independencia de lo que suceda este miércoles y jueves.
Al final han decidido sacar el cuchillo jamonero en la bolsa con la excusa de haberse dado cuenta ahora de que China le está comiendo la tostada a USA
La verdad el viernes no se sabía ni que era el DEEPSEEK y hoy lo más importante del mundo mundial … flipping in colours ¡¡
Lo mismo que nadie sabía quien era Evergrande y de repente, un día, era lo más importante.
En ese momento no salió bien y la gente se olvidó.
Veremos si con Deepseek consiguen tumbarlo todo…
Me he estudiado el tema y la verdad que es un cambio de paradigma en la IA tanto en sistema como estructura como es costes, es menos potente y precisa pero puede dar la potencia y precisión que el que demande quiera a la medida de sus necesidades y los costos energéticos del 75% y las data centers mucho más pequeñas o con mucha mayor capacidad el mismo tamaño.
Es algo así como si sacan una nueva batería muchos más baratas y más eficiente para los coches eléctricos dejando por el suelo las actuales ..
Es decir la IA hoy americana te da lo que le pidas a la primera de ahí que gaste mucho recursos y tengan que pasar factura .. la china te va dando lo que vas pidiendo , no le va a dar a un niño lo que a un universiatario, y es ahí es cuando la tecnología china barre con la americana si le sumas que encima pasas de costarte 100 a 25 pues eso ..
Ahora mismo todo rebota y no tengo ni pajolera idea si es para caer más o si para dejar hoy todo como accidente.
Lo que si se es que todo se cayó a la misma horas y todo rebotó también a la misma hora y minuto .. eso me huele a algoritmos, como bien dices nadie sabía nada de deepseek el viernes y hoy por lo visto todo el mundo lo sabía todo y parecía que iban a tumbar el mercado.
El pobrecito que no sepa gestionar stops o abrir y cerrar posiciones sin un criterio o método. Te confieso que me hizo cerrar hoy posiciones que no quería cerrar hasta el miércoles o jueves si los mercados bajasen ,vamos que me adelantaron el miércoles al lunes. Y me ha roto los esquemas.