Crisis en el mercado tecnológico y en especial en el desarrollo de Inteligencia Artificial (IA). El lanzamiento en China del asistente DeepSeek, un ChatGPT chino, ha dinamitado todo el tablero del sector tecnológico y abre la incógnita sobre el desarrollo de la guerra que mantienen Estados Unidos y el gigante asiático en esta cuestión.
DeepSeek llegó a la App Store el pasado 11 de enero y rápidamente ha escalado posiciones hasta ocupar el primer puesto en la tienda de aplicaciones de Apple en Estados Unidos, incluso por delante del meteórico ChatGPT de OpenAI.
Este hito ha revolucionado el mercado, especialmente porque la app china lleva tan solo unos días y compite con el 'chatbot' más popular desde hace dos años. Pero también porque se ha desarrollado con muy poco presupuestos, restricciones en el acceso a material y, además, logrando unos resultados incluso mejores que los desarrollos de Silicon Valley.
La herramienta DeepSeek es un asistente de inteligencia artificial (IA) lanzado bajo una modalidad de uso gratuito. Además de responder preguntas en formato de conversación, también permite navegar por la web ofreciendo respuestas actualizadas, resumir documentos de texto rápidamente o utilizar el razonamiento para resolver problemas complejos.
En su base se encuentra el modelo DeepSeek V3, lanzado en diciembre de 2024. Se ha entrenado con 671.000 millones de parámetros con arquitectura Mixture of Experts (MoE), que divide un modelo de IA en pequeñas redes neuronales para que actúen de forma separada como si fueran distintos expertos.
Ademas, dispone de 37.000 millones de parámetros activados para cada token y se ha recurrido al mecanismo de atención latente multicabezal (MLA) para "lograr una inferencia eficiente y una capacitación rentable". Se ha empleado 14,8 billones de tokens "diversos y de alta calidad" junto con un ajuste supervisado y aprendizaje de refuerzo por fases. Aseguran, además, que cada token ha requerido para su entrenamiento 3,7 días con 2.048 GPU Nvidia H800, lo que hace que el entrenamiento total alcance los 2,788 millones de horas de GPU
El precio y la batalla por el modelo como principales bazas
El coste total de todo el desarrollo ha sido de 5,576 millones de dólares. A pesar de que a priori puede parecer una suma de dinero alta, está muy lejos de los 78 millones de dólares invertidos en GPT-4 o de los 191 millones de Gemini Ultra de Google.
Además, este modelo se ofrece con código abierto y ha logrado unos resultados perfectos en razonamientos lingüísticos o matemáticos, respondiendo además todas las preguntas en un idioma perfecto en español, superando en algunos casos a sus rivales líderes.
En concreto, supera a ChatGPT en categorías como comprensión del lenguaje, capacidad para responder preguntas complejas de nivel posgrado, análisis de la capacidad para resolver problemas de software del mundo real y sobresale en las pruebas de resolución de desafíos (MATH 500).
Sin embargo, uno de los principales problemas es la censura china y la adaptación a las premisas del régimen de Pekín. Entre otras cuestiones, la herramienta se bloquea, por ejemplo, cuando se le cuestiona sobre lo ocurrido en la plaza de Tiannamén en 1989. Primero duda sin ofrecer nada en concreto, después invita a preguntar sobre otra cuestión.
El gran éxito de DeepSeek abre ahora las puertas al futuro de la guerra entre Estados Unidos y China. Ambos países se sitúan ahora en una posición mucho más equilibrada, en una disputa que remonta en muchos casos a la carrera espacial de Estados Unidos y la URSS del siglo XX.
Sin embargo, la lección pone en duda el modelo cerrado de Silicon Valley y las inversiones estratosféricas de algunos proyectos. La experiencia china pone en valor el mantra que defiende que una inversión equilibrada permite obtener mejores resultados que el gasto de ingentes cantidades de dinero.
El gigante asiático tiene capacidad de competir en el precio, a diferencia de los desarrollos de Estados Unidos, que suponen el pago de costosas licencias. En todo caso, surge ahora la duda sobre si ambos sistemas podrán simplemente coexistir. No sería la primera vez, puesto que ya ha pasado con otras herramientas como Windows (sistema de código cerrado) y Linux (sistema de código abierto), pero la diferencia es que el crecimiento de DeepSeek nada tiene que ver en su relevancia con el pasado de Linux.