La startup china DeepSeek ha desarrollado un algoritmo de inteligencia artificial, DeepSeek-R1, que compite directamente con los sistemas más avanzados de OpenAI en áreas como matemáticas, química y codificación. Este modelo, reconocido por su alta precisión y menor costo operativo, está atrayendo la atención de la comunidad científica y tecnológica.
De acuerdo con un artículo publicado en la revista Nature, DeepSeek-R1 alcanza una precisión del 97% en la resolución de problemas matemáticos bajo el estándar MATH-500 y supera al 96% de participantes humanos en pruebas de programación de Codeforces. Esto lo posiciona como una alternativa competitiva y accesible frente a otras tecnologías líderes en el mercado.
Desempeño avanzado con menor inversión
DeepSeek-R1 utiliza “cadenas de pensamiento”, un enfoque que simula el razonamiento humano, y fue entrenado con técnicas de aprendizaje de refuerzo, donde el sistema recibe recompensas por obtener respuestas correctas y explicar sus procesos. Además, emplea una arquitectura de “mezcla de expertos”, que permite activar redes de procesamiento específicas según la tarea.
Este enfoque no solo optimizó su rendimiento, sino que también redujo significativamente el costo de su desarrollo. Mientras que entrenar un modelo como Llama 3.1 de Meta costó más de 60 millones de dólares, DeepSeek-R1 logró su entrenamiento con una inversión cercana a los 6 millones. Asimismo, el costo de uso de este modelo es 30 veces menor que el de sistemas como OpenAI o1.
Un proyecto en el contexto de tensiones tecnológicas
El desarrollo de DeepSeek-R1 cobra relevancia en medio de las crecientes restricciones tecnológicas entre China y Estados Unidos. A pesar de los estrictos controles de exportación de chips y modelos de inteligencia artificial impuestos por Estados Unidos, DeepSeek ha demostrado que la eficiencia en el uso de recursos puede superar la necesidad de contar con infraestructuras masivas.
François Chollet, creador de la biblioteca de aprendizaje profundo Keras, subraya que “DeepSeek-R1 es una prueba de que la optimización de recursos es más importante que la escala de cómputo en el desarrollo de IA”.
Por otro lado, la accesibilidad del modelo también ha sido un punto clave. Publicado bajo una licencia del Instituto Tecnológico de Massachusetts (MIT), DeepSeek-R1 permite a los investigadores reutilizar sus “cadenas de pensamiento” y profundizar en sus procesos de razonamiento, aunque los datos de entrenamiento no están disponibles públicamente.
Colaboración en lugar de competencia
Expertos como Alvin Wang Graylin, vicepresidente global de HTC, enfatizan la importancia de la colaboración internacional en el desarrollo de inteligencia artificial avanzada. “Ambas naciones deben adoptar un enfoque colaborativo en lugar de perpetuar una carrera tecnológica que limita el progreso global”, afirma Graylin.
DeepSeek-R1 no solo es una alternativa económica, sino un modelo que marca un nuevo estándar en la accesibilidad y eficiencia de las tecnologías de inteligencia artificial, ofreciendo una solución que podría transformar la adopción y el uso de estas herramientas a nivel mundial.