China ha dado un golpe sobre la mesa en el campo de la inteligencia artificial con DeepSeek-R1, un modelo que rivaliza con OpenAI (ChatGPT), Gemini de Google y Claude de Anthropic. Creado por la startup DeepSeek, este modelo ha sorprendido a la comunidad científica por su capacidad de razonamiento avanzado y su eficiencia en el uso de recursos.
Según un estudio publicado en la revista Nature, DeepSeek-R1 muestra un rendimiento similar al de OpenAI o1 en problemas matemáticos, químicos y de codificación. En pruebas como MATH-500, alcanzó una precisión del 97%, y en la plataforma Codeforces, superó al 96% de los participantes humanos en desafíos de programación. Esto lo convierte en una alternativa de alto nivel dentro del panorama de la IA actual.
Un modelo económico y accesible
DeepSeek-R1 implementa una técnica conocida como “mezcla de expertos”, que permite activar redes de procesamiento específicas según la tarea. Esto, combinado con un enfoque de aprendizaje de refuerzo, optimiza el rendimiento sin disparar los costos de entrenamiento. Su desarrollo costó solo 6 millones de dólares, una fracción de los más de 60 millones invertidos en Llama 3.1 de Meta.
El acceso a DeepSeek-R1 es considerablemente más barato que el de sus competidores: ejecutar una consulta en OpenAI o1 cuesta 30 veces más que hacerlo en este modelo chino. Además, aunque no es completamente de código abierto, su arquitectura “open-weight” permite que los investigadores analicen sus procesos de razonamiento, ofreciendo mayor transparencia en su funcionamiento.
IA en medio de la geopolítica
El avance de DeepSeek-R1 llega en un contexto de tensiones tecnológicas entre China y EE.UU. A pesar de las restricciones de exportación de chips y modelos de IA impuestas por Washington, China ha demostrado que la eficiencia es más importante que la escala de cómputo. Investigadores como François Chollet destacan que este desarrollo marca el fin de la percepción de dominio tecnológico exclusivo de EE.UU. y abre la puerta a una IA más colaborativa.
El costo reducido de DeepSeek-R1 podría significar una democratización de la inteligencia artificial, permitiendo a investigadores y empresas con menos recursos acceder a herramientas avanzadas sin depender de las grandes corporaciones estadounidenses. Alvin Wang Graylin, vicepresidente global de HTC, enfatiza la necesidad de cooperación en lugar de competencia en el desarrollo de IA.
Más información en: Wired