En un giro sorprendente dentro del ámbito de la inteligencia artificial, modelos chinos como DeepSeek y Qwen3 han mostrado resultados superiores a sus rivales occidentales como ChatGPT-5 y Grok en un experimento de trading autónomo con criptomonedas. Este desempeño plantea interrogantes sobre la eficiencia del entrenamiento, la gestión del riesgo y el futuro de las finanzas impulsadas por IA.
Un reciente experimento de trading situó varios de los principales modelos de lenguaje grande (LLM) en acción en mercados de criptomonedas en vivo. Entre ellos, DeepSeek se destacó como el modelo con mejor desempeño, generando el único retorno no realizado positivo de aproximadamente 9,1% en ese día, mientras que otros registraron pérdidas. Por su parte, Qwen3 tuvo una caída moderada de alrededor de 0,5%. En contraste, ChatGPT-5 sufrió una caída de más del 66% del capital inicial en la prueba.
Este resultado es particularmente relevante si se considera que el presupuesto de desarrollo de DeepSeek fue de apenas unos 5,3 millones de dólares, una fracción del gasto de sus competidores occidentales.
Los analistas apuntan a varios factores tras este éxito: un conjunto de datos más centrado en la dinámica del mercado cripto, una estrategia de apalancamiento que favoreció posiciones largas en tokens como BTC, ETH, SOL, BNB, DOGE y XRP, y controles de riesgo más ágiles.
El auge de la IA de coste reducido y su impacto en el trading cripto
Pero la historia no se reduce a quién ganó más. El experimento subraya cómo el trading autónomo por IA —aunque aún arriesgado— ha avanzado más allá de la mera generación de señales, hacia la toma de decisiones bajo volatilidad y apalancamiento. Un investigador señaló que, aunque los LLM de propósito general como ChatGPT son fuertes en muchos dominios, pueden carecer del entrenamiento especializado requerido para los mercados cripto de alta volatilidad.
También pone de relieve una dimensión poco explorada: la rentabilidad del coste. El resultado de DeepSeek, con un presupuesto comparativamente bajo, sugiere que la eficiencia en el diseño del modelo y la formación específica por dominio pueden superar la escala pura. Claro está, nada de esto significa que la IA sea infalible: los mercados siguen siendo impredecibles, y la supervisión humana sigue jugando un papel clave.
El experimento actúa tanto como advertencia como señal: la IA puede asumir cada vez más el timón del trading, pero la supervisión efectiva, la gestión del riesgo y la especialización del modelo son más importantes que nunca.