Autor: Black Lobster, Deep Tide TechFlow
En el verano de 1858, un cable de cobre atravesó el fondo del Atlántico, conectando Londres y Nueva York.
El significado de este hecho nunca ha sido la velocidad de transmisión, sino la estructura de poder: quien despliega el cable submarino, puede extraer agua del flujo de información. El Imperio Británico, con su red global de telégrafos, controlaba la inteligencia de las colonias, los precios del algodón y las noticias de guerra.
La fuerza del imperio no solo residía en su flota, sino también en ese cable.
Más de ciento sesenta años después, esa lógica se está reproduciendo de una manera inesperada.
En 2026, los grandes modelos de China están silenciosamente conquistando el mercado global de desarrolladores. Los datos más recientes de OpenRouter muestran que el 61% del consumo de tokens en los diez principales modelos de la plataforma proviene de modelos chinos, con los tres primeros lugares completamente dominados por China. Los desarrolladores en San Francisco, Berlín y Singapur envían solicitudes API diariamente a través de cables submarinos del Pacífico hacia centros de datos en China, donde se consume poder computacional y electricidad, y los resultados regresan.
La electricidad nunca ha salido de la red eléctrica china, pero su valor se ha entregado transfronterizamente a través de tokens.
El 24 de febrero de 2026, OpenRouter publicó datos semanales: los diez principales modelos consumieron aproximadamente 8.7 billones de tokens, con modelos chinos dominando con 5.3 billones, un 61%. MiniMax M2.5 lideró con 2.45 billones de tokens, seguido por Kimi K2.5 y GLM-5 de Zhìpǔ, todos de China.

Datos del 26 de febrero
No fue casualidad; un detonante encendió todo.
A principios de año, surgió OpenClaw, una herramienta de código abierto que permite a la IA realmente “trabajar”: controlar directamente la computadora, ejecutar comandos y realizar flujos de trabajo complejos en paralelo. En pocas semanas, alcanzó más de 210,000 estrellas en GitHub.
El profesional financiero John instaló inmediatamente OpenClaw y conectó la API de Anthropic, comenzando a monitorear automáticamente la bolsa y a dar señales de trading. Horas después, miró su saldo y se quedó unos segundos en silencio: solo unos pocos dólares, ¡desaparecidos!
Esta es la nueva realidad que trae OpenClaw. Antes, chatear con IA costaba unos pocos tokens por conversación, sin importar. Ahora, con OpenClaw, la IA ejecuta varias tareas en segundo plano, llamando contextos repetidamente y haciendo iteraciones, y el consumo de tokens no es lineal, sino exponencial. La factura se acelera como un coche con el capó abierto, el nivel de gasolina bajando sin parar.
En la comunidad de desarrolladores circula un “truco”: usar tokens OAuth para conectar directamente las cuentas de suscripción de Anthropic o Google a OpenClaw, convirtiendo la cuota mensual “ilimitada” en combustible gratuito para el agente de IA, método que muchos adoptan.
Las respuestas oficiales no tardaron en llegar.
El 19 de febrero, Anthropic actualizó su acuerdo, prohibiendo explícitamente usar las credenciales de suscripción de Claude en herramientas de terceros como OpenClaw. Para acceder a las funciones de Claude, hay que usar la API de pago. Google también bloqueó en masa las cuentas de suscripción a Antigravity y Gemini AI Ultra que se conectaban a través de OpenClaw.
“El mundo ha sufrido mucho tiempo con Qin”, pensó John, y se volcó en los grandes modelos nacionales.
En OpenRouter, el modelo chino MiniMax M2.5 obtuvo un puntaje del 80.2% en tareas de ingeniería de software, frente al 80.8% de Claude Opus 4.6, una diferencia casi insignificante. Pero el precio es muy diferente: el primero cuesta 0.3 dólares por millón de tokens, el segundo 5 dólares, ¡una diferencia de aproximadamente 17 veces!
John cambió de modelo, y su flujo de trabajo siguió funcionando, pero la factura se redujo en un orden de magnitud. Esta migración está ocurriendo en todo el mundo.
El COO de OpenRouter, Chris Clark, lo explicó claramente: las modelos de código abierto chinas han ganado gran parte del mercado porque representan una proporción excepcionalmente alta en los flujos de trabajo de los desarrolladores en EE. UU.
Para entender la esencia de la exportación de tokens, primero hay que comprender la estructura de costos de un token.
Parece muy liviano: un token equivale aproximadamente a 0.75 palabras en inglés. Una conversación normal con IA consume solo unos pocos miles de tokens. Pero cuando estos tokens se acumulan en billones, la realidad física se vuelve pesada.
El costo de los tokens se reduce a dos componentes principales: poder computacional y electricidad.
El poder computacional es la depreciación de las GPU. Comprar una Nvidia H100 cuesta unos 30,000 dólares, y su vida útil, en términos de inferencia, representa el costo de depreciación. La electricidad es el combustible que mantiene en marcha los centros de datos: cuando las GPU están al máximo, consumen unos 700 vatios cada una, más los costos de refrigeración. La factura eléctrica de un gran centro de datos de IA puede superar fácilmente cientos de millones de dólares al año.
Ahora, dibuja este proceso en un mapa.
Un desarrollador en San Francisco envía una solicitud API. Los datos viajan desde California, cruzan el Pacífico por un cable submarino, llegan a un centro de datos en China, donde un clúster de GPU comienza a trabajar. La electricidad fluye desde la red china hacia los chips, la inferencia termina y los resultados regresan. Todo esto en uno o dos segundos.
La electricidad nunca ha salido de la red china, pero su valor, a través de los tokens, se ha entregado transfronterizamente.
Aquí hay una magia que ningún comercio convencional puede igualar: los tokens no tienen forma física, no pasan por aduanas, no pagan aranceles, ni siquiera están en las estadísticas comerciales oficiales. China exporta una gran cantidad de servicios de computación y electricidad, pero en los datos oficiales de comercio, casi es invisible.
Los tokens se han convertido en derivados de la electricidad; en esencia, la exportación de tokens es la exportación de electricidad.
Esto también se debe a los bajos precios de la electricidad en China, que son aproximadamente un 40% más bajos que en EE. UU. en términos de costo total, una diferencia física que los competidores pueden copiar fácilmente.
Además, los grandes modelos de IA chinos tienen ventajas en algoritmos y en la “competencia interna”.
DeepSeek V3, con arquitectura MoE, activa solo parte de los parámetros durante la inferencia. Pruebas independientes muestran que su costo de inferencia es aproximadamente 36 veces menor que GPT-4o. MiniMax M2.5, con 229 mil millones de parámetros, activa solo 10 mil millones en la misma escala.
En la cima de esa competencia está la “involución”: Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhìpǔ, MiniMax… más de una docena de empresas compiten en la misma pista, y los precios han caído por debajo de los márgenes de rentabilidad razonables. Perder dinero para ganar mercado ya es la norma en la industria.
Al analizarlo, es similar a la estrategia de exportación de manufactura china: aprovechar la cadena de suministro y la competencia interna para reducir drásticamente los precios de los tokens.
Antes de los tokens, hubo otra forma de exportar electricidad.
Alrededor de 2015, los gestores de plantas hidroeléctricas en Sichuan, Yunnan y Xinjiang comenzaron a recibir visitantes extraños.
Alquilaron fábricas abandonadas, llenándolas de máquinas, y las mantuvieron en funcionamiento las 24 horas. Estas máquinas no producían nada, solo resolvían un problema matemático infinito, y de vez en cuando, calculaban un Bitcoin.
Era la primera forma de exportación de electricidad: aprovechar la electricidad barata de agua y viento, mediante mineros de hash, para convertirla en activos digitales que circulan globalmente y se venden en exchanges por dólares.
La electricidad no cruzaba fronteras, pero su valor, a través de Bitcoin, se movía por todo el mundo.
En esos años, China representaba más del 70% de la potencia minera global de Bitcoin. La electricidad hidroeléctrica y de carbón participaba en una redistribución global de capital de forma indirecta.
En 2021, todo esto terminó abruptamente. La regulación cayó con fuerza, los mineros se dispersaron, y la potencia minera migró a Kazajistán, Texas y Canadá.
Pero esa lógica nunca desapareció; solo esperaba una nueva forma. Cuando surgió ChatGPT y los grandes modelos comenzaron a competir, las antiguas granjas mineras se transformaron en centros de datos de IA, las máquinas de minería en GPU de poder computacional, y los Bitcoin producidos en tokens. Lo único constante fue la electricidad.
La migración de Bitcoin y la de tokens son lógicamente similares, pero hoy en día, los tokens tienen mayor valor comercial.
Minar Bitcoin es un cálculo matemático puro, y su valor como activo financiero proviene de su escasez y consenso de mercado, sin relación con “qué se calcula”. La potencia computacional en sí misma no produce nada, es más bien un mecanismo de confianza.
La inferencia en grandes modelos es diferente. Las GPU consumen electricidad, pero producen servicios cognitivos reales: código, análisis, traducción, creatividad. El valor de los tokens proviene directamente de su utilidad para el usuario. Es una integración más profunda: una vez que el flujo de trabajo de un desarrollador depende de un modelo, cambiarlo con el tiempo se vuelve cada vez más costoso.
Y hay una diferencia clave: la minería de Bitcoin fue expulsada de China, mientras que la exportación de tokens es una elección activa de los desarrolladores globales.
La misma línea de cable submarino de 1858 representa la soberanía del Imperio Británico sobre la autopista de la información: quien posee la infraestructura, puede definir las reglas del juego.
La exportación de tokens también es una guerra sin declaración formal, con muchas resistencias.
La soberanía de los datos es la primera barrera: si un desarrollador estadounidense envía una solicitud API que pasa por un centro de datos en China, los datos físicamente atraviesan China. Para desarrolladores individuales y aplicaciones pequeñas, esto no es un problema, pero en escenarios que involucran datos sensibles, financieros o regulatorios, es una barrera dura. Por eso, la penetración de modelos chinos en herramientas de desarrollo y aplicaciones personales es alta, pero en sistemas empresariales críticos, casi inexistente.
La prohibición de chips es la segunda barrera: China enfrenta restricciones en la exportación de GPU de alta gama de Nvidia. La arquitectura MoE y las optimizaciones algorítmicas solo pueden mitigar parcialmente esta desventaja, pero el techo aún existe.
Pero estas resistencias son solo el comienzo; un campo de batalla mayor se está formando.
Los tokens y los modelos de IA ya son una nueva dimensión en la competencia estratégica entre EE. UU. y China, comparable a la era de los semiconductores y la internet del siglo XX, e incluso más cercana a una metáfora más antigua: la carrera espacial.
En 1957, la Unión Soviética lanzó Sputnik 1, sorprendiendo a Estados Unidos, que respondió con el programa Apollo, invirtiendo miles de millones de hoy en día en la carrera espacial para no quedar atrás.
La competencia en IA es sorprendentemente similar, pero mucho más intensa. El espacio es un espacio físico, que no perciben las personas. La IA penetra en los vasos capilares de la economía: cada línea de código, cada contrato, cada sistema de decisión gubernamental puede estar respaldado por un modelo de un país. Quien tenga el modelo que se convierta en la infraestructura predeterminada para los desarrolladores globales, tendrá una influencia estructural en la economía digital mundial.
Eso es lo que realmente inquieta a Washington respecto a la exportación de tokens chinos.
Cuando el código, los flujos de trabajo y la lógica de productos de un desarrollador se construyen en torno a un modelo chino, los costos de migración aumentan exponencialmente con el tiempo. Incluso si EE. UU. legisla para restringirlo, los desarrolladores resistirán con los pies, como hoy no hay programador que pueda abandonar GitHub.
Quizá, la exportación de tokens sea solo el comienzo de esta larga competencia. China no ha declarado que quiera derrocar nada; simplemente, con precios más bajos, ha llevado sus servicios a cada desarrollador en el mundo con una API Key.
Esta vez, quienes han tendido los cables son los ingenieros en Hangzhou, Beijing, Shanghai, y los clústeres de GPU que operan día y noche en alguna provincia del sur.
No hay cuenta regresiva para esta competencia; sucede cada día, 24 horas, en cada terminal de cada desarrollador, en unidades de tokens y en el campo de batalla invisible de la economía digital.