Autor: Schwarzer Hummer, Deep Tide TechFlow
Im Sommer 1858 wurde ein Kupferkabel quer über den Atlantik verlegt und verband London mit New York.
Der Sinn dieser Tat lag nie in der Übertragungsgeschwindigkeit, sondern in der Machtstruktur: Wer das Unterseekabel verlegte, konnte im Informationsfluss profitieren. Das British Empire nutzte sein globales Telegrafennetz, um Kolonialinformationen, Baumwollpreise und Kriegsmeldungen zu kontrollieren.
Die Stärke des Imperiums lag nicht nur in seiner Flotte, sondern auch in diesem Kabel.
Über 160 Jahre später wiederholt sich dieses Prinzip auf eine unerwartete Weise.
2026 wächst Chinas große KI-Modelle still und heimlich auf dem globalen Entwicklermarkt. Laut den neuesten Daten von OpenRouter verbrauchen die Top-10-Modelle der Plattform 61 % der Token, die ersten drei Plätze sind ausschließlich chinesisch. Entwickler in San Francisco, Berlin und Singapur senden täglich API-Anfragen, die durch transozeanische Glasfaserkabel nach China gelangen, wo Rechenleistung und Strom fließen, und die Ergebnisse werden zurückgesendet.
Der Strom bleibt im chinesischen Netz, doch sein Wert wird durch Token grenzüberschreitend übertragen.
Am 24. Februar 2026 veröffentlichte OpenRouter wöchentliche Daten: Die Top-10-Modelle verbrauchen insgesamt etwa 8,7 Billionen Token, davon entfallen 5,3 Billionen auf chinesische Modelle, was 61 % entspricht. MiniMax M2.5 führt mit 2,45 Billionen Token, gefolgt von Kimi K2.5 und Zhizhuo GLM-5, alle aus China.

Aktuelle Daten vom 26. Februar
Dies ist kein Zufall, sondern ein Zündfunke, der alles in Brand setzt.
Anfang des Jahres erschien OpenClaw, ein Open-Source-Tool, das KI wirklich zum „Arbeiten“ bringt: Es kann direkt den Computer steuern, Befehle ausführen und komplexe Workflows parallel abarbeiten. Innerhalb weniger Wochen erreichte es über 210.000 Sterne auf GitHub.
Finanzexperte John installierte OpenClaw sofort und integrierte die Anthropic API. Er begann, den Aktienmarkt automatisch zu überwachen und rechtzeitig Handelssignale zu liefern. Nach einigen Stunden starrte er auf sein Kontoguthaben – nur noch wenige Dollar.
Das ist die neue Realität, die OpenClaw schafft. Früher kostete ein Gespräch mit KI nur wenige Token, kaum der Rede wert. Nach der Integration läuft die KI im Hintergrund mit mehreren Subaufgaben, ruft ständig Kontext ab und iteriert. Der Token-Verbrauch wächst exponentiell. Die Rechnung läuft wie ein Auto mit offenem Motor, das immer schneller wird, während der Tank leerer wird.
In Entwicklergemeinschaften kursiert ein „Geheimtipp“: Mit OAuth-Token die Abonnements bei Anthropic oder Google direkt an OpenClaw anzuschließen, um die monatliche Flatrate in kostenlose Treibstoffe für KI-Agenten umzuwandeln – das ist eine beliebte Methode.
Offizielle Gegenmaßnahmen folgten rasch.
Am 19. Februar aktualisierte Anthropic die Nutzungsbedingungen und verbot ausdrücklich die Verwendung von Claude-Abonnementnachweisen für Drittanbieter-Tools wie OpenClaw. Für den Zugriff auf Claude-Funktionen müsse man die API-Gebühren bezahlen. Google sperrte großflächig Abonnements, die über OpenClaw auf Antigravity und Gemini AI Ultra zugreifen.
„Die Welt leidet schon lange unter Qin“, so Jhon, und wandte sich den chinesischen Großmodellen zu.
Auf OpenRouter schneidet das chinesische Großmodell MiniMax M2.5 bei Software-Engineering-Aufgaben mit 80,2 % ab, Claude Opus erreicht 80,8 %. Der Unterschied ist kaum messbar. Der Preis jedoch ist enorm: Für eine Million Token kostet der Input bei MiniMax 0,3 USD, bei Claude 5 USD – das ist ein Faktor von etwa 17.
Jhon wechselte, die Workflows liefen weiter, die Rechnung wurde um eine Größenordnung kleiner. Diese Migration findet weltweit parallel statt.
Chris Clark, COO von OpenRouter, sagt es klar: Der Grund, warum chinesische Open-Source-Modelle so viel Marktanteil gewinnen, liegt darin, dass sie in den von US-Entwicklern betriebenen Agentur-Workflows eine außergewöhnlich hohe Rolle spielen.
Um die Essenz der Token-Exporte zu verstehen, muss man die Kostenstruktur eines Tokens kennen.
Ein Token wirkt leicht, entspricht etwa 0,75 englischen Wörtern. Ein gewöhnliches Gespräch mit KI verbraucht nur wenige Tausend Token. Doch wenn diese Token in Billionen-Einheiten gestapelt werden, wird die physische Realität schwer greifbar.
Die Kosten für einen Token bestehen im Wesentlichen aus zwei Komponenten: Rechenleistung und Strom.
Rechenleistung ist die Abschreibung der GPUs. Für eine Nvidia H100, die etwa 30.000 USD kostet, entspricht die Lebensdauer bei Inferenzen den Abschreibungskosten pro Nutzung. Strom ist der Treibstoff für den Betrieb der Rechenzentren: Bei voller Auslastung verbraucht jede GPU etwa 700 Watt, plus Kühlung. Die Stromrechnung eines großen KI-Datenzentrums kann leicht mehrere Hundert Millionen Dollar pro Jahr betragen.
Stellen wir uns diesen physikalischen Prozess auf einer Karte vor:
Ein Entwickler in San Francisco sendet eine API-Anfrage. Die Daten reisen durch den transozeanischen Kabelstrang nach China, wo die GPU-Cluster arbeiten. Der Strom fließt vom chinesischen Netz zu den Chips, die Inferenzen laufen, und die Ergebnisse werden zurückgesendet. Der gesamte Vorgang dauert vielleicht nur eine oder zwei Sekunden.
Strom, der nie das chinesische Netz verlässt, wird durch Token grenzüberschreitend übertragen.
Hier liegt eine magische Eigenschaft: Token haben keine physische Form, brauchen keinen Zoll, werden nicht besteuert und tauchen in keiner offiziellen Handelsstatistik auf. China exportiert enorme Rechen- und Stromdienstleistungen, ist aber in den offiziellen Handelsdaten fast unsichtbar.
Token sind eine Derivatform von Strom, Token-Exporte sind im Grunde Strom-Exporte.
Das verdankt sich den niedrigen Strompreisen in China, die im Durchschnitt etwa 40 % günstiger sind als in den USA – ein physikalischer Kostenvorteil, den Wettbewerber leicht kopieren können.
Zudem verfügen chinesische KI-Modelle über algorithmische und „Involutions“-Vorteile.
DeepSeek V3 nutzt eine MoE-Architektur, bei der nur Teile der Parameter aktiviert werden. Tests zeigen, dass die Inferenzkosten etwa 36 % niedriger sind als bei GPT-4o. MiniMax M2.5 mit 229 Milliarden Parametern aktiviert nur 10 Milliarden.
Oben drauf: die „Involution“. Alibaba, ByteDance, Baidu, Tencent, MingYue AnMian, Zhizhuo, MiniMax… Mehrere Firmen auf derselben Spur kämpfen um Marktanteile. Die Preise sind längst unterhalb der Gewinnschwelle, Verluste sind Branchenstandard.
Ähnlich wie bei der chinesischen Fertigung, nutzt man Lieferketten- und Brancheninvolutions-Vorteile, um die Token-Preise massiv zu drücken.
Vor den Tokens gab es eine andere Form des Stromexports.
Um 2015 herum begannen die Betreiber der Kraftwerke in Sichuan, Yunnan und Xinjiang, ungewöhnliche Gäste zu empfangen.
Sie mieteten verlassene Fabriken, installierten unzählige Maschinen, liefen 24/7. Die Maschinen produzierten nichts, außer unaufhörlich eine mathematische Aufgabe zu lösen. Manchmal wurde daraus eine Bitcoin.
Dies war die erste Form des Stromexports: Billige Wasserkraft und Windenergie wurden durch Mining-Hardware in digitale Vermögenswerte umgewandelt, die weltweit gehandelt wurden. Über Börsen wurden sie in Dollar umgetauscht.
Der Strom selbst passierte keine Grenzen, doch sein Wert wurde durch Bitcoin in die globale Wirtschaft eingespeist.
In diesen Jahren dominierte China mit über 70 % der weltweiten Bitcoin-Mining-Leistung. Wasserkraft und Kohlekraft in China beteiligten sich auf diese indirekte Weise an einer globalen Kapitalumverteilung.
2021 endete das alles abrupt. Regulierungen kamen, Miner zerstreuten sich, die Rechenleistung wanderte nach Kasachstan, Texas und Kanada.
Doch die Logik blieb bestehen: Sie wartete nur auf eine neue Hülle. Mit dem Aufstieg von ChatGPT und den großen Modellen wurde aus den Minen plötzlich ein KI-Datenzentrum, die Mining-Hardware wurde zu Rechen-GPUs, die produzierten Bitcoins wurden zu Tokens. Das einzige, was gleich blieb, war der Strom.
Bitcoin-Export und Token-Export sind auf einer fundamentalen Ebene gleich, doch Token haben heute mehr kommerziellen Wert.
Mining ist reine Mathematik, die produzierten Bitcoins sind Finanzwerte, deren Wert auf Knappheit und Marktakzeptanz beruht. Sie haben nichts mit „Rechenleistung“ im eigentlichen Sinne zu tun. Rechenleistung ist kein produktives Gut, sondern eher ein Vertrauensmechanismus.
Große Modelle hingegen liefern echte kognitive Dienste: Code, Analysen, Übersetzungen, Kreativität. Der Wert eines Tokens hängt direkt von seinem Nutzen für den Nutzer ab. Es ist eine tiefere Einbettung: Wenn Entwickler-Workflows von einem Modell abhängen, steigen die Wechselkosten mit der Zeit.
Ein weiterer wichtiger Unterschied: Bitcoin-Mining wurde aus China vertrieben, während Token-Exporte aktiv von globalen Entwicklern gewählt werden.
Die 1858 verlegte Unterseekabel repräsentierten die Souveränität Großbritanniens über die Hochgeschwindigkeits-Informationsautobahn. Wer die Infrastruktur besitzt, bestimmt die Spielregeln.
Token-Exporte sind ebenfalls ein Krieg ohne offizielle Kriegserklärung, mit erheblichen Widerständen.
Datensouveränität ist die erste Barriere: Ein API-Request eines US-Entwicklers, der durch chinesische Rechenzentren läuft, bedeutet, dass die Daten physisch durch China fließen. Für Einzelentwickler und kleine Anwendungen ist das kein Problem. Bei sensiblen Unternehmensdaten, Finanzinformationen oder staatlichen Anwendungen ist das eine harte Grenze. Deshalb ist die Durchdringung chinesischer Modelle bei Entwickler-Tools und persönlichen Anwendungen hoch, im Kernsystemen der Unternehmen kaum vorhanden.
Chips-Embargo ist die zweite Barriere: China steht Exportkontrollen für Nvidia-GPUs gegenüber. MoE-Architekturen und Algorithmus-Optimierungen können diese Schwäche nur teilweise ausgleichen. Das Limit bleibt bestehen.
Doch diese Hindernisse sind nur der Anfang. Größere Schlachten formen sich bereits.
Token und KI-Modelle sind zu einer neuen strategischen Dimension im US-chinesischen Machtkampf geworden – vergleichbar mit den Halbleitern, dem Internet im 20. Jahrhundert, oder noch älter: dem Weltraumrennen.
1957 schoss die Sowjetunion Sputnik ins All, die USA waren schockiert. Daraufhin starteten sie das Apollo-Programm, investierten Milliarden, um im Weltraum nicht zu verlieren.
Der KI-Kampf ist erstaunlich ähnlich, doch viel intensiver. Der Weltraum ist physisch, für den Durchschnittsmenschen kaum spürbar. KI durchdringt die Wirtschaft bis in die kleinsten Kapillaren: Jede Codezeile, jeder Vertrag, jedes Regierungssystem könnte eine große chinesische Modell-Instanz im Hintergrund haben. Wer das Modell zur Standard-Infrastruktur macht, gewinnt eine strukturelle Macht im globalen digitalen Ökosystem.
Genau das macht Chinas Token-Export für Washington so bedrohlich.
Wenn Entwickler ihre Code-Repositories, Agenten-Workflows und Produktlogik um ein chinesisches Modell-API herum aufbauen, steigen die Migrationskosten exponentiell. Selbst wenn die USA Gesetze erlassen, um das zu verhindern, werden Entwickler mit den Füßen abstimmen – so wie heute kein Programmierer GitHub aufgeben kann.
Der Token-Export ist vielleicht nur der Anfang eines langen Spiels. Chinesische Großmodelle haben nichts angekündigt, um die Welt zu revolutionieren. Sie liefern einfach günstiger Dienste an jeden Entwickler mit API-Key.
Dieses Mal verlegen die Teams in Hangzhou, Peking, Shanghai die Kabel, die in Südchina Tag und Nacht die GPU-Cluster betreiben.
Der Kampf läuft unaufhörlich, 24 Stunden am Tag, in Token gemessen, auf den Endgeräten jedes Entwicklers.