我注意到一件非常重要的事情:对人工智能的真正战争并不围绕芯片本身,而是围绕一个更深层次的东西,叫做CUDA。这个由英伟达主导的系统已经占据了全球90%的开发者份额,并让所有人都被它的生态所“绑架”。



但在最近几年,我们看到了根本性的转变。中国公司并没有选择正面硬刚,而是走了一条完全不同的路:在算法上掀起革命。自2024年底到2025年,中国企业集体转向混合专家(Mixture of Experts)模型——一个简单但强大的思路:把庞大的模型拆成小型专家,只启用真正需要的那部分。

DeepSeek V3就是非常清晰的例子:6710亿参数,但只激活其中的370亿。成本?560万美元,而GPT-4的成本为7800万美元。算法差异直接反映在价格上——比Claude便宜25到75倍。

结果令人震惊:到2026年2月,使用中国模型的OpenRouter在短短三周内增长了127%,首次超过了美国。从一年内从2%跃升到60%。

但真正的问题在于训练,而不是推理。于是又出现了第二个解决方案:本地芯片。2025年,中国推出了完整的本地生产线,使用Loongson处理器和Taichu AI卡。仅过了几个月,真正的大规模模型就开始在这些芯片上进行训练。到2026年1月,智谱AI推出了首个完全在本地中国芯片上训练的先进图像模型。

这是一种质变:从“推理能力”转向“训练能力”。差距巨大。

现在,面对美国真正的电力危机——数据中心消耗4%的电力,预计到2030年可能达到12%——中国拥有强大的能源优势:其电力产量是美国的2.5倍,工业用电成本比美国低4到5倍。

如今从中国走出去的,不是产品或工厂,而是Tokens——人工智能模型处理的最小计算单元。这些Tokens在中国的算力工厂中生成,然后通过电缆传向世界。

DeepSeek目前支持37种语言,拥有26,000家全球公司账户;58%的新成立初创公司已经采用了它。在中国本土:市场份额高达89%。

这让我想起四十年前中国和日本之间的半导体之战。但这一次,中国正在构建一个完整、独立的生态系统——这是日本从未做到的。从优化过的算法,到本地芯片,再到Ascend系统中400万开发者,以及面向全球的服务分发。

代价很高——本土企业为搭建这个体系正在亏损数十亿美元。但这不是经营层面的亏损,而是必要的战争税。

形势已经改变:八年前我们问的是“我们还能撑得住吗?”。今天问题变成了“为了继续活下去,我们需要付出多少代价?”。而答案本身,就是一种进步。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论