万亿Token战争:中国AI新贵的千亿市值之路

行业洞察 · 实践沉淀 · 持续进化

万亿Token战争:中国AI新贵的千亿市值之路

2026-03-20 01:23
lianghaoze

4.69万亿Token,这个数字本身就具有强烈的冲击力。根据行业通用换算标准,这相当于3.52万亿个汉字,如果将120万字的《战争与和平》从头到尾翻阅,需要293万遍。一个普通人类哪怕每天苦读8小时,也需要耗费近6.6万年才能读完。但在2026年3月第二周,中国AI大模型MiniMax M2.5、阶跃星辰Step 3.5 Flash、DeepSeek V3.2和Kimi K2.5,一周的Token调用量就达到了4.69万亿。这一数据标志着中国AI大模型的周调用量连续两周超越美国,前者调用量上升至4.69万亿Token,后者下滑至3.294万亿Token。Token的吞吐和燃烧,换来了千亿市值。

从实习生到千亿富豪:闫俊杰的逆袭之路

从实习生到千亿富豪:闫俊杰的逆袭之路

从实习生到千亿富豪:闫俊杰的逆袭之路

2014年夏天,百度校园官方账号发布了一条微博:"现在进行答辩的是来自中科院自动化所的闫俊杰同学,他的研究方向是人脸检测与识别。"那年,25岁的闫俊杰进入百度AI研究院实习。实习结束后,他进入商汤科技。这一期间,大模型技术路线已经确立,2017年谷歌团队发表论文《Attention is All You Need》,提出Transformer架构,最终成为大语言模型的核心基础。

2021年,闫俊杰已是商汤科技的副总裁。那是"AI 1.0"时代的末期,摆在明面上的困境是——人脸识别和计算机视觉模型只能在安防闸机或打卡系统里赚取微薄的定制化辛苦钱,商业模式重如泰山。闫俊杰是行业内较早一批觉醒的叛逆者。那时"生成"的概念已有雏形,生成式AI的概念在海外已初露锋芒,少数人逐渐意识到通向AGI的密码,或许不是精雕细琢的小作坊算法,而是大道至简的"暴力美学"——Scaling Law。

逻辑简单粗暴:只要把足够多的算力、足够庞大的数据,塞进那个被称为Transformer的黑盒子里,喂给它足够大的参数,让它日复一日地拼命预测下一个Token,传说中的"智能涌现",就会发生。2021年12月,当时还在商汤的闫俊杰看到了AIGC的技术前景,毅然离职创业,创立了MiniMax。事实证明,闫俊杰出来的时机刚好。一年后的2022年11月,ChatGPT发布,验证了"大算力+大数据=涌现能力"的Scaling Law。

在经历了AI的多轮洗牌后,智谱和MiniMax先后上市。2026年1月8日,智谱在香港联合交易所挂牌上市,成为"全球大模型第一股"。一天后,1月9日,成立四年的MiniMax,正式在香港联交所主板上市,刷新了AI领域公司最快的上市纪录。受益于OpenClaw引发的"养虾"热,2026年3月10日港股收盘,上市未满3个月的MiniMax单日大涨22.37%,总市值达3826.35亿港元,首次超越百度,后者当时市值为3322亿港元。根据估算,按MiniMax当时的市值3826亿港元计算,闫俊杰身家为970亿港元。

OpenClaw:从问答到做事的革命性转变

OpenClaw:从问答到做事的革命性转变

OpenClaw:从问答到做事的革命性转变

2025年末,一个奥地利开发者Peter Steinberger的"周末项目"Clawdbot(后改名OpenClaw)悄然上线。没人预料到,这个项目会在短短60天内斩获超过25万GitHub Star,成为AI历史上增长最快的开源项目。如果说ChatGPT是"你问我答",OpenClaw则是"你说我做"。OpenClaw不只是聊天机器人,而是一个自主执行任务的智能体——和过去产品的最大差异也在这里。

这种从"问答"升级为"做事"的直观体验,瞬间掀起了一股"龙虾热"。国外,OpenAI以收购OpenClaw创始人的方式直接入局;Anthropic收购Vercept强化Computer Use。国内,大众掀起"养虾风潮",各大相关企业先后宣布进入。行业瞬间形成了一个共识:ChatGPT等GenAI产品是AI的"后端",而OpenClaw所代表的Agent才是AI的"前端"。

但在这样的架构和模式下,Token调用量就会指数级增加。OpenRouter周度数据显示,该周内Token调用量前三的模型均为中国大模型,分别为MiniMax M2.5、阶跃星辰Step 3.5 Flash和DeepSeek V3.2。其中,MiniMax M2.5周调用量为1.75万亿Token;阶跃星辰Step 3.5 Flash周调用量为1.34万亿Token;DeepSeek V3.2周调用量为1.04万亿Token。当千千万万个像"代账Agent""程序员Agent""客服Agent"被部署在企业的服务器和个人的电脑上时,大模型的计费接口就像一台台转速拉满的印钞机。或许正是看到了这条从"人类受限"跨越到"机器无限"的指数级变现路径,市场才给出了数百倍的市销率。

模型路由:Token经济的隐秘战场

模型路由:Token经济的隐秘战场

模型路由:Token经济的隐秘战场

3月11日,Hunter Alpha悄然上线OpenRouter,标注为"stealth provider",没有任何厂商标识。由于知识截止时间为2025年5月,与DeepSeek模型相近,且推理风格相似,开发者社区一度猜测这是"DeepSeek V4"的早期测试版本。OpenRouter平台介绍,Hunter Alpha是一个1万亿参数+100万Token上下文前沿智能模型,专为代理使用而构建。3月19日凌晨,谜底揭晓:小米认领了Hunter Alpha,证实其为旗舰模型MiMo-V2-Pro的内部测试版本。小米MiMo大模型负责人罗福莉发文称,这是一次"悄无声息的伏击":从聊天模式到智能代理模式的转变发生得太快,连我们自己都难以置信。

这里需要引入一个概念:模型路由。模型路由是一种动态分发机制,充当用户请求与各类大模型之间的"调度指挥官"。简单理解,就是"杀鸡焉用牛刀"。假如Agent是在后台疯狂干活的"数字员工",那么模型路由就像一个"超级包工头"或"项目经理"。当用户或Agent系统发出一个任务请求时,路由系统会瞬间评估这个任务的难度,然后将其分配给"性价比最高、最合适"的大模型去执行。

比如,一个简单的任务,从PDF中提取数据生成报表。这个"项目经理"就会把这个任务派给"实习生",类似一些免费或极度便宜的百亿参数开源小模型。但面对一个相对复杂的任务时,这个"项目经理"会把任务派给垂直专家,类似一个较贵的千亿或万亿参数旗舰大模型。在OpenClaw这样的Agent框架中,一个看似简单的操作,比如自动订机票,在后台就会被拆解成几十个步骤的"思考-执行"循环。如果不加干预,连最简单的任务也用顶级模型去跑,成本会迅速失控。模型路由让每一分算力都用在刀刃上。但硬币的另一面是:当所有模型都可以被路由系统无缝调度,AI企业的定价权和利润空间就会被挤压。

Token成为大宗商品:定价权的最终归宿

Token成为大宗商品:定价权的最终归宿

Token成为大宗商品:定价权的最终归宿

当Token成为硬通货,巨头也开始围绕它重构组织。3月16日,阿里巴巴正式成立Alibaba Token Hub(ATH)事业群,建立以"创造Token、输送Token、应用Token"为核心目标的新组织,由阿里巴巴CEO吴泳铭直接负责。这个Alibaba Token Hub,包括了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,覆盖从基础模型研发、模型服务平台,到个人与企业端AI应用的完整布局。吴泳铭在内部信中表示:"当下正处于AGI爆发前夜。大量数字化工作将由数以百亿计的AI Agent来支撑,而这些AI Agent将由模型产生的Token支撑运行,成为人类与数字世界交互的主要载体。"

当地时间2026年3月16日,英伟达GTC大会上,黄仁勋将Token与大宗商品直接挂钩,表示推理的拐点已经到来,Token将成最值钱的大宗商品。大宗商品的特点是什么?高度同质化与可互换性,价格由市场供需决定而非生产者,低毛利率与规模驱动,以及需求刚性但缺乏客户忠诚度。而这些还是市场可预判的、静态的那一面。

我们正在经历的这场AI浪潮,是绝对的"无人区",无论是砸入的真金白银,还是已见到的生活和工作中的细枝末节。当Token已成为大宗商品时,我们做一个极致的假设——某一天,Token就像现在的手机流量一样,无处不在、极度廉价、按量计费。那时候,MiniMax们会是如何?它们可能成了"智能操作系统",模型本身成了所有应用的中枢,开发者基于MiniMax们的模型开发Agent、构建服务,用户为智能付费,而不是为Token付费。它们也可能成了"高级管道",Token越来越标准化,云厂商掌握了定价权。变量是什么?Token的定价权在谁手里?用户忠诚的到底是什么?

感谢您的阅读

欢迎与我们探讨更多行业落地方式,共同推动技术创新与实践。