一切为Agent让路:英伟达Vera Rubin架构与万亿生态野心

行业洞察 · 实践沉淀 · 持续进化

一切为Agent让路:英伟达Vera Rubin架构与万亿生态野心

2026-03-17 01:19
lianghaoze

英伟达GTC 2026大会,黄仁勋的演讲主题只有一个——Agent。从芯片到模型,从英伟达版龙虾到数据中心,一切都要为Agent让路。全新发布的Vera Rubin架构,包含七款芯片、五套机架系统以及一台AI Agent超级计算机,宣告Agentic AI时代的正式开启。到2027年底,Blackwell和Rubin芯片将至少创造1万亿美元收入。英伟达正在构建从硬件到软件、从算力到生态的完整体系,牢牢掌握智能体时代的命脉。

Vera Rubin架构:开启Agentic AI时代

Vera Rubin架构:开启Agentic AI时代

Vera Rubin架构:开启Agentic AI时代

如果说Hopper架构开启了生成式AI时代,让机器学会说话,那么Vera Rubin的使命就是开启智能体时代,让机器学会干活。Vera Rubin架构包含七款芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机,以及新集成的Groq 3 LPU。五套机架系统分别是Vera Rubin NVL72机架、Vera CPU机架、Groq 3 LPX机架、BlueField-4 STX存储机架,以及Spectrum-6 SPX以太网机架。Agent不仅要调用大模型思考,还要疯狂调用工具,对操作延迟的容忍度极低。为应对这种捶打,英伟达推出Vera CPU,这是世界上首款专为智能体AI和强化学习时代打造的处理器,效率是传统机架式CPU的两倍,速度提升50%。Rubin GPU单片芯片直接塞进288 GB海量内存,专门装载超大语言模型和成千上百万的上下文KV缓存。NVLink带宽翻倍至260 TB/s,Kyber机架在一个NVLink域内直接打通144张GPU,实现极致互联。

OpenClaw生态:每家SaaS公司都将变成AgaaS

OpenClaw生态:每家SaaS公司都将变成AgaaS

OpenClaw生态:每家SaaS公司都将变成AgaaS

黄仁勋抛出判断:OpenClaw将比肩这个时代的Linux和HTML。上线仅数周,其下载量和影响力已超过Linux三十年的积累。本质上,这是一套智能体操作系统,能调用大模型、管理文件、拆解任务、协调子智能体,还能发邮件、发短信,以任何模态与人沟通。在黄仁勋看来,每一家SaaS公司迟早都会变成AgaaS公司,也就是智能体即服务公司。每位CEO现在都必须回答同一个问题:你的OpenClaw战略是什么?开源意味着自由,但企业更需要安全。为此,英伟达联合OpenClaw创始人团队,推出NeMoClaw参考架构,内置OpenShell技术、网络防护机制和隐私路由能力,让企业可以在私有环境中安全运行智能体系统。支撑这套智能体生态的,是英伟达一整条开源模型产品线:Nemotron主攻语言推理,Cosmos聚焦世界建模,Groot面向通用机器人,Alpha Mayo服务自动驾驶,BioNeMo深耕数字生物学,Earth-2专注AI物理仿真。这些模型全部以基础模型形式开放,企业可在此基础上微调和后训练,打造专属定制化智能。

算力革命:从GeForce到AI工厂的25年布局

算力革命:从GeForce到AI工厂的25年布局

算力革命:从GeForce到AI工厂的25年布局

要理解英伟达今天的统治力,需将时钟拨回25年前。黄仁勋直言,GeForce是英伟达有史以来最伟大的营销活动,用来吸引未来客户。通过游戏显卡潜伏进我们的电脑,日复一日,年复一年。正是依靠一代代游戏玩家的供养,英伟达20年前做出疯狂决定——研发CUDA并将其送到全世界开发者的桌面。连续13代架构,长达20年的死磕,CUDA变成装机量过亿的庞然大物。当深度学习宇宙大爆炸来临时,除英伟达GPU外别无他选。飞轮一旦转动就停不下来。在这个飞轮里,硬件只是载体,真正黏住开发者的是成千上万个工具、框架和开源项目。黄仁勋甩出DLSS 5,用AI重新发明计算机图形学,将结构化数据与生成式AI融合,既不会出现AI幻觉错位,又拥有近乎现实的惊人质感。这种逻辑将在每个行业里一遍遍重演。在演讲高潮,黄仁勋放出一张极其复杂的架构图,揭示了英伟达要吞噬的真正猎物——全球企业的数据中心。针对结构化数据,英伟达推出cuDF,用GPU恐怖并行算力把数据处理速度拉爆;针对非结构化数据,推出cuVS。两个工具库效果明显,雀巢公司换上英伟达加速后,速度飙升5倍,成本骤降83%。英伟达将自己的算法库深度嵌入每一家云端,客户为了用算力和框架,才会购买云服务。Google Cloud、AWS、微软Azure、Oracle都得排队把英伟达的服务请进自己的机房。

万亿收入目标:一切都要为Agent让路

万亿收入目标:一切都要为Agent让路

万亿收入目标:一切都要为Agent让路

根据黄仁勋判断,到2027年底,Blackwell和Rubin芯片将至少创造1万亿美元收入,而且还是保守估计。这个数字来自AI推理这个最重要的事。高难度推理是AI领域最难的事,也最重要,因为它直接带来收入增长。英伟达在Hopper架构巅峰期改变架构,打造NVLink 72,引入NVFP4精度格式,配合Dynamo、TensorRT-LLM及全套新算法,专门建造超级计算机优化整套技术栈。结果远超预期,Grace Blackwell NVLink 72每瓦性能提升35至50倍。性能提升后,摆面前的是另一个问题:一座1吉瓦数据中心,按15年摊销,建造成本就高达400亿美元,设备还没放进去。在这样的投入规模下,计算系统必须是全球最好的。英伟达发布NVIDIA DSX平台,基于Omniverse数字孪生技术,让工程师在真正动工之前,先在虚拟空间把整座AI工厂仿真一遍。配合Max-Q技术,系统可在功耗与算力之间实时动态调节。这里面至少还藏着两倍优化空间。同一套硬件,英伟达更新算法与软件后,Fireworks等服务商的Token生成速度从每秒700个跃升至接近5000个,提升7倍。这就是极致协同设计的真实含义。过去数据中心存放文件,现在它生产Token。土地、电力、机房空间决定了工厂上限,架构优劣决定了产出多少。更重要的是,地球上的AI工厂还没建完,英伟达已把目光投向太空。英伟达Thor芯片已通过抗辐射认证,率先应用于卫星之上,正与合作伙伴联合研发NVIDIA Space-1 Vera Rubin新型计算机,目标直接在太空中建设数据中心。在自动驾驶领域,RoboTaxi Ready新增比亚迪、吉利、五十铃、日产四位伙伴,四家车企年合计生产约1800万辆汽车,与Uber合作将车辆部署至多个城市并接入全球出行网络。在工业机器人领域,与ABB、Universal Robots、库卡等头部企业展开合作,将物理AI模型集成至仿真系统,推动机器人大规模进入制造产线。迪士尼雪宝机器人现身海外游乐园,肚子里装着英伟达Jetson计算机,动作全部在Omniverse虚拟环境中完成训练。未来的迪士尼乐园所有角色都将拥有真正的智能,在园区里自由走动,与游客展开真实互动。英伟达用20年造了一台造风机,如今这台机器已化身为永不停歇的Token生产厂。在这个工厂里,算力即权力,生态即壁垒。英伟达不仅既做庄家又做玩家,它甚至要把牌桌都买下来了。

感谢您的阅读

欢迎与我们探讨更多行业落地方式,共同推动技术创新与实践。