黄仁勋GTC华盛顿主题演讲：加速计算与AI的下一个“阿波罗时刻”

在美国首都华盛顿特区举行的NVIDIA GTC大会上，NVIDIA创始人兼首席执行官黄仁勋发表了主题演讲，全面阐述了加速计算和人工智能（AI）如何共同推动人类文明进入一个全新的工业革命时代。他将这一跨越称为“美国的下一个阿波罗时刻”，强调这是一场涉及国家安全、经济命脉和科学前沿的全面竞争。

一、创新的历史回顾与平台转换的到来

黄仁勋首先回顾了美国历史上由技术驱动的几次重大飞跃，包括贝尔实验室的晶体管、IBM的System/360、英特尔的微处理器，以及苹果将计算个人化和互联网带到用户手中。他指出，当前我们正处于计算史上一次革命性的新模型所开启的下一个伟大时代。

深刻洞察：通用计算的终结与加速计算的崛起

黄仁勋的核心观点是，计算模型正在发生根本性转变。他观察到，迪纳德缩放（Dinard scaling）已在大约十年前停止，摩尔定律受到物理定律的限制，性能和功耗的增长已大幅放缓。

为了解决通用计算机（CPU）无法解决的问题，NVIDIA发明了加速计算这一新的计算模型。通过增加利用更多晶体管的处理器，并应用并行计算，加速计算能够极大扩展传统顺序处理CPU的计算能力。

这一转变的关键在于：

CUDA编程模型： GPU至关重要，但没有像CUDA这样的编程模型及其跨世代兼容性，开发者就不会将加速计算作为目标平台。CUDA-X 库的宝藏： NVIDIA最大的财富并非GPU本身，而是其CUDA-X生态系统，其中包含350种不同的库，每一个都针对加速计算重塑了算法，并为新的市场打开了大门。这些库涵盖计算光刻（cuLitho）、稀疏求解器、到全球领先的医学成像AI框架Monai等众多领域。

二、 AI基础设施的革命性突破

AI革命的本质是新的工业革命。黄仁勋将AI比作电力和互联网，认为它是所有公司都将使用、所有国家都将建立的基本基础设施。

1. 电信领域：6G与NVIDIA Arc

电信业是国民经济和安全的支柱。黄仁勋指出，全球无线技术当前大多部署在外国技术之上，这种情况必须改变。

NVIDIA正在与全球第二大电信设备制造商**诺基亚（Nokia）**合作，在加速计算和AI的基础上，将美国置于下一代6G革命的中心。

NVIDIA Arc（Aerial Radio Network Computer）： 这是一个全新的产品线，由Grace CPU、Blackwell GPU和ConnectX Melanox网络技术构建而成。软件定义无线通信： Arc是首个软件定义的可编程计算机，能够同时进行无线通信和AI处理。AI for RAN & AI on RAN： AI for RAN用于提高频谱效率，通过AI实时调整波束成形等。AI on RAN则是在无线网络上实现边缘工业机器人云，将云计算带到基站所在的边缘。诺基亚将把NVIDIA Arc作为其未来基站，并将利用该技术升级全球数百万个现有Airscale基站至6G和AI能力。

2. 量子计算：混合系统的未来

量子计算的未来并非取代经典系统，而是融合在一起的加速量子超级计算平台。

NVQLink互联架构： 针对量子误差校正（QEC）的挑战，NVIDIA发布了NVQLink，它直接连接量子处理器（QPU）和NVIDIA GPU超级计算机。混合模拟与控制： NVQLink能够每秒移动数千次TB级数据，满足QEC所需的极低延迟，并使得QPU和GPU能够协同进行混合模拟、AI校准和控制。生态系统支持： 17家量子计算公司和几乎所有美国能源部（DOE）的国家实验室（包括Berkeley、Fermy Labs等）都已支持NVQLink和CUDAQ平台。

此外，美国能源部正与NVIDIA合作，建设七台新的AI超级计算机，以推进美国的科学发展。

三、 AI工厂：从工具到工人

黄仁勋对AI的定义远超聊天机器人。他提出了关于AI的深刻洞察：

1. 软件的重塑：AI是“工作”而非“工具”

过去，软件行业创造的是工具（如Excel、Word、数据库），用户需要亲自使用这些工具。

而AI的深刻区别在于：AI是“工作”。AI系统是能够使用工具的**“工人”**（Workers）。例如，Perplexity使用网页浏览器进行预订或购物，它是一个使用工具的AI；NVIDIA内部使用的Cursor是一个AI代理系统，它使用VS Code这一工具来生成代码。

AI作为工人，首次解决了全球经济中工具（约一万亿美元IT工具）之下更庞大的一百万亿美元的全球经济领域。在劳动力短缺的背景下，增强劳动力（Augment labor）的AI将帮助经济增长。

2. AI工厂与双指数增长

AI需要一个持续生成“代币”（Tokens）的工厂。代币是AI的计算单元或词汇，可以是对语言、图像、3D结构、化学品乃至机器人行为和动作的标记。

AI工厂的定义： 这是一个与过去数据中心完全不同的系统。它基本上只运行一件事：AI。其目的在于以极快的速度、极低的成本生成有价值的代币。三大扩展定律（Three Scaling Laws）： AI需要巨大的计算资源，因为学习过程分为三个阶段，且计算需求呈指数级增长。
预训练（Pre-training）： 学习基本智能技能，是智能的“学前班”。后训练（Post-training）： 学习解决问题的技能，如推理和编程。思考（Thinking/Inference）： 不断根据新知识进行研究和思考，这给基础设施带来了巨大的计算负荷。 AI的良性循环（Virtuous Cycle）： 更聪明的模型需要更多计算，而更聪明的模型被更多人使用。当AI模型变得足够好，值得付费时（如Cursor、Claude、OpenAI），就形成了**“双指数增长”**的压力：计算需求的指数增长，加上用户使用的指数增长。

四、极致协同设计与Blackwell架构

面对两大指数级增长的计算需求，但摩尔定律已达极限，唯一的解决方案是极致协同设计（Extreme Co-design）。

NVIDIA能够从零开始，同时设计新的架构、芯片、系统、软件、模型和应用。

1. Grace Blackwell NVL72系统

Grace Blackwell NVL72（GB200）是NVIDIA有史以来最极端的协同设计计算机。

性能飞跃： GB200/Vera Rubin相比上一代H200 GPU，单GPU性能提升了10倍。这种提升并非来自简单地增加晶体管，而是基于对未来AI模型本质的理解和对整个计算堆栈的重新架构。成本效益： GB200 NVL72系统生成代币的成本是世界上最低的。它在提供惊人性能的同时，实现了10倍的成本降低，从而保证了AI良性循环的持续运转。制造与供应链： 市场对Blackwell的需求异常强劲。NVIDIA在亚利桑那州、印第安纳州和德克萨斯州全面投产Blackwell，宣布**“Blackwell：美国制造，服务世界”**，这标志着美国在AI时代的再工业化。

2. Vera Rubin的未来与AI工厂的运营

黄仁勋展示了下一代系统Vera Rubin。

全机柜规模计算机： Rubin是NVIDIA第三代NVLink 72机柜规模计算机，100%液冷，完全无电缆设计。单个Vera Rubin机柜的性能是九年前交付给OpenAI的DGX-1的100倍。上下文处理： Vera Rubin计算托盘新增了上下文处理器（Context Processor），专用于处理日益增长的上下文需求，如阅读大量PDF和视频后回答问题。网络带宽： Rubin的NVLink交换机和Spectrum X以太网交换机的带宽，已达到全球互联网峰值流量的数倍。

3. Omniverse DSX：AI工厂的数字孪生

NVIDIA正从设计芯片、系统发展到设计整个AI工厂。

Omniverse DSX是构建和运营吉瓦级AI工厂的蓝图。它在数字孪生中实现建筑、电力和冷却系统与NVIDIA AI基础设施的协同设计。在物理工厂建成之前，工程师就可以在Omniverse中规划、优化、并使用AI代理（AI agents）进行运营优化。

五、 AI在各行业的部署与应用

AI的影响是普遍的。NVIDIA通过其生态系统和模型，将AI能力带入了广阔的企业市场和物理世界。

1. 开源模型与企业合作

开源模型的领导地位： 由于推理能力、多模态和蒸馏技术的进步，开源模型已变得极其有用。NVIDIA致力于引领开源贡献，在排行榜上拥有23个模型，支持研究人员、初创企业和公司的需求。企业级合作： NVIDIA堆栈已被集成到全球所有主要云服务提供商（CSP，如AWS、Google Cloud、Azure、Oracle）以及软件即服务（SaaS）公司中。
NVIDIA正与ServiceNow和SAP合作，将AI库集成到它们的企业工作流和商务系统中。网络安全： NVIDIA与CrowdStrike合作，将网络安全AI代理的响应速度提升至光速。数据处理与国家安全： 与Palantir合作，加速其Ontology平台的数据处理和洞察发现，服务于政府和企业。

2. 物理AI与机器人技术

物理AI（Physical AI）需要三台计算机协同工作：训练计算机（GB200）、模拟计算机（Omniverse）和机器人计算机（Jetson Thor）。

机器人工厂与再工业化： 美国正在进行再工业化。NVIDIA与**富士康（Foxconn）**合作，在Omniverse中建立了一个“数字原生”的机器人设施。工厂本身就是一个机器人，协调机器人去制造具有机器人性质的产品。人形机器人与消费者电子： 人形机器人是未来最大的消费者电子产品市场之一。NVIDIA正与Figure和Agility等公司合作。
黄仁勋特别展示了与迪士尼合作开发的基于Newton模拟平台的可爱机器人“Blue”，强调这并非动画，而是在Omniverse中进行的实时模拟。 自动驾驶与出行： Robo-Taxi已达到拐点。
Drive Hyperion： NVIDIA推出了Drive Hyperion架构，使所有汽车公司都能制造具备最高安全等级的Robo-Taxi就绪车辆。Uber合作： NVIDIA正与Uber合作，将Drive Hyperion汽车连接到全球网络，共同部署全球的Robo-Taxi生态系统。