

【导读】
「英伟达下一次进化是数字孪生?」

一年一度的GTC大会又来了,英伟达还能带来怎样的惊喜?

这次没有在厨房,而是完全搬到了虚拟空间,黄仁勋一口气发布了多款软硬件产品,全新的GPU架构Nvidia Hopper、首款Hopper产品H100、人工智能软件开发套件 AI Enterprise、RIVA等。
英伟达不再是一个单纯的显卡生产商,而是全面的软硬件计算公司,正在抢占AI及元宇宙的先机。

全新Hopper GPU架构,AI性能提升6倍
对于人工智能训练,H100将提供4 petaflops的性能,比目前的明星产品A100(GPU)还要高6倍,其他精度范围的计算提供三倍以上的性能提升,包括一些 HPC 应用所需的双精度。H100将是 HBM3(高带宽内存)内存的首款产品,其内存带宽将达到惊人的每秒3Tb。

H100采用Hopper架构,该架构以计算机科学家先驱Grace Hopper命名。

Grace·Hopper,美国海军准将及计算机科学家,世界最早一批的程序员之一,她是Harvard Mark I上第一个专职程序员,创造了现代第一个编译器A-0 系统,以及第一个高级商用计算机程序语言“COBOL”,被誉为“COBOL 之母”。
H100 GPU 在单芯片上具有800亿个晶体管,采用台积电的4纳米工艺制造,还包括一个新的变压器(Transformer)引擎,旨在加速变压器建模和推理速度,它的第四代 NVLink 使 PCIe 的性能比以前的版本提高了7倍,并允许它与服务器外的系统一起工作。
Hopper也是世界上第一个机密计算 GPU,这项技术以前只能在 CPU中使用,机密计算可以对使用中的数据进行加密,以防止数据泄露。
Hopper还采用了下一代多实例 GPU 技术,这种技术最初是与 Ampere 一起引入的,目的是将一个 GPU 细分并分离成多个实例,同时还采用了新的指令来加速动态编程,将复杂问题分解成更简单的子问题,让Hopper在 AI 和其他高级工作负载方面的性能得到了显著提升。
新加入了DPX 指令,可加速动态规划,适用于包括路径优化、基因组学在内的一系列算法,与 CPU 和上一代 GPU 相比,速度提升分别可达 40 倍和 7 倍。
此外,英伟达还基于霍普架构,打造了全新的计算平台DGX H100。

一个 DGX H100系统将提供32petaflops 的计算性能,这是前一个 DGX A100的六倍。通过使用 NVLink,企业可以创建一个32节点的 DGX Superpod,其 AI 性能达到每秒1亿次浮点运算,带宽为每秒70tb,比 DGX A100 Superpod 高11倍。
继续叠加DGX,老黄还推发布了 Nvidia EOS超级计算机,由18台 DGX H100 Superpods 组成,包括4600个 H100 GPU、360个 NVLink 交换机和500个 Quantum-2 InfiniBand 交换机,运行速度为18 exaflops。
EOS 将为用户提供多租户隔离以及性能隔离,以确保应用程序之间不会相互打架,可以看出英伟达为数据中心及云计算场景做出了必定的倾斜。

目前的主流服务器在提供给GPU 的数据量方面受限,高带宽的情况会使 CPU 和系统内存超负荷,H100 CNX 结合了 ConnectX-7 NIC (网络接口卡)结合成一个单一模块,可以通过 PCIe 连接到中央处理器上,数据可以完全绕过 CPU 瓶颈直接到GPU。
Hopper 平台还将为 NVidia 去年推出的 Grace CPU 提供电源。Grace CPU 超级芯片是 Nvidia 的第一款基于 Arm 的 CPU,基于 Arm neoverse 的分立式数据中心 CPU,专为人工智能基础设施和高性能计算而设计。
不断拓展的CPU及数据中心业务,对这些领域的传统芯片厂商来说,也是不小的压力。性能这么强悍,不断整合各种算力和软件生态,英伟达下一步想干什么?

下一次进化: 虚拟世界的万能宇宙
半个世纪前,阿波罗13号登月任务遇到了麻烦,为了拯救宇航员,美国宇航局的工程师们制作了一个返回地球的宇航员舱模型,以解决这个问题。黄仁勋说,这就是数字孪生。
扩展到大规模,数字孪生将是一个虚拟世界,连接数字和现实,「在互联网的背景下,数字孪生就是下一个进化方向」。

NVIDIA Omniverse 可以建立数字孪生,和新的数据中心 NVIDIA OVX 系统一起,将成为行动导向的人工智能基石。
Omniverse 是英伟达机器人平台的核心,就像美国宇航局和亚马逊一样,许多大公司开始意识到数字孪生和 Omniverse 的重大性。

OVX 将运行 Omniverse 数字孪生进行大规模模拟,让多个自治系统在一样的时空中运行。NVIDIA还配备了spectrum-4高性能数据网络基础设施平台,以保证OVX 主干网的高效通信。
NVIDIA spectrum-4是世界上第一个400gbps 的端到端网络平台,包括 spectrum-4交换机系列、 NVIDIA ConnectX-7 SmartNIC、 NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 数据中心基础设施软件组成。
为了让更多的用户可以使用 Omniverse,英伟达还发布了 Omniverse Cloud,只需点击几下鼠标,就可以通过云端的 Omniverse 连接进入元宇宙。

除了大的数字孪生、元宇宙,黄仁勋认为人工智能的下一波浪潮将是机器人和自动驾驶汽车。未来的机器人能够自主地进行设计、计划等一系列的活动。
NVIDIA Avatar、 DRIVE、 Metropolis、 Isaac 和 Holoscan 是围绕英伟达计算平台建立的端对端的机器人平台: 地面真实数据生成、人工智能模型训练、机器人堆栈和 Omniverse 数字孪生。
最后,黄仁勋将整个AI行业的演进总结为五个过程,百万倍的计算速度加成、变压器AI、数据中心变成人工智能工厂,机器人系统需求呈指数增长,下一代人工智能及数字孪生。

三大人工智能套件,普通开发者也能端到端
为了加速下一代人工智能的到来,英伟达还对其人工智能软件系统做了全面的更新。
目前许多硬件公司为了加速用户的开发,都推出了相应的开源开发套件,英伟达也不例外。Nvidia AI 加速器计划,可以协助生态系统合作伙伴构建稳定可靠的端到端深度学习模型,在其AI 平台上构建和交付优化后的应用程序,大大缩短开发时间。
Nvidia AI Enterprise 是一个软件套件,即使公司没有人工智能的专业知识,利用平台提供的开源容器和框架,就能搭建起AI应用。

通过 Nvidia AI Enterprise 2.0的认证,该软件可以在 Azure、VMware 和 Red Hat 等公共数据中心平台上运行,也包括虚拟化环境、现代云本地工作负载而设计的环境,可以说适应性超级强,用户只需要关注业务流程本身,而无需在技术构建上花费过多精力。

哪怕是只支持 CPU 的系统也可以使用Enterprise的套件,任何规模的组织都可以使用英伟达的AI能力、工具和支持,这样企业就可以专注于 AI 创造业务价值,而不是管理基础设施。
第二个是提高了 Nvidia RIVA,该公司的加速语音软件开发工具包,新版本 Nvidia RIVA 2.0现已上市,提供了七种语言的自动语音识别、类似人的文本到语音的专业男性和女性声音,以及用 Nvidia Tao 工具箱进行定制化的微调,让开发语音类的智能应用触手可及。

第三个是 Invidia Merlin 1.0,一个加速端到端的数据科学和机器学习工程师推荐框架,以协助工程师快速建立,优化和部署高性能的大规模推荐系统。
人工智能将成为虚拟世界构建的重大工具,让我们共同期待!















暂无评论内容