4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

导读

「英伟达下一次进化是数字孪生?」

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

一年一度的GTC大会又来了,英伟达还能带来怎样的惊喜?

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

这次没有在厨房,而是完全搬到了虚拟空间,黄仁勋一口气发布了多款软硬件产品,全新的GPU架构Nvidia Hopper、首款Hopper产品H100、人工智能软件开发套件 AI Enterprise、RIVA等。

英伟达不再是一个单纯的显卡生产商,而是全面的软硬件计算公司,正在抢占AI及元宇宙的先机。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

全新Hopper GPU架构,AI性能提升6倍

对于人工智能训练,H100将提供4 petaflops的性能,比目前的明星产品A100(GPU)还要高6倍,其他精度范围的计算提供三倍以上的性能提升,包括一些 HPC 应用所需的双精度。H100将是 HBM3(高带宽内存)内存的首款产品,其内存带宽将达到惊人的每秒3Tb。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

H100采用Hopper架构,该架构以计算机科学家先驱Grace Hopper命名。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

Grace·Hopper,美国海军准将及计算机科学家,世界最早一批的程序员之一,她是Harvard Mark I上第一个专职程序员,创造了现代第一个编译器A-0 系统,以及第一个高级商用计算机程序语言“COBOL”,被誉为“COBOL 之母”。

H100 GPU 在单芯片上具有800亿个晶体管,采用台积电的4纳米工艺制造,还包括一个新的变压器(Transformer)引擎,旨在加速变压器建模和推理速度,它的第四代 NVLink 使 PCIe 的性能比以前的版本提高了7倍,并允许它与服务器外的系统一起工作。

Hopper也是世界上第一个机密计算 GPU,这项技术以前只能在 CPU中使用,机密计算可以对使用中的数据进行加密,以防止数据泄露。

Hopper还采用了下一代多实例 GPU 技术,这种技术最初是与 Ampere 一起引入的,目的是将一个 GPU 细分并分离成多个实例,同时还采用了新的指令来加速动态编程,将复杂问题分解成更简单的子问题,让Hopper在 AI 和其他高级工作负载方面的性能得到了显著提升。

新加入了DPX 指令,可加速动态规划,适用于包括路径优化、基因组学在内的一系列算法,与 CPU 和上一代 GPU 相比,速度提升分别可达 40 倍和 7 倍。

此外,英伟达还基于霍普架构,打造了全新的计算平台DGX H100

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

一个 DGX H100系统将提供32petaflops 的计算性能,这是前一个 DGX A100的六倍。通过使用 NVLink,企业可以创建一个32节点的 DGX Superpod,其 AI 性能达到每秒1亿次浮点运算,带宽为每秒70tb,比 DGX A100 Superpod 高11倍。

继续叠加DGX,老黄还推发布了 Nvidia EOS超级计算机,由18台 DGX H100 Superpods 组成,包括4600个 H100 GPU、360个 NVLink 交换机和500个 Quantum-2 InfiniBand 交换机,运行速度为18 exaflops。

EOS 将为用户提供多租户隔离以及性能隔离,以确保应用程序之间不会相互打架,可以看出英伟达为数据中心及云计算场景做出了必定的倾斜。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

目前的主流服务器在提供给GPU 的数据量方面受限,高带宽的情况会使 CPU 和系统内存超负荷,H100 CNX 结合了 ConnectX-7 NIC (网络接口卡)结合成一个单一模块,可以通过 PCIe 连接到中央处理器上,数据可以完全绕过 CPU 瓶颈直接到GPU。

Hopper 平台还将为 NVidia 去年推出的 Grace CPU 提供电源。Grace CPU 超级芯片是 Nvidia 的第一款基于 Arm 的 CPU,基于 Arm neoverse 的分立式数据中心 CPU,专为人工智能基础设施和高性能计算而设计。

不断拓展的CPU及数据中心业务,对这些领域的传统芯片厂商来说,也是不小的压力。性能这么强悍,不断整合各种算力和软件生态,英伟达下一步想干什么?

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

下一次进化: 虚拟世界的万能宇宙

半个世纪前,阿波罗13号登月任务遇到了麻烦,为了拯救宇航员,美国宇航局的工程师们制作了一个返回地球的宇航员舱模型,以解决这个问题。黄仁勋说,这就是数字孪生。

扩展到大规模,数字孪生将是一个虚拟世界,连接数字和现实,「在互联网的背景下,数字孪生就是下一个进化方向」。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

NVIDIA Omniverse 可以建立数字孪生,和新的数据中心 NVIDIA OVX 系统一起,将成为行动导向的人工智能基石。

Omniverse 是英伟达机器人平台的核心,就像美国宇航局和亚马逊一样,许多大公司开始意识到数字孪生和 Omniverse 的重大性。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

OVX 将运行 Omniverse 数字孪生进行大规模模拟,让多个自治系统在一样的时空中运行。NVIDIA还配备了spectrum-4高性能数据网络基础设施平台,以保证OVX 主干网的高效通信。

NVIDIA spectrum-4是世界上第一个400gbps 的端到端网络平台,包括 spectrum-4交换机系列、 NVIDIA ConnectX-7 SmartNIC、 NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 数据中心基础设施软件组成。

为了让更多的用户可以使用 Omniverse,英伟达还发布了 Omniverse Cloud,只需点击几下鼠标,就可以通过云端的 Omniverse 连接进入元宇宙。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

除了大的数字孪生、元宇宙,黄仁勋认为人工智能的下一波浪潮将是机器人和自动驾驶汽车。未来的机器人能够自主地进行设计、计划等一系列的活动。

NVIDIA Avatar、 DRIVE、 Metropolis、 Isaac 和 Holoscan 是围绕英伟达计算平台建立的端对端的机器人平台: 地面真实数据生成、人工智能模型训练、机器人堆栈和 Omniverse 数字孪生。

最后,黄仁勋将整个AI行业的演进总结为五个过程,百万倍的计算速度加成、变压器AI、数据中心变成人工智能工厂,机器人系统需求呈指数增长,下一代人工智能及数字孪生。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

三大人工智能套件,普通开发者也能端到端

为了加速下一代人工智能的到来,英伟达还对其人工智能软件系统做了全面的更新。

目前许多硬件公司为了加速用户的开发,都推出了相应的开源开发套件,英伟达也不例外。Nvidia AI 加速器计划,可以协助生态系统合作伙伴构建稳定可靠的端到端深度学习模型,在其AI 平台上构建和交付优化后的应用程序,大大缩短开发时间。

Nvidia AI Enterprise 是一个软件套件,即使公司没有人工智能的专业知识,利用平台提供的开源容器和框架,就能搭建起AI应用。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

通过 Nvidia AI Enterprise 2.0的认证,该软件可以在 Azure、VMware 和 Red Hat 等公共数据中心平台上运行,也包括虚拟化环境、现代云本地工作负载而设计的环境,可以说适应性超级强,用户只需要关注业务流程本身,而无需在技术构建上花费过多精力。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

哪怕是只支持 CPU 的系统也可以使用Enterprise的套件,任何规模的组织都可以使用英伟达的AI能力、工具和支持,这样企业就可以专注于 AI 创造业务价值,而不是管理基础设施。

第二个是提高了 Nvidia RIVA,该公司的加速语音软件开发工具包,新版本 Nvidia RIVA 2.0现已上市,提供了七种语言的自动语音识别、类似人的文本到语音的专业男性和女性声音,以及用 Nvidia Tao 工具箱进行定制化的微调,让开发语音类的智能应用触手可及。

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

第三个是 Invidia Merlin 1.0,一个加速端到端的数据科学和机器学习工程师推荐框架,以协助工程师快速建立,优化和部署高性能的大规模推荐系统。

人工智能将成为虚拟世界构建的重大工具,让我们共同期待!

4纳米 GPU 诞生!800亿晶体管AI性能暴增,黄仁勋要拿它构建元宇宙

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
狮子座的翟书书-的头像 - 鹿快
评论 抢沙发

请登录后发表评论

    暂无评论内容