在本周的 GPU 技术大会 (GTC) 上,NVIDIA 提出了一系列公告强调了该公司如何让开发人员比以往更轻松地大规模构建和部署生成式人工智能应用程序。新产品包括针对 AI 工作负载进行优化的强大计算平台、用于访问 NVIDIA 基础设施和软件的云服务,以及用于简化开发的微服务和 API。
“生成式人工智能是我们这个时代的决定性技术。Blackwell 是推动这场新工业革命的引擎,”黄仁勋,NVIDIA 创始人兼首席执行官。 “与世界上最具活力的公司合作,我们将实现人工智能对每个行业的承诺。”
Blackwell GPU 架构为下一代人工智能计算提供动力
此次发布的头条新闻是全新 Blackwell GPU 架构,这是 NVIDIA 用于加速计算和生成式 AI 的下一代平台。 Blackwell 推出了多项创新技术来支持万亿参数 AI 模型,包括统一的 2080 亿个晶体管 GPU、第二代 Transformer 引擎以及用于 GPU 之间高速互连的第五代 NVIDIA NVLink。
与 NVIDIA 之前的 Hopper GPU 相比,Blackwell 架构为 AI 训练提供了令人印象深刻的 2.5 倍的 FP8 性能。对于推理和内容生成,Blackwell 为大型语言模型提供了高达 30 倍的性能提升。这种性能飞跃将使开发人员能够创建和运行比以往更复杂的人工智能模型。
“Blackwell 提供了巨大的性能飞跃,并将加快我们交付领先模型的能力,”OpenAI 首席执行官 Sam Altman 说道。 “我们很高兴继续与 NVIDIA 合作来增强 AI 计算。”
Dgx 超级计算机提供 Exaflop 的 AI 性能
为了展示 Blackwell 的功能,NVIDIA 宣布推出由 Blackwell GPU 提供支持的新型 DGX 超级计算机。全新 DGX 的单个机架可提供 1 exaflop 的 AI 性能,相当于世界排名前 5 的超级计算机。 NVIDIA 将 576 个 Blackwell GPU 通过 NVLink 连接为一个系统,将其称为生成式 AI 的“AI 工厂”。
NVIDIA AI 模型微服务简化部署
为了让 Blackwell 的强大功能可用,NVIDIA 发布了数十个 NVIDIA NIM(NVIDIA AI 模型)推理微服务。这些云原生微服务构建于 NVIDIA CUDA 平台之上,通过行业标准 API 为 NVIDIA 及合作伙伴提供的二十多个流行 AI 模型提供优化推理。
NIM 微服务预先打包了所有必要的依赖项,例如 CUDA、cuDNN 和 TensorRT,以消除配置麻烦。得益于 Triton Inference Server 等优化的 NVIDIA 软件,它们通过容器提供最快的 AI 推理。
开发人员可以轻松地将这些微服务部署在任何 NVIDIA 加速的计算平台上,从云实例到本地服务器再到边缘设备。 AWS、Azure 和 Google Cloud 等主要云提供商将提供 NIM 微服务,服务器供应商的 NVIDIA DGX Cloud 和 NVIDIA 认证系统也将提供。
“这些容器化人工智能微服务是与我们的合作伙伴生态系统一起创建的,是各行业企业成为人工智能公司的基石,”黄解释道。 “成熟的企业平台坐拥数据金矿,可以转化为生成型人工智能副驾驶。”
Omniverse 和 CUDA-X 微服务加速开发
除了计算和部署服务之外,NVIDIA 还发布了新的 SDK 和 API,以加速跨行业的 AI 开发。 Omniverse Cloud API 使开发人员能够将核心 Omniverse 技术集成到现有的设计和模拟应用程序中。这些 API 为数字孪生提供物理精确的 3D 模拟和可视化功能。
Ansys、Autodesk、Bentley 和西门子等工业软件巨头正在将 Omniverse Cloud API 集成到其产品设计和工程平台中。 Omniverse 使这些工具的用户能够在 3D 模型上无缝协作,并将生成式 AI 应用于计算机辅助工程工作流程。
“6G 和人工智能的未来融合有望带来变革性的技术格局,”三星美国研究院高级副总裁 Charlie Zang 表示。 “这将带来无缝连接和智能系统,从而重新定义我们与数字世界的互动。”
CUDA-X 微服务为常见 AI 工作流程的数据准备、培训和部署提供端到端构建块。其中包括用于可定制语音 AI 的 NVIDIA Riva、用于路由优化的 cuOpt、用于全球气候模拟的 Earth-2 API 以及用于知识检索和语言理解的 NeMo Retriever 服务。
SAP 合作伙伴关系为企业带来生成式人工智能
NVIDIA 正在通过有针对性的微服务套件和合作伙伴关系,为医疗保健和生命科学等关键行业带来生成式 AI 功能。与企业软件领导者 SAP 的合作非常出色。 SAP 和 NVIDIA 正在努力将生成式 AI 与 SAP 的企业应用程序组合和 SAP AI Core 平台集成。
利用 NVIDIA 的 AI 基础和 NeMo 定制工具,SAP 将构建嵌入其产品线的生成式 AI 助手。其中包括企业资源规划套件的人工智能副驾驶以及 SAP SuccessFactors HR 软件和 SAP Signavio 业务流程智能解决方案中的人工智能增强功能。
“战略技术合作伙伴关系,例如 SAP 与 NVIDIA 之间的合作伙伴关系, SAP 首席执行官 Christian Klein 表示:“我们战略的核心是投资技术,最大限度地发挥人工智能的商业潜力和机会。” “NVIDIA 在大规模提供 AI 功能方面的专业知识将帮助 SAP 加快转型步伐,更好地为我们的云客户服务。”
NVIDIA AI 为下一代机器人和量子计算提供动力
在机器人技术领域,NVIDIA 推出了 Project GR00T,这是一个用于教学和训练人形机器人一般技能的基础模型。它利用新的 Jetson Thor 机器人计算机和 Isaac 机器人平台的更新来创建黄所说的“人工通用机器人”。
GR00T 旨在使机器人能够理解自然语言并通过观察示例来模仿人类行为。该模型采用涵盖视频、音频和传感器数据的多模态输入来学习任务。然后,它可以输出电机控制信号,以使用 NVIDIA 构建的机器人模拟器重现物理世界中的技能。
最后,在量子计算方面,NVIDIA 推出了 Quantum Cloud,这是一项基于开源 CUDA-Q 平台的云服务,可供研究人员开发量子算法和应用程序。它具有通过量子生态系统开发的强大新功能,包括量子机器学习的生成模型以及与 QC Ware 和 Classiq 软件的集成。
“量子计算代表了计算的下一个革命性前沿,需要世界上最聪明的人才让这一未来更近一步,”NVIDIA 高性能计算和量子计算总监 Tim Costa 说道。 “NVIDIA Quantum Cloud 打破了探索这项变革性技术的障碍。”
综合平台简化生成式人工智能开发
从芯片到云服务再到人工智能微服务,NVIDIA 的 GTC 公告展示该公司如何为开发人员提供端到端平台,以简化和加速跨行业构建最先进的生成式人工智能应用程序。借助这些新工具,开发人员可以比以往更快地专注于部署变革性人工智能创新。