0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC23 | NVIDIA 推出用于大型语言模型和生成式 AI 工作负载的推理平台

NVIDIA英伟达企业解决方案 来源:未知 2023-03-23 06:55 次阅读

谷歌云、D-ID、Cohere 将新平台用于各种生成式 AI 服务,包括聊天机器人、文本生成图像内容、AI 视频

加利福尼亚州圣克拉拉 - GTC - 太平洋时间 2023 年 3 月 21 日 – NVIDIA 于今日推出四款推理平台。这些平台针对各种快速兴起的生成式 AI 应用进行了优化,能够帮助开发人员快速构建用于提供新服务和洞察的 AI 驱动的专业应用。

这些平台将 NVIDIA 的全栈推理软件与最新的 NVIDIA Ada、Hopper 和 Grace Hopper 处理器相结合,包括今天推出的 NVIDIA L4 Tensor Core GPU 和 NVIDIA H100 NVL GPU。各平台针对 AI 视频、图像生成、大型语言模型部署、推荐系统推理等需求激增的工作负载进行了优化。

NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 的兴起需要更加强大的推理计算平台。生成式 AI 应用的数量是无限的,它唯一的限制就是人类的想象力。为开发人员提供最强大、灵活的推理计算平台将加快新服务的创造速度,这些新服务将以前所未有的方式改善我们的生活。”

加速生成式 AI 的各种推理工作负载集

每个平台都包含一个为特定生成式 AI 推理工作负载而优化的 NVIDIA GPU 和专用的软件:

  • 适用于 AI 视频的 NVIDIA L4 可提供比 CPU 高出 120 倍的 AI 视频性能,同时能效提高了 99%。这款适用于几乎所有工作负载的通用 GPU 提供更加强大的视频解码和转码能力、视频流式传输、增强现实、生成式 AI 视频等。

  • 适用于图像生成的 NVIDIA L40 针对图形以及 AI 支持的 2D、视频和 3D 图像生成进行了优化。L40 平台是 NVIDIA Omniverse(一个用于在数据中心构建和运行元宇宙应用的平台)的引擎,与上一代产品相比,其 Stable Diffusion 推理性能提高了 7 倍,Omniverse 性能提高了 12 倍。

  • 适用于大型语言模型部署的 NVIDIA H100 NVL 是规模化部署像 ChatGPT 这样的大型语言模型(LLMs)的理想平台。这款新的 H100 NVL 拥有 94GB 内存和 Transformer 引擎加速,在数据中心规模,与上一代 A100 相比,GPT-3 上的推理性能提高了多达 12 倍。

  • 适用于推荐模型的 NVIDIA Grace Hopper 是图形推荐模型、矢量数据库和图神经网络的理想平台。通过 NVLink-C2C 以 900 GB/s 的速度连接 CPU 和 GPU,Grace Hopper 的数据传输和查询速度比 PCIe 5.0 快了 7 倍。

这些平台的软件层采用 NVIDIA AI Enterprise 软件套件,包括用于高性能深度学习推理的软件开发套件 NVIDIA TensorRT,以及帮助实现模型部署标准化的开源推理服务软件 NVIDIA Triton Inference Server。

早期采用者与支持

谷歌云是 NVIDIA 推理平台的重要云合作伙伴和早期客户。该公司正在将 L4 平台整合到其机器学习平台 Vertex AI 中,并且是第一家提供 L4 实例的云服务提供商,其 G2 虚拟机的私人预览版已于今天推出。

NVIDIA 和谷歌今天分别宣布了首批在谷歌云上使用 L4 的两家机构——Descript 和 WOMBO,前者使用生成式 AI 帮助创作者制作视频和播客,后者提供 “Dream” 这一 AI 驱动的文本-数字艺术转换应用程序。

另一个早期采用者快手提供了一个短视频应用程序,利用 GPU 对传入的实时流媒体视频进行解码、捕捉关键帧并优化音视频。然后,它使用一个基于 Transformer 的大型模型理解多模态内容,从而提高全球数亿用户的点击率。

快手高级副总裁于越表示:“快手推荐系统所服务的社区每天的用户人数超过 3.6 亿,他们每天贡献 3000 万条 UGC 视频。在相同的总体拥有成本下,相较于 CPU,NVIDIA GPU 将系统的端到端吞吐量提高了 11 倍,将延迟降低了 20%。”

领先的生成式 AI 技术平台 D-ID,通过使用 NVIDIA L40 GPU 从文本中生成逼真的数字人,支持任何内容来生成人脸,不仅帮助专业人士改进视频内容,同时减少了大规模视频制作的成本和麻烦。

D-ID 研发副总裁 Or Gorodissky 表示:“L40 的性能十分惊人。有了它,我们将推理速度提高了一倍。D-ID 十分高兴能够将这个新硬件作为我们产品的一部分,以前所未有的性能和分辨率实现 AI 人的实时流传输,并降低我们的计算成本。”

领先的 AI 制作工作室 Seyhan Lee 使用生成式 AI 为电影、广播和娱乐行业开发沉浸式体验和迷人的创意内容。

Seyhan Lee 联合创始人 Pinar Demirdag 表示:“L40 GPU 为我们的生成式 AI 应用带来了惊人的性能提升。凭借 L40 的推理能力和内存容量,我们可以部署非常先进的模型,并以惊人的速度和精度向客户提供创新的服务。”

语言 AI 领域的先锋 Cohere 所运行的平台使得开发人员能够在保护数据隐私和安全的情况下,构建自然语言模型。

Cohere 首席执行官 Aidan Gomez 表示:“凭借 NVIDIA 的全新高性能 H100 推理平台,我们可以使用先进的生成式模型为客户提供更加优质、高效的服务,推动对话式 AI、多语言企业搜索、信息提取等各种 NLP 应用的发展。”

供应情况

NVIDIA L4 GPU 私人预览版现已通过谷歌云平台以及 30 多家计算机制造商所组成的全球网络提供。

NVIDIA L40 GPU 现已通过全球领先的系统提供商提供,并且合作伙伴平台的数量将在今年持续增加。

Grace Hopper 超级芯片已开始样品供货,预计下半年将全面投产。H100 NVL GPU 也将于下半年面市。

NVIDIA AI Enterprise 现在通过各大云市场以及数十家系统提供商和合作伙伴提供。NVIDIA AI Enterprise 为客户提供 NVIDIA 企业级支持、定期安全审查以及 NVIDIA Triton Inference Server、TensorRT 和 50 多个预训练模型与框架的 API 稳定性。

NVIDIA LaunchPad 上免费提供的动手实验室可以试用用于生成式 AI 的 NVIDIA 推理平台。样品实验室的内容包括训练和部署一个客服聊天机器人、部署一个端到端 AI 工作负载、在 H100 上调整和部署一个语言模型以及使用 NVIDIA Triton 部署一个欺诈检测模型。

扫描海报二维码,或点击“阅读原文”即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!

ef9782d0-c903-11ed-bfe3-dac502259ad0.gif  

百里挑一!

3 月 23 日不可错过的演讲!

GTC23 | 黄仁勋与 Ilya Sutskever 的炉边谈话重磅来袭!— 看 AI 的现状和未来


原文标题:GTC23 | NVIDIA 推出用于大型语言模型和生成式 AI 工作负载的推理平台

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3331

    浏览量

    87798

原文标题:GTC23 | NVIDIA 推出用于大型语言模型和生成式 AI 工作负载的推理平台

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍
    发表于 12-14 11:41

    NVIDIA 通过企业级生成AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

    微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。 NVIDIA NeMo Retriever 是 NV
    的头像 发表于 11-29 21:05 381次阅读

    NVIDIA 通过企业级生成AI 微服务 为聊天机器人、AI 助手和摘要工具带来商业智能

    — 太平洋时间 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一项生成AI 微服务,支持企业将自定义大语言
    发表于 11-29 14:37 131次阅读
    <b class='flag-5'>NVIDIA</b> 通过企业级<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 微服务 为聊天机器人、<b class='flag-5'>AI</b> 助手和摘要工具带来商业智能

    SC23 | NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    再添新动力。 NVIDIA H200 是首款采用 HBM3e 的 GPU,其运行更快、更大的显存容量将进一步加速生成AI 与大语言模型
    的头像 发表于 11-14 20:05 288次阅读
    SC<b class='flag-5'>23</b> | <b class='flag-5'>NVIDIA</b> 为全球领先的 <b class='flag-5'>AI</b> 计算<b class='flag-5'>平台</b> Hopper 再添新动力

    NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    Tensor Core GPU 和领先的显存配置,可处理生成AI 与高性能计算工作负载的海量数据。   NVIDIA H200 是首款
    发表于 11-14 14:30 113次阅读
    <b class='flag-5'>NVIDIA</b> 为全球领先的 <b class='flag-5'>AI</b> 计算<b class='flag-5'>平台</b> Hopper 再添新动力

    利用 NVIDIA Jetson 实现生成AI

    上以交互速率运行的 Llama-2-70B 模型。 图 1. 领先的生成AI 模型在  Jetson AGX Orin 上的推理性能
    的头像 发表于 11-07 21:25 491次阅读
    利用 <b class='flag-5'>NVIDIA</b> Jetson 实现<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

    由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源
    的头像 发表于 10-26 09:05 195次阅读

    NVIDIA 扩展机器人平台,迎接生成AI 的崛起

    务已应用于边缘。 生成AI 正在将 Transformer 模型和大语言模型的强大力量带到各
    的头像 发表于 10-20 02:05 344次阅读
    <b class='flag-5'>NVIDIA</b> 扩展机器人<b class='flag-5'>平台</b>,迎接<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的崛起

    NVIDIA 扩展机器人平台,迎接生成AI 的崛起

    基于 NVIDIA Jetson 平台进行开发的 1 万多家公司现在可以利用全新的生成AI、API 和微服务来加快推进行业数字化     强大的
    发表于 10-19 17:16 134次阅读
    <b class='flag-5'>NVIDIA</b> 扩展机器人<b class='flag-5'>平台</b>,迎接<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的崛起

    SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

    计算密集型的复杂应用,包括 AI 训练与推理、3D 设计与可视化、视频处理以及工业数字化等。 这款全新 GPU 将加速生成AI 的计算工作
    的头像 发表于 08-09 19:10 285次阅读

    NVIDIA为Windows RTX工作站提供全新生成AI功能与突破性性能

    随着越来越多的 AI 推理在本地设备上运行,工作站将需要强大而高效的硬件以支持这些复杂的任务。为了满足这一需求,RTX GPU 将添加用于 AI
    的头像 发表于 06-07 14:55 467次阅读
    <b class='flag-5'>NVIDIA</b>为Windows RTX<b class='flag-5'>工作</b>站提供全新<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>功能与突破性性能

    NVIDIA 为 1 亿台 Windows RTX PC 和工作站提供全新生成AI 功能与突破性性能

    搭载 Tensor Core 的 NVIDIA RTX GPU 正在加速生成AI 模型的开发与部署;即将推出的 Max-Q 低功耗
    的头像 发表于 05-31 03:50 365次阅读

    NVIDIA 与微软合作加速企业就绪的生成AI

    NVIDIA AI Enterprise 与 Azure 机器学习集成,提供端到端云平台,供开发者构建、部署和管理大型语言
    的头像 发表于 05-25 09:15 378次阅读
    <b class='flag-5'>NVIDIA</b> 与微软合作加速企业就绪的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    NVIDIA 携手微软,在生成AI 的新时代推动 Windows PC 创新

    行业领导者打破藩篱,使开发人员能够轻松地在 Windows 11 上训练并部署先进的 AI 模型,并在配备 RTX 的 PC 和工作站上提供节能的推理
    的头像 发表于 05-25 09:15 531次阅读
    <b class='flag-5'>NVIDIA</b> 携手微软,在<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的新时代推动 Windows PC 创新

    ServiceNow 与 NVIDIA 宣布联合打造面向企业 IT 的生成AI

    基于 ServiceNow 平台并采用 NVIDIA AI 软件和 DGX 基础设施构建的自定义大型语言
    的头像 发表于 05-19 00:50 367次阅读
    ServiceNow 与 <b class='flag-5'>NVIDIA</b> 宣布联合打造面向企业 IT 的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>