0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA宣布其AI推理平台的重大更新

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-11-12 14:42 次阅读

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行业领导者都在使用该平台

NVIDIA宣布其AI推理平台的重大更新,目前Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客户都在使用该平台。

这些更新包括开源NVIDIA Triton推理服务器软件的新功能,该软件为所有AI模型和框架提供跨平台推理;同时也包含对NVIDIA TensorRT的更新,该软件优化AI模型并为NVIDIA GPU上的高性能推理提供运行时优化。

NVIDIA还推出了NVIDIA A2 Tensor Core GPU,这是一款用于边缘AI推理的低功耗、小尺寸的加速器,其推理性能比CPU高出20倍。

NVIDIA副总裁兼加速计算总经理Ian Buck表示:“NVIDIA AI推理平台正在推动各行各业的突破,包括医疗健康、金融服务、零售、制造和超级计算。无论是提供更智能的建议,发挥对话式AI的力量,还是推进科学发现,NVIDIA推理平台都能以简单易用的方式提供低延迟、高吞吐及多种性能组合的服务,为全球关键的AI新应用赋能。”

关键的软件优化

Triton 推理服务器的主要更新包括:

Triton 模型分析器 :这款新工具可以自动化地从数百种组合中为 AI 模型选择最佳配置,以实现最优性能,同时确保应用程序所需的服务质量。

多 GPU 多节点功能:这一新功能支持基于Transformer的大规模语言模型,例如Megatron 530B,在多个GPU和服务器节点上运行并提供实时推理性能,而不是在单个GPU上运行。

RAPIDS FIL : 这一针对随机森林和梯度提升决策树模型 GPU 或 CPU 推理的新后端为开发者使用Triton进行深度学习和传统机器学习提供了一个统一的部署引擎。

Amazon SageMaker 集成:这种无缝集成让客户能够在SageMaker(AWS 完全托管的AI 服务)中使用 Triton 轻松部署多框架的模型,并实现高推理性能。

支持 Arm CPU:除了NVIDIA GPU 和 x86 CPU 外,Triton后端现在还支持在 Arm CPU 上优化AI 推理工作负载。

Triton 支持在云、数据中心、企业边缘和嵌入式设备等环境中对 GPU 和CPU 进行 AI 推理,并与AWS、Google Cloud、MicrosoftAzure、阿里云PAI-EAS 等平台集成。此外,NVIDIA AI Enterprise也集成了Triton。 NVIDIA AI Enterprise 是一款经NVIDIA 优化、认证和支持的用于开发和部署 AI 的端到端软件套件,客户可利用它在本地数据中心和私有云的主流服务器上运行AI 工作负载。

除了Triton外,TensorRT 现在还与TensorFlow和PyTorch集成,只需一行代码就能提供比框架内推理快3倍的性能。这使得开发人员采用极为简化的工作流程就可以体会TensorRT的强大功能。 NVIDIA TensorRT 8.2 是SDK的最新版本,可加速高性能的深度学习推理,在云端、本地或边缘提供高吞吐和低延迟。有了最新的性能优化,数十亿个参数的语言模型可实现实时运行。

领导者支持NVIDIA AI 平台推理

全球众多行业领导者都正在使用 NVIDIA AI 推理平台改进业务运营并为客户提供新的AI赋能服务。 Microsoft Azure 认知服务为高品质AI 模型提供基于云的 API,以创建智能应用程序。他们正在使用Triton 运行语音转文本模型,为 Microsoft Teams 用户提供准确的实时字幕和转录。

“Microsoft Teams 是全球沟通和协作的重要工具,每月有近 2.5 亿活跃用户,”Microsoft 团队呼叫、会议和设备部首席PM 经理 Shalendra Chhabra 表示。“这样的AI 模型极其复杂,需要数千万个神经网络参数才能在几十种不同的语言中提供准确的结果。模型越大,就越难以经济高效地实时运行。

Microsoft Azure 认知服务上的NVIDIA GPU 和 Triton 推理服务器使用28 种语言和方言,通过 AI 近乎实时地帮助改进实时字幕和转录功能。”Microsoft Azure 认知服务上的NVIDIA GPU 和 Triton 推理服务器,结合AI模型,帮助提升了涉及28 种语言和方言的实时字幕和转录功能的成本效益。

Samsung Medison 是三星电子旗下一家全球医疗设备公司。该公司正利用 NVIDIA TensorRT 通过智能辅助功能来为其超声波系统提供增强的更优质的医疗影像。Samsung Medison 致力于通过提高患者的舒适度、减少扫描时间、简化工作流程并最终提高系统吞吐量来改善患者和医疗健康领域专业人员的生活。

“在新款 V8 高端超声波系统中应用NVIDIA TensorRT 后,我们能够在查看和诊断图像时更好地为医学专家提供支持,”Samsung Medison 副总裁、客户体验团队主管Won-Chul Bang 表示。

“我们正在积极地将基于AI 的技术引入我们的超声波系统,以便为医疗专业人员提供更好的支持,使他们能够专注于患者诊断和治疗等更重要的领域。” Siemens Energy是一家拥有领先能源技术解决方案的能源专营公司,该公司正利用 Triton 通过AI 来帮助其发电厂客户管理相关设施。

“高度复杂的发电厂通常会配备摄像头和传感器,但采用的却是传统软件系统,NVIDIA Triton 推理服务器出色的灵活性能够让这些发电厂加入自主工业革命,”

SiemensEnergy自主运营部投资组合经理 Arik Ott 表示。 Snap是一家全球性摄影软件和社交媒体公司,其主要产品和服务包括Snapchat、Spectacles和Bitmoji等。Snap正在使用NVIDIA技术来提高商业变现能力和降低成本。

“Snap使用NVIDIA GPU和TensorRT将机器学习推理的成本效率提高了50%,并将服务延迟降低了2倍,“Snap公司策划与商业变现部门工程副总裁Nima Khajehnouri表示。”这为我们提供了计算资源,以实践和部署更大型、更准确的广告和内容排名模型。“

NVIDIA面向推理的AI平台包括

新的 NVIDIA 认证系统、全新A2 GPU

NVIDIA 认证系统可以帮助客户在高性能、经济高效且可扩展的基础设施上为各种现代 AI 应用识别、获取和部署系统,该认证系统现在包含两个新的边缘AI类别。 扩展的类别允许NVIDIA 系统的合作伙伴为客户提供完整系列的由基于 NVIDIA Ampere 架构的GPU 支持的 NVIDIA 认证系统,来处理各种实际工作负载。

新的NVIDIA A2 GPU也包含在内,它是一个入门级、低功耗的紧凑型加速器,适用于边缘服务器中的推理和边缘 AI。NVIDIA A2与适用于主流企业服务器的NVIDIA A30、适用高性能AI 服务器的NVIDIA A100一起,为边缘、数据中心和云端的 AI 推理提供了完整的方案。

Atos、戴尔科技、技嘉、慧与、浪潮、联想和Supermicro等全球领先的企业系统供应商,其AI系统产品线均支持在NVIDIA 认证系统上使用NVIDIA AI Enterprise。 其他系统提供商,如研华科技、ASRock Rack、华硕、新华三、宁畅和QCT也为各种工作负载提供了NVIDIA 认证系统。包括研华科技、技嘉和联想在内的领先供应商将很快推出首款通过新边缘类别认证的 NVIDIA 认证系统。

供货情况

Triton 通过NVIDIA NGC 目录提供。NVIDIA NGC是针对 GPU 优化的AI 软件中心,包括框架、工具包、预训练模型和 Jupyter Notebooks。Triton源代码可从Triton GitHub 资源库获取。 NVIDIA 开发者计划成员可通过TensorRT页面获取 TensorRT。最新版本的插件、解析器和示例也以开源形式提供,可从TensorRT GitHub 资源库获取。 客户可以通过今日独家发布的NVIDIA LaunchPad中的全球精选实验室,在 NVIDIA AI Enterprise 软件套件中体验NVIDIA Triton。

NVIDIA AI Enterprise 软件套件可通过全球 NVIDIA 渠道合作伙伴获取,包括Atea、Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises、Presidio、Sirius、SoftServe、SVASystem Vertrieb Alexander GmbH、TD SYNNEX、Trace3和 WWT。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101706
  • 服务器
    +关注

    关注

    12

    文章

    8116

    浏览量

    82503
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264043

原文标题:GTC21 | NVIDIA 发布 Triton 推理服务器重大更新,全球25000余家公司部署 NVIDIA AI 推理平台

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin Hierarc
    的头像 发表于 04-20 09:39 155次阅读

    ONNX Runtime支持龙架构,AI推理生态再添新翼

    近日,备受瞩目的AI推理框架开源社区ONNX Runtime宣布推出支持龙架构的新版本1.17.0,这一里程碑式的更新意味着龙芯平台上的
    的头像 发表于 03-27 10:58 265次阅读

    NVIDIA入局人形机器人!Isaac平台迎来重要更新

    NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术,加速 AI 机器人技术的发展。
    的头像 发表于 03-26 09:07 420次阅读
    <b class='flag-5'>NVIDIA</b>入局人形机器人!Isaac<b class='flag-5'>平台</b>迎来重要<b class='flag-5'>更新</b>

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 208次阅读

    NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    NVIDIA HGX™ H200,为 Hopper 这一全球领先的 AI 计算平台再添新动力。NVIDIA HGX H200 平台基于
    发表于 11-14 14:30 112次阅读
    <b class='flag-5'>NVIDIA</b> 为全球领先的 <b class='flag-5'>AI</b> 计算<b class='flag-5'>平台</b> Hopper 再添新动力

    周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

    由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型(LLM)
    的头像 发表于 10-26 09:05 193次阅读

    NVIDIA Isaac 平台先进的仿真和感知工具助力 AI 机器人技术加速发展

    在 ROSCon 2023 上,NVIDIA 发布了  NVIDIA Isaac Robotics  平台重大更新。该
    的头像 发表于 10-20 02:00 447次阅读
    <b class='flag-5'>NVIDIA</b> Isaac <b class='flag-5'>平台</b>先进的仿真和感知工具助力 <b class='flag-5'>AI</b> 机器人技术加速发展

    NVIDIA Grace Hopper超级芯片横扫MLPerf推理基准测试

    平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。   此外,NVIDIA宣布推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。   GH200 超级芯
    发表于 09-13 09:45 165次阅读
    <b class='flag-5'>NVIDIA</b> Grace Hopper超级芯片横扫MLPerf<b class='flag-5'>推理</b>基准测试

    NVIDIA Grace Hopper 超级芯片横扫 MLPerf 推理基准测试

    平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。 此外,NVIDIA 宣布推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。 GH200 超级芯片在
    的头像 发表于 09-12 20:40 276次阅读

    生成式AI时代要来了吗 NVIDIA生成式AI获新突破

    这些性能强大的新系统将利用 NVIDIA Omniverse 平台加速高计算密集度的复杂应用,包括 AI 训练和推理、3D 设计和可视化、视频处理、工业数字化等。
    发表于 08-23 14:20 239次阅读

    SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

    年 8 月 8 日 —   NVIDIA 宣布推出搭载全新 NVIDIA L40S GPU 的 NVIDIA OVX 服务器。这款功能强大的通用数据中心处理器将通过
    的头像 发表于 08-09 19:10 282次阅读

    SIGGRAPH主题演讲:NVIDIA首席执行官带来生成式AI多项创新

    黄仁勋发布最新GH200 Grace Hopper 超级芯片和NVIDIA AI Workbench,并宣布更新NVIDIA Omniver
    的头像 发表于 08-09 14:20 721次阅读
    SIGGRAPH主题演讲:<b class='flag-5'>NVIDIA</b>首席执行官带来生成式<b class='flag-5'>AI</b>多项创新

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行AI推理的处理器
    发表于 08-04 07:25

    NVIDIA 与微软合作加速企业就绪的生成式 AI

    NVIDIA AI Enterprise 与 Azure 机器学习集成,提供端到端云平台,供开发者构建、部署和管理大型语言模型的 AI 应用 微软 Build 大会——太平洋时间 20
    的头像 发表于 05-25 09:15 376次阅读
    <b class='flag-5'>NVIDIA</b> 与微软合作加速企业就绪的生成式 <b class='flag-5'>AI</b>

    AI推理平台EaiServer(webServer)

    AI推理平台是一种基于人工智能技术的视频分析工具,可以通过分析视频内容,提取其中的关键信息,从而帮助用户实现自动化的视频处理和管理。这种系统通常包括视频识别、内容分类、目标检测、场景分析、行为识别
    的头像 发表于 05-22 15:53 1600次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>平台</b>EaiServer(webServer)