0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NIM微服务带来巨大优势

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-08-23 15:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新服务通过热门 AI 模型为数百万开发者带来高达 5 倍的 token 效率提升,使他们能够立即访问在 NVIDIA DGX Cloud 上运行的 NIM 微服务。

全球最大人工智能社区之一 Hugging Face 平台上的 400 万开发者在一些最热门的 AI 模型上可轻松获得 NVIDIA 加速推理。

借助新的推理即服务能力,开发者将能够快速部署 Llama 3 系列和 Mistral AI 模型等领先的大语言模型,并使用运行在NVIDIA DGX Cloud上的NVIDIA NIM微服务进行优化。

这项服务在 SIGGRAPH 大会上发布,它将帮助开发者利用托管在 Hugging Face Hub 上的开源 AI 模型快速建立原型并将其部署在生产中。Enterprise Hub 用户可以利用 NVIDIA NIM 进行无服务器推理,以提高灵活性,尽可能降低基础设施用度并优化性能。

推理服务补充了在 DGX Cloud 端的训练(Train on DGX Cloud),一种已在 Hugging Face 上提供的 AI 训练服务。

由于开发者面对着越来越多的开源模型,可供其轻松比较各种选项的资源中心会非常有帮助。这些训练和推理工具为 Hugging Face 开发者提供了在 NVIDIA 加速基础设施上试验、测试和部署先进模型的新方法。它们可以通过 Hugging Face 模型卡上的“训练”和“部署”下拉菜单轻松访问,用户只需点击几下就能轻松使用这些功能。

不仅限于 Token 层面的提升

— NVIDIA NIM 带来巨大优势

NVIDIA NIM 是一系列 AI 微服务(包括 NVIDIA AI 基础模型和开源社区模型)的集合,而且已使用行业标准应用编程接口(API)针对推理进行了优化。

NIM 为用户带来更高的 token 处理效率 — token 是语言模型使用和生成的数据单位。经优化的微服务还能改善底层 NVIDIA DGX Cloud 基础架构的效率,从而提高关键 AI 应用的速度。

这意味着,与模型的其他版本相比,开发者可以通过访问 NIM AI 模型,更快、更可靠地得到结果。例如,与 NVIDIA Tensor Core GPU 驱动系统上的现成部署相比,通过 NIM 访问 Llama 3 的 700 亿参数版本时,可实现最高达 5 倍的吞吐量提升。

近乎即时的 DGX Cloud

访问让 AI 加速触手可及

NVIDIA DGX Cloud 平台专为生成式 AI 打造,为开发者提供轻松访问可靠加速计算基础设施的途径,帮助他们更快地将生产就绪型应用推向市场。

该平台提供可扩展的 GPU 资源,可为从原型设计到生产的每一步 AI 开发提供支持,同时无需开发者做出长期的 AI 基础设施承诺。

借助由 NIM 微服务提供支持、在 NVIDIA DGX Cloud 上运行的 Hugging Face 推理即服务,用户可轻松访问针对 AI 部署进行优化的计算资源,在企业级环境中实验最新的 AI 模型。

详细了解在 SIGGRAPH 大会上

发布的 NVIDIA NIM 相关信息

在 SIGGRAPH 大会上,NVIDIA 还推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服务,以加速开发者构建高精度虚拟世界的能力,推动 AI 再次演进。

体验超过 100 种 NVIDIA NIM 微服务在各行各业的应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • AI
    AI
    +关注

    关注

    91

    文章

    41057

    浏览量

    302561
  • 人工智能
    +关注

    关注

    1820

    文章

    50313

    浏览量

    266866
  • 微服务
    +关注

    关注

    0

    文章

    150

    浏览量

    8139

原文标题:SIGGRAPH 2024 | Hugging Face 为开发者带来由 NVIDIA NIM 提供支持的推理即服务

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Springboot+SpringData+SpringCloud微服务架构课程

    不再是加分项,而是必选项。而在 Java 生态中,SpringCloud 无疑是微服务领域的“事实标准”。然而,从会用 SpringCloud 组件到真正落地一个高可用、高并发的微服务系统,中间隔着巨大的鸿沟。这正是“落地实战”
    的头像 发表于 03-19 16:08 321次阅读

    光伏四可装置软件系统架构:微服务化设计与容器化部署方案

    ,某一模块升级需整体停机,无法适配光伏场景对实时性与连续性的要求;物理机部署模式则导致环境一致性差,跨场景迁移成本高。为此,基于微服务化设计与容器化部署的软件架构应运而生,通过“功能解耦、弹性部署、高效
    的头像 发表于 03-03 15:47 527次阅读

    基于OpenTelemetry的全链路追踪微服务可观测性实践

    微服务拆分到第三年,我们的服务数量从最初的5个膨胀到了47个。一个用户下单请求要经过API Gateway -> 用户服务 -> 商品服务 -> 库存
    的头像 发表于 02-26 15:43 544次阅读

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 A
    的头像 发表于 11-03 14:48 1207次阅读

    华纳云VPS容器服务网格流量管理:实现微服务高效路由

    在云计算和微服务架构日益普及的今天,华纳云香港VPS凭借其优越的地缘优势和网络自由,成为众多企业部署容器化应用的热门选择。复杂的微服务架构带来了流量管理的
    的头像 发表于 10-16 17:09 664次阅读

    如何基于Nginx构建微服务网关

    今天,我将分享我们团队如何基于Nginx构建了一个日均处理10亿+请求的微服务网关,以及踩过的那些坑。这套方案已经稳定运行2年+,经历过多次大促考验。
    的头像 发表于 09-02 16:29 959次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4347次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell GPU测试分析

    Jtti海外VPS微服务架构下的日志采集与分析优化方案

    随着跨境业务和分布式应用的普及,越来越多的企业在海外VPS上构建微服务架构,以提升系统扩展性和灵活性。然而,微服务带来了一个新的挑战:日志数据分散在多个服务和节点中,若缺乏统一采集与
    的头像 发表于 08-27 17:13 697次阅读

    NVIDIA Omniverse Extension开发秘籍

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的 3D 框架与
    的头像 发表于 08-22 15:52 3843次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse Extension开发秘籍

    电商API的微服务架构优化策略

    ​ 随着电子商务的快速发展,API(应用程序编程接口)已成为电商平台的核心组件,负责连接用户、商家和后台系统。微服务架构通过将应用拆分为独立、可扩展的服务单元,显著提升了系统的灵活性和可维护性。然而
    的头像 发表于 07-23 14:30 723次阅读
    电商API的<b class='flag-5'>微服务</b>架构优化策略

    蔡司“微服务”——全能在线售后管家,24小时守护您的设备!

    还在为设备故障烦恼? 急需技术支援却找不到人? 想快速获取用户手册或软件升级? 现在 只需微信扫一扫设备上的蓝色标签二维码 蔡司“微服务”一键触达! 9大功能板块 全方位解决您的售后需求 服务更高
    发表于 07-10 16:44 1676次阅读
    蔡司“<b class='flag-5'>微服务</b>”——全能在线售后管家,24小时守护您的设备!

    使用英伟达 NVIDIA Air 服务将仿真与现实世界连接

    NVIDIA Air 通过创建与真实数据中心基础设施部署相同的副本来实现云规模效率。借助 NVIDIA Air,您可以启动数百台交换机和服务器,并使用单个脚本进行配置。 NVIDIA
    的头像 发表于 07-07 19:41 1465次阅读
    使用英伟达 <b class='flag-5'>NVIDIA</b> Air <b class='flag-5'>服务</b>将仿真与现实世界连接

    NVIDIA技术助力企业创建主权AI智能体

    AI Factory 的经验证设计将加速基础设施与软件(包括全新 NVIDIA NIM 微服务和经扩展的 NVIDIA Blueprint)相结合,为各国和企业简化了全栈式 AI 开发
    的头像 发表于 06-16 14:28 1524次阅读

    2025 NVIDIA创业企业展示澳门站圆满收官

    澳门站首次作为 NVIDIA 创业企业展示分站城市,聚焦 AI 智能体、物理 AI 和机器人等前沿技术,更有 NVIDIA Omniverse、NVIDIA NIM 等最新技术分享,涵
    的头像 发表于 05-29 14:12 1050次阅读

    企业使用NVIDIA NeMo微服务构建AI智能体平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。
    的头像 发表于 04-27 15:05 1477次阅读