0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

NVIDIA英伟达 来源: NVIDIA英伟达 2025-03-20 15:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理优化将 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。

作为 NVIDIA Triton 推理服务器的后续产品,NVIDIA Dynamo 是一款全新的 AI 推理服务软件,旨在为部署推理 AI 模型的 AI 工厂最大化其 token 收益。它协调并加速数千个 GPU 之间的推理通信,并使用分离服务将大语言模型 (LLM) 的处理阶段和生成阶段在不同 GPU 上分离开来。这使得每个阶段的特定需求可以进行单独优化,并确保更大程度地利用 GPU 资源。

NVIDIA Dynamo 完全开源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企业、初创公司和研究人员能够开发和优化在分离推理时部署 AI 模型的方法。

“全世界各行业都在训练 AI 模型以不同的方式进行思考和学习,从而使模型复杂度持续升级。” NVIDIA 创始人兼首席执行官黄仁勋表示,“为了实现自定义推理 AI 的未来,NVIDIA Dynamo 可以在这些模型上进行规模化部署,从而为 AI 工厂实现降本增效”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109045
  • AI
    AI
    +关注

    关注

    89

    文章

    38078

    浏览量

    296304

原文标题:GTC25 | NVIDIA Dynamo 开源库加速并扩展 AI 推理模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 利用全新开源模型与仿真加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,
    的头像 发表于 09-30 09:52 2782次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新<b class='flag-5'>开源</b><b class='flag-5'>模型</b>与仿真<b class='flag-5'>库</b><b class='flag-5'>加速</b>机器人研发进程

    什么是AI模型推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face
    的头像 发表于 09-23 15:19 810次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1367次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>发布

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 A
    的头像 发表于 08-14 11:34 1144次阅读

    利用NVIDIA推理模型构建AI智能体

    开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。
    的头像 发表于 08-13 14:32 1279次阅读
    利用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理模型</b>构建<b class='flag-5'>AI</b>智能体

    详解 LLM 推理模型的现状

    领域的最新研究进展,特别是自DeepSeekR1发布后兴起的推理时间计算扩展相关内容。在LLM中实施和改进推理简单来说,基于LLM的推理模型是一种旨在通过生成中间
    的头像 发表于 04-03 12:09 1234次阅读
    详解 LLM <b class='flag-5'>推理模型</b>的现状

    英伟GTC2025亮点NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    ,现在已将企业存储纳入其中,旨在通过加速计算、网络、软件和存储,助力企业更高效地部署 AI 工厂。 在企业构建 AI 工厂的过程中,获取高质量数据对于确保 AI
    的头像 发表于 03-21 19:38 1705次阅读

    英伟GTC2025亮点NVIDIA、Alphabet 和谷歌携手开启代理式与物理AI的未来

    联合计划涵盖基础设施和开源模型优化,在机器人、药物研发等领域取得巨大进展 具有长期合作伙伴关系的 NVIDIA、Alphabet 和谷歌宣布了多项新计划,旨在推动 AI 发展、普及
    的头像 发表于 03-21 15:10 1751次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮点</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌携手开启代理式与物理<b class='flag-5'>AI</b>的未来

    英伟GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Oracle 数据NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的头像 发表于 03-21 12:01 1171次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮点</b>:Oracle与<b class='flag-5'>NVIDIA</b>合作助力企业<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英伟GTC2025亮点 NVIDIA推出Cosmos世界基础模型和物理AI数据工具的重大更新

    推理模型,让开发者以前所未有的方式控制世界生成。 NVIDIA 还推出了两款由 NVIDIA Omniverse 和 Cosmos 平台提供支持的新蓝图,为开发者提供用于机
    的头像 发表于 03-20 19:01 1174次阅读

    英伟GTC25亮点NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟GTC25亮点NVIDIA Blackwell Ultra 开启 AI
    的头像 发表于 03-20 15:35 1208次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle 数据NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI       美国加利福尼亚州圣何塞 —— GTC
    发表于 03-19 15:24 467次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出开放推理 AI 模型系列,助力开发者和企业构建代理式 AI 平台

    NVIDIA 后训练的全新 Llama Nemotron 推理模型,为代理式 AI 提供业务就绪型基础 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    发表于 03-19 09:31 335次阅读
    <b class='flag-5'>NVIDIA</b> 推出开放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力开发者和企业构建代理式 <b class='flag-5'>AI</b> 平台

    智谱推出深度推理模型GLM-Zero预览版

    近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强
    的头像 发表于 01-03 10:42 762次阅读

    智谱GLM-Zero深度推理模型预览版正式上线

    近日,智谱公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上线。这款模型是智谱首个基于扩展强化学习技术训练的推理模型,标志着智谱在
    的头像 发表于 01-02 10:55 795次阅读