0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

NVIDIA英伟达 来源: NVIDIA英伟达 2025-03-20 15:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理优化将 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。

作为 NVIDIA Triton 推理服务器的后续产品,NVIDIA Dynamo 是一款全新的 AI 推理服务软件,旨在为部署推理 AI 模型的 AI 工厂最大化其 token 收益。它协调并加速数千个 GPU 之间的推理通信,并使用分离服务将大语言模型 (LLM) 的处理阶段和生成阶段在不同 GPU 上分离开来。这使得每个阶段的特定需求可以进行单独优化,并确保更大程度地利用 GPU 资源。

NVIDIA Dynamo 完全开源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企业、初创公司和研究人员能够开发和优化在分离推理时部署 AI 模型的方法。

“全世界各行业都在训练 AI 模型以不同的方式进行思考和学习,从而使模型复杂度持续升级。” NVIDIA 创始人兼首席执行官黄仁勋表示,“为了实现自定义推理 AI 的未来,NVIDIA Dynamo 可以在这些模型上进行规模化部署,从而为 AI 工厂实现降本增效”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110291
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077

原文标题:GTC25 | NVIDIA Dynamo 开源库加速并扩展 AI 推理模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    宜鼎亮相英伟GTC 2026:智能医疗、智能车载两大亮点,展现技术整合与AI落地实力

    全球边缘AI解决方案领先品牌宜鼎国际(Innodisk)今年受邀出席在美国圣何塞(San Jose)举办的英伟NVIDIAGTC 20
    的头像 发表于 03-19 16:31 328次阅读

    新思科技与英伟多项硬核科技成果亮相GTC 2026

    新思科技(Synopsys, Inc.,纳斯达克股票代码:SNPS)在英伟 GTC 2026 大会(NVIDIA GTC 2026)上,展
    的头像 发表于 03-18 17:36 1162次阅读

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3161次阅读

    英伟电话会看Agentic AI推理与FPGA价值

    2026年2月,英伟发布2026财年Q4财报:营收681亿美元,同比增长73%,数据中心业务增长75%——预期中的超预期。更值得关注的,是电话会中反复出现的几个关键词:Agentic AI
    的头像 发表于 03-04 17:07 1377次阅读
    从<b class='flag-5'>英伟</b><b class='flag-5'>达</b>电话会看Agentic <b class='flag-5'>AI</b><b class='flag-5'>推理</b>与FPGA价值

    LLM推理模型是如何推理的?

    这篇文章《(How)DoReasoningModelsReason?》对当前大型推理模型(LRM)进行了深刻的剖析,超越了表面的性能宣传,直指其技术本质和核心局限。以下是基于原文的详细技术原理、关键
    的头像 发表于 01-19 15:33 839次阅读
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    NVIDIA 推出 Alpamayo 系列开源 AI 模型与工具,加速安全可靠的推理型辅助驾驶汽车开发

    新闻摘要 : l NVIDIA 率先发布为应对辅助驾驶长尾场景挑战而设计的开源视觉-语言-动作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列还包含赋能辅助
    的头像 发表于 01-06 09:40 583次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列<b class='flag-5'>开源</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>与工具,<b class='flag-5'>加速</b>安全可靠的<b class='flag-5'>推理</b>型辅助驾驶汽车开发

    NVIDIA推动面向数字与物理AI开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA)
    的头像 发表于 12-13 09:50 1662次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI
    的头像 发表于 12-01 09:25 1624次阅读

    NVIDIA 利用全新开源模型与仿真加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,
    的头像 发表于 09-30 09:52 3272次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新<b class='flag-5'>开源</b><b class='flag-5'>模型</b>与仿真<b class='flag-5'>库</b><b class='flag-5'>加速</b>机器人研发进程

    什么是AI模型推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face
    的头像 发表于 09-23 15:19 1617次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 2138次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>发布

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 A
    的头像 发表于 08-14 11:34 1656次阅读

    利用NVIDIA推理模型构建AI智能体

    开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。
    的头像 发表于 08-13 14:32 1858次阅读
    利用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理模型</b>构建<b class='flag-5'>AI</b>智能体

    NVIDIA Dynamo新增对亚马逊云科技服务的支持

    亚马逊云科技 (AWS) 开发者和解决方案架构师现在可以在基于 NVIDIA GPU 的 Amazon EC2 上使用 NVIDIA Dynamo,包括由 NVIDIA Blackwe
    的头像 发表于 07-28 14:31 1188次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Dynamo</b>新增对亚马逊云科技服务的支持

    NVIDIA英伟 GTC 巴黎亮点NVIDIA CEO黄仁勋公布欧洲AI发展新蓝图

    联合举办的 GTC 巴黎上,NVIDIA 创始人兼 CEO 黄仁勋传递出一个明确信息:欧洲不仅采用 AI,还正在建设 AI。 黄仁勋在面向线上以及巴黎体育宫现场观众发表演讲时表示:“
    的头像 发表于 06-13 11:44 1512次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>GTC</b> 巴黎<b class='flag-5'>亮点</b>:<b class='flag-5'>NVIDIA</b> CEO黄仁勋公布欧洲<b class='flag-5'>AI</b>发展新蓝图