NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理优化将 DeepSeek-R1 上的吞吐量提高了 30 倍
NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。
作为 NVIDIA Triton 推理服务器的后续产品,NVIDIA Dynamo 是一款全新的 AI 推理服务软件,旨在为部署推理 AI 模型的 AI 工厂最大化其 token 收益。它协调并加速数千个 GPU 之间的推理通信,并使用分离服务将大语言模型 (LLM) 的处理阶段和生成阶段在不同 GPU 上分离开来。这使得每个阶段的特定需求可以进行单独优化,并确保更大程度地利用 GPU 资源。
NVIDIA Dynamo 完全开源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企业、初创公司和研究人员能够开发和优化在分离推理时部署 AI 模型的方法。
“全世界各行业都在训练 AI 模型以不同的方式进行思考和学习,从而使模型复杂度持续升级。” NVIDIA 创始人兼首席执行官黄仁勋表示,“为了实现自定义推理 AI 的未来,NVIDIA Dynamo 可以在这些模型上进行规模化部署,从而为 AI 工厂实现降本增效”。
-
NVIDIA
+关注
关注
14文章
5725浏览量
110291 -
AI
+关注
关注
91文章
41976浏览量
303077
原文标题:GTC25 | NVIDIA Dynamo 开源库加速并扩展 AI 推理模型
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
宜鼎亮相英伟达GTC 2026:智能医疗、智能车载两大亮点,展现技术整合与AI落地实力
新思科技与英伟达多项硬核科技成果亮相GTC 2026
NVIDIA推出代理式AI蓝图与电信推理模型
从英伟达电话会看Agentic AI推理与FPGA价值
LLM推理模型是如何推理的?
NVIDIA 推出 Alpamayo 系列开源 AI 模型与工具,加速安全可靠的推理型辅助驾驶汽车开发
NVIDIA推动面向数字与物理AI的开源模型发展
利用NVIDIA Cosmos开放世界基础模型加速物理AI开发
NVIDIA 利用全新开源模型与仿真库加速机器人研发进程
什么是AI模型的推理能力
澎峰科技完成OpenAI最新开源推理模型适配
NVIDIA Dynamo新增对亚马逊云科技服务的支持
NVIDIA英伟达 GTC 巴黎亮点:NVIDIA CEO黄仁勋公布欧洲AI发展新蓝图
英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型
评论