0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

蔚来基于NVIDIA Triton搭建的推理服务平台

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-10-09 10:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在近日举行的 GTC 大会上,蔚来 AI 平台负责人白宇利带来非常有价值的分享,他首次对外透露了蔚来自研的全栈式自动驾驶系统(NAD)的部署和开发情况,同时也将蔚来自动驾驶研发平台(NADP)这个神秘的“Peta Factory”带到了公众视野中。

据了解,NADP是服务于蔚来自动驾驶核心业务方向的研发平台,用于开发 NAD 功能。以“Peta”为名是因为每辆车每天能生成 55 petabit数据(1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits),而 NADP 是所有流程、工作流、数据以及底层软硬件的组合。NADP 能够以一站式平台管理大量复杂的 AI 应用,并将模型开发效率提高 20 倍,从而缩短自动驾驶汽车的上市周期,开发出更新、更快的架构。

在模型训练、测试和部署的过程中,为了确保新改进能够切实地解决相应问题,且不会引发任何新问题, NADP 需要执行 10 万项推理任务,包括数据挖掘、仿真和回归测试。经过众多方案的对比和筛选,蔚来选用了NVIDIA Triton 推理服务器作为核心组件,构建了 NADP 的高性能推理服务。

正如白宇利在分享中提到:“我们基于 NVIDIA Triton 推理服务器构建了高性能推理服务。此服务非常适用于 NADP,并可轻松集成模型仓库、工作流、Jupyter、Prometheus 和许多其他组件,从而简化 AI 推理。Triton 让编排和扩展变得更轻松,还能将推理速度提高至 6 倍,并可节省 24% 的资源。”

蔚来基于 NVIDIA Triton 搭建的推理服务平台,在数据挖掘业务场景下,通过服务器端模型前处理和多模型 DAG 式编排,GPU 资源平均节省 24%;在部分核心 pipeline 上,吞吐能力提升为原来的 5 倍,整体时延降低为原来的 1/ 6。

Triton 在设计之初,就融入了云原生的设计思路,为后面逐步围绕 Triton 搭建完整的云原生平台性推理解决方案提供了相当大的便利。

作为 NADP 推理平台的核心组件,Triton 与 NADP 的各个组件形成了一套完整的推理一站式解决方案。从集成效率、高性能、易用性、高可用四方面,在 NADP 推理平台中提供助力。

目前,NADP 数据挖掘业务下的相关模型预测服务已经全部迁移至 Triton 推理服务器,为上百个模型提供了高吞吐预测能力。同时在某些任务基础上,通过自实现前处理算子、前后处理服务化、BLS 串联模型等手段,将一些模型任务合并起来,极大的提升了处理效率。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5726

    浏览量

    110292
  • 自动驾驶
    +关注

    关注

    795

    文章

    15057

    浏览量

    181994
  • 蔚来
    +关注

    关注

    1

    文章

    613

    浏览量

    15282

原文标题:成功案例:蔚来 NADP + NVIDIA Triton,搭建稳定高效的推理平台

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安森美与汽车扩大战略合作

    安森美(onsemi)进一步深化与(NIO)的长期战略合作,助力加速向下一代900V 高压电动汽车平台转型。双方的合作基于安森美El
    的头像 发表于 05-06 10:17 748次阅读

    哥斯达黎加首家中心正式开业

    当地时间3月26日,公司在哥斯达黎加的首家门店——中心|圣何塞正式开业。驻哥斯达黎加使馆参赞俞善君等嘉宾出席开业仪式并剪彩。该门店由
    的头像 发表于 03-30 14:34 258次阅读

    是德科技推出全新AI推理仿真平台

    是德科技(NYSE: KEYS)近日推出KAI推理构建器(Keysight AI Inference Builder),这款仿真与分析平台旨在大规模验证针对推理进行优化的AI基础设施。是德科技将在
    的头像 发表于 03-20 17:27 899次阅读
    是德科技推出全新AI<b class='flag-5'>推理</b>仿真<b class='flag-5'>平台</b>

    匈牙利首家国家总代理门店开业

    当地时间1月22日,在匈牙利迎来重要里程碑——位于布达佩斯的NIO AutoWallis Showroom正式开业。这是在匈牙利落地的首家国家总代理门店,标志
    的头像 发表于 01-27 14:42 625次阅读

    NVIDIA DGX SuperPOD为Rubin平台横向扩展提供蓝图

    NVIDIA DGX Rubin 系统整合了 NVIDIA 在计算、网络和软件领域的最新突破,将推理 token 成本降至 NVIDIA Blackwell
    的头像 发表于 01-14 09:14 1003次阅读

    如何在NVIDIA Jetson AGX Thor上通过Docker高效部署vLLM推理服务

    继系统安装与环境配置后,本期我们将继续带大家深入 NVIDIA Jetson AGX Thor 的开发教程之旅,了解如何在 Jetson AGX Thor 上,通过 Docker 高效部署 vLLM 推理服务
    的头像 发表于 11-13 14:08 4549次阅读
    如何在<b class='flag-5'>NVIDIA</b> Jetson AGX Thor上通过Docker高效部署vLLM<b class='flag-5'>推理</b><b class='flag-5'>服务</b>

    NVIDIA TensorRT LLM 1.0推理框架正式上线

    TensorRT LLM 作为 NVIDIA 为大规模 LLM 推理打造的推理框架,核心目标是突破 NVIDIA 平台上的
    的头像 发表于 10-21 11:04 1557次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 2139次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型发布

    积算科技上线赤兔推理引擎服务,创新解锁FP8大模型算力

    北京2025年7月30日 /美通社/ -- 近日,北京积算科技有限公司(以下简称"积算科技")宣布其算力服务平台上线赤兔推理引擎。积算科技PowerFul-AI应用开发平台与赤兔合作,
    的头像 发表于 07-30 21:44 1132次阅读

    能源实现海南换电县县通

    随着换电站在海南白沙黎族自治县、昌江黎族自治县、保亭黎族苗族自治县、临高县同步上线,能源在海南正式实现换电县县通,41座换电站覆盖除三沙之外的海南岛23个区县,每个区县都有
    的头像 发表于 07-29 17:00 1316次阅读

    第1000座高速公路换电站上线运营

    近日,第1,000座高速公路换电站——换电站|G5011芜合高速福山服务区合肥方向正式上线运营,
    的头像 发表于 07-14 14:28 1166次阅读

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。这款先进的多模态大模型能够理解视频、进行物理
    的头像 发表于 07-09 10:17 1097次阅读

    公司6月交付新车24925台

    2025年6月,公司交付新车24,925台,同比增长17.5%。其中,品牌交付新车14,593台;乐道品牌交付新车6,400台;firefly萤火虫品牌交付新车3,932台。2
    的头像 发表于 07-04 18:21 1359次阅读

    使用NVIDIA Triton和TensorRT-LLM部署TTS应用的最佳实践

    针对基于 Diffusion 和 LLM 类别的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能显著提升推理速度。在单张 NVIDIA Ada Love
    的头像 发表于 06-12 15:37 2168次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS应用的最佳实践

    能源实现天津换电县县通

    近日,随着 换电站|天津和平安泊城市港湾 上线,能源在天津正式实现换电县县通,56座换电站覆盖全市16个区,每个区都有
    的头像 发表于 06-03 15:28 1278次阅读