0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力艾氪英诺打造稀疏卷积的最佳部署

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-10-14 09:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

基于 NVIDIA 的 GPU 解决方案,艾氪英诺持续拓宽产品在泛交通领域的自动驾驶-车路协同应用场景。

如何完成稀疏卷积的高效推理部署

成为一大挑战

点云检测算法 PointPillars 等衍生算法采用 2D 卷积,可以快速适配主流的算法框架便于落地部署,因而受到业界欢迎。但 Pillar 编码与 2D 卷积结合的方式,并不能充分利用点云空间的三维特征,研究与实践表明,基于 3D 卷积的 Voxel-based 方式则在识别准确率提升方面效果显著,其中稀疏卷积在自动驾驶相关感知算法越来越受到广泛重视。

现阶段业内十分需要面向 NVIDIA 设备成熟的 3D 点云感知压缩算法部署工具,能够将稀疏卷积部署到 NVIDIA GPU 上,在 3D 点云感知算法高精度需求下,满足推理效率指标的工程落地要求。因此,如何利用 TensorRT 深度学习推理引擎的完整工具,完成稀疏卷积的高效推理部署的工程化落地成为一大挑战。

NVIDIA TensorRT 高性能推理库

助力艾氪英诺打造稀疏卷积的最佳部署

艾氪英诺所研发的部署工具 EE-DLVM 基于 TensorRT 开发。TensorRT 通过结合抽象出特定硬件细节的高级 API 和优化推理的实现来达到高吞吐量、低延迟和低设备内存占用。该部署工具兼容主流检测模型同时针对稀疏卷积操作进行了设计与优化,将 TensorRT 在 NVIDIA GPU 上加速效果与稀疏卷积算子本身的优异效果相结合。

艾氪英诺 EE-DLVM 部署工具通过在稀疏卷积相关算子的实践,在 3D 点云基于 Voxel 感知算法模型部署上取得三点突破:

(1)针对稀疏卷积的相关模型而设计的 Graph Trace 程序,可以跟踪数据流向,然后转化为 Graph 并成功导出 ONNX。

(2)前处理模块使用了稀疏卷积,在 EE-DLVM 部署工具优化下有高达 20 倍左右加速效果。

(3)将模型准确高效地部署到 NVIDIA GPU 上,如 Xavier NX 和 AGX Orin 上。

借力 NVIDIA 技术,艾氪英诺在自动驾驶-车路协同领域持续深耕创新

基于城市与高速等多种智慧交通场景,以及路侧与车端的感知任务体系中,基于激光雷达的 3D 物体检测是重要的感知信号来源,也是车路协同感知系统的核心之一,因此需要充分地考虑算法实时性和准确性的平衡。TensorRT 作为 NVIDIA 的深度学习推理引擎,可以为艾氪英诺相关自动驾驶算法应用提供低延迟、高吞吐率的部署推理。模型获得 TensorFlow、PyTorch、Caffe 等主流训练框架支持,在模型优化与编译过程中,已经支持混合精度、PTQ 和 QAT 量化训练,是在行业应用中最为普及的加速框架,适用于算法模型部署于嵌入端、云端以及汽车硬件平台上运行。

——艾氪英诺联合创始人 陈朋鑫博士

艾氪英诺的 EE-DLVM 部署工具,将稀疏卷积成功结合到 NVIDIA TensorRT 加速框架中。产品基于稀疏卷积强大的性能,在众多交通场景的算法部署中,得到广泛应用和迭代。产品采用 NVIDIA 系列的硬件平台,在兼顾了数据长度可变的点云数据特性同时可利用 TensorRT 的结构化加速特性,成功实现了 3D 点云细粒度结构化稀疏在自动驾驶场景中的应用。同时,为了构建高效、透明、安全的车路协同感知网络体系,与 NVIDIA 初创加速计划共享生态合作成果,在后续的产品规划中,将会逐步开源产品的所有源代码,其中也会包括稀疏卷积组件部分。

——艾氪英诺技术副总 叶溯

通过 NVIDIA 初创加速计划,艾氪英诺利用会员专享的 NVIDIA 深度学习培训中心(DLI)免费课程机会,结合 NVIDIA 初创加速计划提供的 NVIDIA 技术与专家资源,对 EE-DLVM 部署工具进行深入的技术沟通与产品打磨。同时借助今年 8 月举办的 NVIDIA 初创企业展示华东站路演活动,亦得以将产品快速推广给潜在用户。在 NVIDIA 提供的 GPU 解决方案基石上,结合艾氪英诺在行业与技术上的认知,使得我们在自动驾驶-车路协同领域能够持续不断地深耕技术、创新产品,通过 AI 技术降本增效,拓宽产品在泛交通领域的应用场景。

——艾氪英诺创始人兼 CEO 张磊

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2992

    浏览量

    113846
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109110
  • API
    API
    +关注

    关注

    2

    文章

    2160

    浏览量

    66251
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123917

原文标题:NVIDIA助力艾氪英诺打造稀疏卷积在TensorRT上的最佳实践

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安森美联手赛科!中低压GaN器件渗透加速

    电子发烧友网报道(文/梁浩斌)12月3日,安森美宣布与赛科签署了谅解备忘录,双方将评估加速40V-200V氮化镓功率器件部署的合作机会,基于
    的头像 发表于 12-04 07:42 9743次阅读

    达亮相IIC Shenzhen 2025

    2025年11月25日,国际集成电路展览会暨研讨会(IIC Shenzhen)在深圳举办,达创始人及CEO王琦博士应邀出席,并于“全球CEO峰会”发表题为《低功耗设计新范式:突破算力芯片能效瓶颈》的主旨演讲,引发行业广泛关注。
    的头像 发表于 12-03 10:53 240次阅读

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署
    的头像 发表于 10-29 16:59 1023次阅读

    纳芯微与联合电子、赛科签署战略合作协议

    近日,苏州纳芯微电子股份有限公司(以下简称:纳芯微)、联合汽车电子有限公司(以下简称:联合电子)与赛科(苏州)科技股份有限公司(以下简称:赛科)共同签署战略合作协议。
    的头像 发表于 10-13 11:41 2350次阅读

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心将采用 NVIDIA 系统,包含数百万块 NVIDIA GPU,为 Open
    的头像 发表于 09-23 14:37 1218次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布达成合作,<b class='flag-5'>部署</b>10吉瓦<b class='flag-5'>NVIDIA</b>系统

    达荣获“中国芯”EDA产品革新奖

    2025年9月15日,“中国芯”第二届EDA专项奖颁奖仪式在杭州举行,达的EnFortiusLPC低功耗设计检查工具(ELPC)凭借其卓越的技术创新与市场表现,荣获“产品革新奖”。这一殊荣不仅是对ELPC产品价值的高度认可,更是对
    的头像 发表于 09-16 10:47 3126次阅读

    瑞声科技与极9X合作树立车载声学新标杆

    8月24日,以“声临奢境”为主题的极9X音响品鉴会在上海中心极旗舰店圆满落幕。瑞声科技作为极9X技术合作伙伴,为本次活动提供了全程支持。基于对极致声学体验的共同追求,瑞声科技与极
    的头像 发表于 08-28 15:57 720次阅读

    赛科推出基于InnoGaN ISG6121TD的4kW双向PFC电源方案,助力智能电网高效发展

    赛科推出基于InnoGaN ISG6121TD的4kW双向PFC电源方案,以其高效、节能的特性,为智能电网提供突破性支持。 该方案采用AC-DC无桥图腾柱PFC拓扑,设计紧凑,支持双向工作,内置
    的头像 发表于 06-23 10:34 2706次阅读
    <b class='flag-5'>英</b><b class='flag-5'>诺</b>赛科推出基于InnoGaN ISG6121TD的4kW双向PFC电源方案,<b class='flag-5'>助力</b>智能电网高效发展

    NVIDIA携手德借助AI加速药物研发

    NVIDIA 宣布与德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持德与丹麦 AI 创新中心 (DCAI) 关于使
    的头像 发表于 06-12 15:49 986次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 1002次阅读

    英伟达GTC2025亮点:NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    ,现在已将企业存储纳入其中,旨在通过加速计算、网络、软件和存储,助力企业更高效地部署 AI 工厂。 在企业构建 AI 工厂的过程中,获取高质量数据对于确保 AI 模型的卓越性能和可靠性至关重要。 在 NVIDIA GTC 全球
    的头像 发表于 03-21 19:38 1719次阅读

    达邀您相约2025中国RISC-V生态大会

    2月27日至28日,2025中国RISC-V生态大会将在北京隆重举行,达将出席此次会议并在“高性能计算分论坛”发表主题演讲,深入探讨RISC-V芯片设计中的关键技术挑战,分享
    的头像 发表于 02-19 11:41 1220次阅读

    赛科登陆港交所,氮化镓功率半导体领域明星企业闪耀登场

    近日,全球氮化镓(GaN)功率半导体领域的佼佼者赛科(2577.HK)成功登陆港交所主板,为港股市场增添了一枚稀缺且优质的投资标的。 赛科作为全球首家实现量产8
    的头像 发表于 01-06 11:29 1060次阅读

    赛科港股上市!盈利能力逐年上升,估值超234亿元

    电子发烧友网报道(文/莫婷婷)2024年6月,赛科(珠海)科技有限公司(以下简称“赛科”)向港交所递交了上市申请。同年12月,
    的头像 发表于 12-30 00:11 7460次阅读
    <b class='flag-5'>英</b><b class='flag-5'>诺</b>赛科港股上市!盈利能力逐年上升,估值超234亿元

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    以及边缘计算能力的增强,越来越多的目标检测应用开始直接在靠近数据源的边缘设备上运行。这不仅减少了数据传输延迟,保护了用户隐私,同时也减轻了云端服务器的压力。然而,在边缘端部署高效且准确的目标检测模型
    发表于 12-19 14:33