0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 支撑自动驾驶车端云端同步迈入高算力大模型时代

NVIDIA英伟达 来源:未知 2023-03-19 22:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我国汽车产业发展迅速,汽车智能化大势所趋,自动驾驶所需的算力需求高速增长。为了加速自动驾驶生态发展,阿里云自动驾驶加速器与行业领先的主机厂、投资机构携手,结合自身技术、产品、业务资源,为自动驾驶创新企业提供多项支持。

3 月 10-11 日,NVIDIA 开发与技术部门亚太区总经理李曦鹏应邀出席阿里云自动驾驶加速器第一次线下集结活动并发表主题演讲《NVIDIA支撑自动驾驶车端云端同步迈入高算力大模型时代》,演讲分享了自动驾驶领域 AI 的研发趋势和解决方案。

1cb857a6-c663-11ed-bfe3-dac502259ad0.png

NVIDIA 开发与技术部门亚太区总经理李曦鹏

图片来源:阿里云自动驾驶加速器

以下为演讲内容:

自动驾驶需要通过大量的传感器获取环境信息,然后对这些数据进行处理和分析,而加速计算可以提供更快的数据处理速度和更高的精度。加速计算不仅对自动驾驶行业十分关键,也在数据处理、互联网和医疗等领域扮演着重要的角色,促进了这些行业的发展。

车端算力对于加速汽车智能化非常重要。作为自动驾驶链条的基础,车上的大算力芯片和解决方案是必不可少的。NVIDIA DRIVE 平台是全球最常用的自动驾驶平台之一,提供各种芯片和解决方案,包括车端、数据中心仿真解决方案。

安全是开发自动驾驶的第一要务,更大的算力可以提高安全性。NVIDIA 在 2022 年秋季 GTC 宣布的 NVIDIA DRIVE Thor SoC 车规级系统芯片,可实现最高 2000 TOPS AI 算力以及 2000 TFLOPS 浮点算力,可以在单个计算平台整合全车的智驾和座舱功能,为未来的算法和应用发展预留足够空间。

应用和算力需要相互匹配,并且算力的发展需要一定的超前性以留给算法和应用发展足够的空间。近年来,BEV 和 Transformer 在深度学习领域取得了出色的效果,并带来了很大的效率提升。但同时也对计算量提出了更高的要求,因此出现了一些革命性的技术。

例如 Transformer Engine 和专门做 Transformer block 计算的技术等。除了 BEV 和 Transformer,NVIDIA 也针对各种其它模型,与云服务合作伙伴在云端进行训练和预测加速。对于现代加速的集群,其运行应用类别非常多,包括仿真、AI、scientific AI、数字孪生、量子计算等等,而这些应用都是典型的加速计算集群的应用。

当前,硬件性能提升放缓,每年只有 1.1 倍左右,五年期望的 10 倍提升实际只有 2 倍,十年期望的100倍提升只有 4 倍。此时,如果使用加速计算,每年保持 1.6 倍的提速,将为工作负载提供充足算力,成为应对性能瓶颈的重要解决方案。同时,也需要注意到成本问题,包括单个晶体管价格逐年增加、能源消耗、机房建设、供电等问题,因此需要更多的加速计算来降低成本和提高效率。

在自动驾驶领域,NVIDIA 能够提供丰富的工具和解决方案,帮助用户完成AI模型端到端的流程。对于数据预处理,NVIDIA 可以提供结构化和非结构化数据的处理工具,还可以进行图像处理,确保训练和预测的一致性。在训练方面,NVIDIA 可以提供不同的框架,同时也会关注模型的推理。在云端部署时,NVIDIA 提供大规模部署的工具。

NVIDIA 相信未来 10 年内,所有计算任务都将被加速,而 NVIDIA 已经为此做好了准备。加速计算的特点和意义在于,可以提高工作效率、降低成本、提升用户体验,同时也推动产业信息化融合的发展。这些特点和意义决定了 NVIDIA 的工作方式,即与客户和合作伙伴深度合作,根据客户需求设计出最适合的解决方案,共同进步。

1d579bfe-c663-11ed-bfe3-dac502259ad0.png

加速计算的特点总结如下:

  • 性能数量级上的提升:加速计算可以使模型性能有数十倍甚至上百倍的提升。

  • 应用特异性:上层应用需要根据具体业务场景进行优化,没有一劳永逸的方法。

  • 找出瓶颈:需要从应用自上而下寻找性能瓶颈,然后加速这些瓶颈,以达到整体性能的提升。

  • 端到端的优化:AI 加速器算法的核心是优化,端到端的优化需要软件协同设计,需要业务、算法、工程人员和优化工程师共同配合。

自动驾驶软件产品研发特点如下三点:

  • 第一,自动驾驶的端到端开发需要加速数据模型的流转,并让数据信息充分利用。例如在车端采集数据,需要对这些数据进行高效的利用,在云端进行自动打标或者模型训练、数据推理等过程,让数据从采集到被利用整个过程尽可能快。

  • 第二,云端的训练、预测,车端的验证和部署需要保持模型和数据的对齐。不同的训练框架、预处理库和数据处理方式会导致模型和数据不对齐,因此需要将整个过程自动化起来并做到统一管理。

  • 第三,如果车端和云端的算力出现问题时,需要设计更多创新性的大模型来解决实际的问题。

在云上,自动驾驶应用需要处理大量数据的采集、管理和筛选,数据管理包括人工和自动打标,还需进行模型训练和 REPLAY 验证。如果采集车数量够多,数据采集的长尾效应可以减少单辆车的数据量,但考虑到量产车的数量,数据处理必须更智能、高效。这已然成为自动驾驶企业的共识,而 NVIDIA 也将与云服务合作伙伴,结合在其他行业卓有成效的经验和成果,帮助企业落地相关能力。

总的来说,AI 加速计算可以大幅提升自动驾驶应用的性能,但对于不同的应用场景需要采用特定的方法进行优化。例如在视觉计算领域,Swin-transformer 模型在自驾行业有很好的应用场景,并且训练吞吐可以提高 2.3 倍,从而降低训练时间,提高模型验证和上线速度。

另外,CV-CUDA 开源库是一个通用的高性能图像处理加速库,适用于不同行业的 AI 成像前后处理,目前已经被短视频行业、自动驾驶行业和地图行业等多个领域广泛采用。仅就前处理而言,就可以减少训练和预测中调试工作量,提升模型对齐效果,提升工作效率。

1d6f2206-c663-11ed-bfe3-dac502259ad0.png

加速计算需要软硬协同设计,仅依靠单一优化手段,很难达到效果,需要尽可能自上而下得去加速更多环节。AI 的核心是加速,而加速的核心是优化,这需要算法和优化工程师配合完成。

在自动驾驶领域,NVIDIA 将与云服务合作伙伴,依托其他领域的成功经验和成果,为车企和自动驾驶企业,提供端到端的全栈式 AI 加速计算解决方案。

即刻点击 “阅读原文”扫描下方海报二维码,锁定 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 主题演讲!北京时间 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中国重播。深度解读 NVIDIA 加速计算平台如何推动人工智能、元宇宙、云技术和可持续计算的下一波浪潮。加入 GTC23,切勿错过 AI 的决定性时刻!


原文标题:NVIDIA 支撑自动驾驶车端云端同步迈入高算力大模型时代

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964

原文标题:NVIDIA 支撑自动驾驶车端云端同步迈入高算力大模型时代

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    提出的“快慢系统”理论启发,旨在让自动驾驶系统模拟人类的思考与决策过程。理想汽车结合与VLM模型,推出了业界首个在车部署的双系统方案
    的头像 发表于 11-22 10:59 2270次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    智能驾驶域控制器:规电容如何赋能车载场景?

    在智能驾驶域控制器的车载场景中,规电容通过 稳定供电、抑制噪声、缓冲能量、集成化设计 四大核心功能,为
    的头像 发表于 11-21 09:30 112次阅读
    智能<b class='flag-5'>驾驶</b>域控制器:<b class='flag-5'>车</b>规电容如何赋能<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b>车载场景?

    NVIDIA与Uber合作推进全球L4级自动驾驶移动出行网络

    NVIDIA 宣布与 Uber 达成合作,将共同扩展全球 L4 级自动驾驶移动出行网络。合作将依托 Uber 新一代无人驾驶出租车和自动配送车队,采用全新
    的头像 发表于 11-03 14:33 1041次阅读

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种
    发表于 10-27 13:12

    西井科技自动驾驶模型获得国际认可

    近日,西井科技AI创研团队在国际权威自动驾驶算法榜单NAVSIM v2中脱颖而出,凭借创新的自动驾驶模型,以综合得分48.759的成绩
    的头像 发表于 10-15 17:20 1052次阅读

    一文读懂特斯拉自动驾驶FSD从辅助到的演进

    、控制等环节各自负责不同的功能,各模块用显式代码和规则来完成任务。随着数据规模和增长,特斯拉开始把更多功能放到机器学习模型里,尤其是从2024年推出的V12(标注为“Supervised”)开始,特斯拉开始大幅度推进“
    的头像 发表于 10-11 09:13 385次阅读
    一文读懂特斯拉<b class='flag-5'>自动驾驶</b>FSD从辅助到<b class='flag-5'>端</b>到<b class='flag-5'>端</b>的演进

    自动驾驶模型为什么会有不确定性?

    。为了能让自动驾驶汽车做出正确、安全且符合逻辑的行驶动作,模型被提了出来。
    的头像 发表于 09-28 09:20 544次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b>到<b class='flag-5'>端</b>大<b class='flag-5'>模型</b>为什么会有不确定性?

    之间的群体智能会成为自动驾驶的未来吗?

    自动驾驶的发展过程中,人们最常提到的是“单车智能”。意思就是,车辆依靠自己的摄像头、雷达、算法和去感知环境、做出决策、完成驾驶。但单车智能能力有限,光靠一辆
    的头像 发表于 09-20 11:23 840次阅读

    赋能未来:自动驾驶如何从科幻驶入现实?

    当一辆汽车以120km/h飞驰时,每0.1秒的决策延迟就意味着3.3米的“生死距离”。而现在,自动驾驶车辆能在毫秒间完成刹车、变道甚至紧急避障——这背后,是在无声地重塑人类出行方式。感知系统
    的头像 发表于 09-16 11:40 498次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>赋能未来:<b class='flag-5'>自动驾驶</b>如何从科幻驶入现实?

    自动驾驶系统的越高就越好吗?

    处理更多的数据、更复杂的模型,并能在更短的时间内作出精准决策。那是否就代表着越高的自动驾驶系统就越好? 自动驾驶依赖于摄像头、激光雷达(
    的头像 发表于 08-11 18:30 653次阅读

    为什么自动驾驶模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶
    的头像 发表于 07-04 16:50 591次阅读
    为什么<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b>到<b class='flag-5'>端</b>大<b class='flag-5'>模型</b>有黑盒特性?

    新能源软件单元测试深度解析:自动驾驶系统视角

    ‌ AWS RoboMaker等云平台支持万级测试用例的并行执行。某自动驾驶初创企业利用云端GPU集群,将AI模型单元测试时间从3周缩短至6小时。 ‌标准体系演进‌ UL 4600标准要求单元测试需证明
    发表于 05-12 15:59

    自动驾驶中基于规则的决策和模型有何区别?

    自动驾驶架构的选择上,也经历了从感知、决策控制、执行的三段式架构到现在火热的模型,尤其是在2024年特斯拉推出FSD V12后,各车企更是陆续推出自家的
    的头像 发表于 04-13 09:38 3427次阅读
    <b class='flag-5'>自动驾驶</b>中基于规则的决策和<b class='flag-5'>端</b>到<b class='flag-5'>端</b>大<b class='flag-5'>模型</b>有何区别?

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、自动驾驶等需要海量数据并行计算的场景。随着 AI 与大数
    的头像 发表于 04-13 00:02 2610次阅读

    NVIDIA Halos自动驾驶汽车安全系统发布

    NVIDIA 整合了从云端的安全自动驾驶开发技术套件,涵盖车辆架构到 AI 模型,包括芯片
    的头像 发表于 03-25 14:51 966次阅读