0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

商汤科技SenseTime 来源:未知 2023-06-22 06:15 次阅读
一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR 2023闪亮的成绩单。6月18日-22日,全球计算机视觉盛会CVPR 2023(Computer Vision and Pattern Recognition)在加拿大温哥华举行。

本届CVPR论文投稿总量达9155篇,最终共有2369篇论文被接收。最佳论文候选为12篇,接收率仅为0.13%。商汤及联合实验室2篇论文登上最佳论文候选名单(Award Candidate),其中自动驾驶研究论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)斩获本届CVPR最佳论文奖(Best Paper Award)

这是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 标志着自动驾驶技术的重要突破, 为自动驾驶技术与产业的发展提出了新的方向。

CVPR 2023最佳论文,自动驾驶研究获重要突破 自动驾驶技术高度复杂,需要融合多学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。自动驾驶还需要适应不同的道路规则和交通文化,与车辆和行人进行良好交互,以实现高度可靠和安全的自动驾驶系统。

大部分自动驾驶相关的工作都聚焦在具体的某个模块,关于框架性的研讨则相对匮乏。

商汤及联合实验室CVPR 2023 Best Paper提出的自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于Transformer 的端到端网络框架下,更高效契合了“多任务”和“高性能”的特点,取得自动驾驶技术研究重要突破。

623268e6-1080-11ee-962d-dac502259ad0.jpg自动驾驶UniAD框架对比(a)模块化(b)多任务模块(c)端到端自动驾驶模块

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,UniAD是业内首个感知决策一体化的端到端自动驾驶解决方案,并且整体系统和性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。

端到端的优化在多项关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。

625cb90c-1080-11ee-962d-dac502259ad0.jpg点击可查看高清图

UniAD 是一项极具创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。

随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来能推动实现更高阶的自动驾驶人工智能

CVPR 2023最佳论文候选,加速推动AIGC时代真实感3D内容生成

面向真实 3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题。由于缺乏大规模的真实扫描三维数据库,最近在三维物体建模方面的进展大多依赖于合成数据集。

为促进现实世界中3D感知、重建和生成的发展,商汤及联合实验室CVPR 2023 Best Paper候选论文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一个具有大规模高质量真实扫描3D物体的大型词汇3D物体数据集,覆盖近200个类别、约6000个三维物体数据,包括高精表面网格、点云、多视角渲染图像和实景采集的视频,借助专业扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D是目前学界最大的真实世界三维扫描模型数据集,为未来三维视觉研究提供了广阔空间。

利用该数据集,研究人员精心探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,验证其从感知、重建、到生成领域的开放应用前景,有望在AIGC 时代推动真实感3D生成方面发挥至关重要的作用。 持续引领前沿创新,是商汤在以大装置SenseCore和大模型为核心的AI基础设施领域长期投入,并坚持产学研协同创新的成果。

王晓刚教授认为,在大算力、大数据的支撑下,大模型将以更强大的通用能力引发人工智能领域的巨大变革,同时也会拓展我们的研究视野,激发新一轮研究范式革新。

自今年4月初“商汤日日新SenseNova”大模型体系公布以来,商汤的大模型已在气象预报、遥感解译、开放环境中的决策问题等领域取得了诸多突破性成就。未来,商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。

62a784e6-1080-11ee-962d-dac502259ad0.gif

相关阅读,戳这里

《CVPR 2022丨商汤再创佳绩,用技术创新直击行业痛点》

62c2e84e-1080-11ee-962d-dac502259ad0.jpg


原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    417

    浏览量

    35879

原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技联合海通证券发布业内首个面向金融行业的多模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的多模态全栈式大
    的头像 发表于 04-26 09:48 75次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>联合</b>海通证券发布业内<b class='flag-5'>首个</b>面向金融行业的多模态全栈式大<b class='flag-5'>模型</b>

    未来已来,多传感器融合感知自动驾驶破局的关键

    驾驶的关键的是具备人类的感知能力,多传感器融合感知正是自动驾驶破局的关键。昱感微的雷视一体多传感器融合方案就好像
    发表于 04-11 10:26

    LabVIEW开发自动驾驶的双目测距系统

    LabVIEW开发自动驾驶的双目测距系统 随着车辆驾驶技术的不断发展,自动驾驶技术正日益成为现实。从L2级别的辅助驾驶技术到L3级别的受条件约束的
    发表于 12-19 18:02

    农机自动驾驶显示系统组成部分以及配置

    、卫星导航以及其他基站定位系统等。 基于目前市场上对自动驾驶系统的需求,墨翟科技研发了款10.1英寸一体化的车载电脑,专为农业精耕、工程机械应用而设计的升级产品。该产品经过实际的农业耕种环境应用至今
    发表于 10-17 17:52

    【KV260视觉入门套件试用体验】八、VITis AI自动驾驶多任务执行MultiTask V3

    模型,旨在同时执行自动驾驶场景中的不同任务,同时实现优异的性能和效率。这些任务包括对象检测、分割、车道检测、可行驶区域分割和深度估算,这些都是自动驾驶
    发表于 09-26 16:43

    物联网应用之智慧档案馆八防十防一体化平台

    种智能档案馆八防九防十防十二防一体化监控系统方案,该方案强调集成化、可视一体化、联动
    发表于 09-14 10:33

    CVPR上的新顶流:BEV自动驾驶感知新范式

    BEV自动驾驶感知好比一个从高处统观全局的“上帝视角”,将三维环境信息投影到二维平面,以俯视视角展示环境中的物体和地形。在路径规划、障碍物检测、自动驾驶决策等方面,BEV
    的头像 发表于 08-23 14:51 734次阅读
    <b class='flag-5'>CVPR</b>上的新顶流:BEV<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>新范式

    浅析自动驾驶视觉感知算法

    环境感知自动驾驶的第一环,是车辆和环境交互的纽带。一个自动驾驶系统整体表现的好坏,很大程度上都取决于感知系统的好坏。目前,环境感知技术有两
    发表于 07-25 10:36 386次阅读
    浅析<b class='flag-5'>自动驾驶</b>视觉<b class='flag-5'>感知</b>算法

    MWCS 2023丨业界首个!天翼交通联合中兴通讯共同推进智慧车联网

    6月28日-30日,上海世界移动通信大会期间,天翼交通联合中兴通讯发布了业界首个5G+车路云一体化智慧车联网,同时双方达成战略合作共识,持续深入推进自动驾驶服务商用。 随着智能网联汽车
    的头像 发表于 06-30 17:15 283次阅读
    MWCS 2023丨业界<b class='flag-5'>首个</b>!天翼交通<b class='flag-5'>联合</b>中兴通讯共同推进智慧车联网

    地平线促进自由开放的学术研究 推动自动驾驶技术发展

    Autonomous Driving”从近万篇投稿中脱颖而出。论文中提出“感知决策一体化”的自动驾驶
    的头像 发表于 06-27 11:40 448次阅读

    石油石化室内外一体化定位解决方案

    一体化
    中海达
    发布于 :2023年06月21日 11:44:11

    HarmonyOS元服务端云一体化开发快速入门(下)

    界面,可查看刚刚新建的工程。关于工程的详细目录结构介绍,请参见端云一体化开发工程介绍。 ** 五、 工程初始配置** 当您成功创建工程并关联云开发资源后,DevEco Studio会为您的工程自动
    发表于 06-15 15:52

    自动驾驶发展历史及核心技术

    、人工智能及自动控制等技术,是典型的高新技术综合体,自动驾驶便与之有着异曲同工之妙。自动驾驶的核心技术依次可以分为环境感知、行为决策、 路
    发表于 06-02 15:57 0次下载
    <b class='flag-5'>自动驾驶</b>发展<b class='flag-5'>历史</b>及核心技术

    探讨自动驾驶系统感知系统

    随着汽车行业不断发展,技术开发人员、科研人员等对自动驾驶的研究越来越火爆。自动驾驶并不是一项单一的技术,而是汽车电子、智能控制以及互联网等技术发展融合的产物,其原理为自动驾驶系统通过感知
    的头像 发表于 05-17 11:10 924次阅读
    探讨<b class='flag-5'>自动驾驶</b>系统<b class='flag-5'>感知</b>系统

    聊聊自动驾驶感知系统

    自动驾驶赛道中,感知的目的是为了模仿人眼采集相关信息,为后续做决策提供必要的信息。根据所做决策的任务不同,感知可以包括很多子任务:如车道线
    的头像 发表于 05-17 10:58 823次阅读
    聊聊<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>系统