0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

商汤科技SenseTime 来源:未知 2023-06-22 06:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR 2023闪亮的成绩单。6月18日-22日,全球计算机视觉盛会CVPR 2023(Computer Vision and Pattern Recognition)在加拿大温哥华举行。

本届CVPR论文投稿总量达9155篇,最终共有2369篇论文被接收。最佳论文候选为12篇,接收率仅为0.13%。商汤及联合实验室2篇论文登上最佳论文候选名单(Award Candidate),其中自动驾驶研究论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)斩获本届CVPR最佳论文奖(Best Paper Award)

这是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 标志着自动驾驶技术的重要突破, 为自动驾驶技术与产业的发展提出了新的方向。

CVPR 2023最佳论文,自动驾驶研究获重要突破 自动驾驶技术高度复杂,需要融合多学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。自动驾驶还需要适应不同的道路规则和交通文化,与车辆和行人进行良好交互,以实现高度可靠和安全的自动驾驶系统。

大部分自动驾驶相关的工作都聚焦在具体的某个模块,关于框架性的研讨则相对匮乏。

商汤及联合实验室CVPR 2023 Best Paper提出的自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于Transformer 的端到端网络框架下,更高效契合了“多任务”和“高性能”的特点,取得自动驾驶技术研究重要突破。

623268e6-1080-11ee-962d-dac502259ad0.jpg自动驾驶UniAD框架对比(a)模块化(b)多任务模块(c)端到端自动驾驶模块

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,UniAD是业内首个感知决策一体化的端到端自动驾驶解决方案,并且整体系统和性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。

端到端的优化在多项关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。

625cb90c-1080-11ee-962d-dac502259ad0.jpg点击可查看高清图

UniAD 是一项极具创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。

随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来能推动实现更高阶的自动驾驶人工智能

CVPR 2023最佳论文候选,加速推动AIGC时代真实感3D内容生成

面向真实 3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题。由于缺乏大规模的真实扫描三维数据库,最近在三维物体建模方面的进展大多依赖于合成数据集。

为促进现实世界中3D感知、重建和生成的发展,商汤及联合实验室CVPR 2023 Best Paper候选论文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一个具有大规模高质量真实扫描3D物体的大型词汇3D物体数据集,覆盖近200个类别、约6000个三维物体数据,包括高精表面网格、点云、多视角渲染图像和实景采集的视频,借助专业扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D是目前学界最大的真实世界三维扫描模型数据集,为未来三维视觉研究提供了广阔空间。

利用该数据集,研究人员精心探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,验证其从感知、重建、到生成领域的开放应用前景,有望在AIGC 时代推动真实感3D生成方面发挥至关重要的作用。 持续引领前沿创新,是商汤在以大装置SenseCore和大模型为核心的AI基础设施领域长期投入,并坚持产学研协同创新的成果。

王晓刚教授认为,在大算力、大数据的支撑下,大模型将以更强大的通用能力引发人工智能领域的巨大变革,同时也会拓展我们的研究视野,激发新一轮研究范式革新。

自今年4月初“商汤日日新SenseNova”大模型体系公布以来,商汤的大模型已在气象预报、遥感解译、开放环境中的决策问题等领域取得了诸多突破性成就。未来,商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。

62a784e6-1080-11ee-962d-dac502259ad0.gif

相关阅读,戳这里

《CVPR 2022丨商汤再创佳绩,用技术创新直击行业痛点》

62c2e84e-1080-11ee-962d-dac502259ad0.jpg


原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    626

    浏览量

    37702

原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    隆基首个欧洲储能一体化项目并网投运

    近日,隆基在意大利成功完成首个欧洲储能一体化项目的并网投运。项目配置13.75MW/50.16MWh储能系统与35MWp光伏电站协同运行,标志着隆基在欧洲市场的布局迈出坚实步。
    的头像 发表于 04-24 09:24 587次阅读

    什么是安消一体化物联网系统云平台--安防消防一体化物联网系统云平台简称安消一体化云平台

    安防消防一体化系统、大型场馆消防安防一体化系统平台、大型场馆消防安防指挥中心一体化系统平台、工厂消防安防一体化系统平台
    的头像 发表于 04-14 08:59 680次阅读

    西井科技携手两大高校研究团队发布自动驾驶感知合作成果

    自动驾驶、具身智能等智慧物流高速动态场景中,视觉感知的“反应速度”直接决定技术落地的安全性与可靠性。近日,西井科技与同济大学长聘教授、上海创智学院全时导师陈广研究团队联合研究成果成
    的头像 发表于 03-20 10:22 660次阅读
    西井科技携手两大高校研究<b class='flag-5'>团队</b>发布<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>合作成果

    Nullmax研发团队静态元素检测和拓扑推理新成果入选CVPR 2026

    CVPR 2026(国际计算机视觉与模式识别会议)论文录用结果揭晓,Nullmax 研发团队自动驾驶静态元素理解领域的最新研究 TopoHR 成功入选。该研究为静态元素检测以及拓扑推
    的头像 发表于 02-28 10:08 733次阅读

    高校自动驾驶研究新基建:“实测 - 仿真” 一体化数据采集与验证平台

    本项目客户为国内所以智能驾驶为核心研究方向的高校科研团队团队长期聚焦于自动驾驶感知、定位与系
    的头像 发表于 01-27 17:34 1392次阅读
    高校<b class='flag-5'>自动驾驶</b>研究新基建:“实测 - 仿真” <b class='flag-5'>一体化</b>数据采集与验证平台

    自动驾驶模型中常提的泛能力是指啥?

    [首发于智驾最前沿微信公众号]在讨论自动驾驶模型时,常会有几个评价维度,如感知是否准确、决策是否稳定、系统是否足够鲁棒,以及模型有没有“泛
    的头像 发表于 12-10 09:15 1002次阅读
    <b class='flag-5'>自动驾驶</b>大<b class='flag-5'>模型</b>中常提的泛<b class='flag-5'>化</b>能力是指啥?

    感知 - 传输 - 管理 - 决策一体化:配电房监控系统设备及配套辅材

    法满足现代工商业及居民社区对电力连续、安全、高效供应的核心需求。 改造方案主张: 以“降本、提效、保安全”为根本目标,通过构建“感知-传输-管理-决策一体化的智能监控系统,实现配电房“状态全可视、故障早预警、运维远程
    的头像 发表于 11-07 09:44 535次阅读
    “<b class='flag-5'>感知</b> - 传输 - 管理 - <b class='flag-5'>决策</b>” <b class='flag-5'>一体化</b>:配电房监控系统设备及配套辅材

    多参数一体化水文自动监测站的设计与应用优势解析

    种集成了多种传感功能的一体化监测方案,它旨在为水文环境监测提供种更紧凑、更高效的硬件解决思路。、核心突破:多参数一体化硬件集成这款由金叶仪器推出
    的头像 发表于 10-23 14:21 471次阅读
    多参数<b class='flag-5'>一体化</b>水文<b class='flag-5'>自动</b>监测站的设计与应用优势解析

    佑驾创新中标桐乡市车路云一体化城市交通融合感知项目

    近日,佑驾创新(MINIEYE)正式收到中标通知书,确认成为桐乡市车路云一体化城市交通融合感知项目(2025年自动驾驶公交车采购项目)中标单位,中标金额达1185万元。
    的头像 发表于 10-21 17:05 904次阅读

    一体化ROS智能驾驶小车及实训教学平台解决方案

    一体化ROS智能驾驶小车及实训教学平台解决方案
    的头像 发表于 09-26 17:34 2004次阅读
    <b class='flag-5'>一体化</b>ROS智能<b class='flag-5'>驾驶</b>小车及实训教学平台解决方案

    自动驾驶感知决策、控制都起到什么作用?

    自动驾驶感知决策与控制是个高度耦合的系统工程。感知负责把复杂、噪声且有不确定性的外界信息转换为具有语义和概率描述的内部状态;
    的头像 发表于 08-31 15:40 1997次阅读
    <b class='flag-5'>自动驾驶</b>中<b class='flag-5'>感知</b>、<b class='flag-5'>决策</b>、控制都起到什么作用?

    如何确保自动驾驶汽车感知的准确性?

    感知的定义及原理 在聊这个话题之前,我们先聊感知是什么,自动驾驶感知系统就是个把外界变成机
    的头像 发表于 08-23 15:06 1892次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车<b class='flag-5'>感知</b>的准确性?

    ALVA技术重塑工业智能感知决策边界

    无论是西门子构建的工业 AI 交易中心,还是微软推出的工厂运营智能,其本质都在验证个趋势——工业智能的核心竞争力,正从单
    的头像 发表于 07-22 14:32 1667次阅读

    自动驾驶中常提的世界模型是个啥?

    种对外部环境进行抽象和建模的技术,让自动驾驶系统在个简洁的内部“缩影”里,对真实世界进行描述与预测,从而为感知决策和规划等关键环节提供有力支持。 什么是世界
    的头像 发表于 06-24 08:53 1485次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    感知层、传输层、应用层一体化:工控一体机厂家聚徽详解集成技术方案

    在工业 4.0 和智能制造蓬勃发展的时代浪潮中,工控一体机作为工业自动化领域的核心设备,正发挥着越来越关键的作用。它集感知、传输、处理与应用等多种功能于一体,通过高度集成化的技术方案,
    的头像 发表于 05-27 14:35 1537次阅读