0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤绝影真·端到端自动驾驶解决方案UniAD上车首秀

商汤科技SenseTime 来源:商汤科技SenseTime 2024-04-28 18:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型,广受好评!

6000亿参数的“日日新5.0”采用混合专家架构(MOE),具备更强的知识、数学、推理及代码能力,成为国内首个全面对标甚至超越GPT-4 Turbo的大模型,多模态能力领先GPT-4V。基于端云结合的架构,商汤端侧大模型大幅超越同量级大模型,越级比肩7B、13B大模型,更适合车端部署

依托“日日新SenseNova 5.0”行业领先硬核实力,商汤绝影打造了一系列大模型车端产品,并在2024北京车展“上车”首秀。

本届车展,商汤绝影参展的核心关键词是:原生态大模型、真·端到端自动驾驶UniAD“上车” 、多模态场景大脑和全新3D交互,带来AGI时代的全新出行体验。

智驾方面,商汤绝影首次向公众展示了面向量产的真·端到端自动驾驶解决方案UniAD(Unified Autonomous Driving)的道路测试表现。

作为全球首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影的技术落地速度也“绝速引领”。

商汤绝影还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,以通用人工智能(AGI)技术,驱动灵活自适应、深度个性化、安全可信赖、有人文关怀的未来出行全新体验。

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示:“未来汽车智能化的竞争,本质上是通用人工智能技术融合应用的比拼。商汤绝影致力于成为加速智能汽车驶入AGI时代的核心技术伙伴,给智能汽车产业带来生产效率和交互体验的双重革新,将携手合作伙伴提供通用人工智能技术驱动的智能汽车全新体验,共同定义未来出行。”

像人一样开车!

真·端到端自动驾驶解决方案UniAD上车首秀

2023年,商汤及其联合实验室提出的行业首个感知决策一体化自动驾驶通用模型UniAD荣获CVPR 2023最佳论文,引发行业轰动!

仅一年后,UniAD已经“上车”!

真·端到端,无需高精地图,仅靠视觉感知

无论是复杂城市道路还是无中线的乡村道路上,车辆都能搞定一系列高难度操作——大角度左转上桥、避让占道车辆、施工区域、绕行跑步行人……做到“像人一样开车”!

0a4b7d5c-03c8-11ef-a297-92fbcf53809c.png

今年以来,受特斯拉FSD V12版本的端到端自动驾驶方案影响,行业号称“端到端”智驾方案不断涌现,但大多由感知和决策两个模型组成的 “两段式”架构,存在信息传递过滤或丢失的问题。

UniAD将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型,实现感知决策一体化的真·端到端自动驾驶。

0a51ce46-03c8-11ef-a297-92fbcf53809c.png

UniAD真·端到端:感知决策一体化的通用模型

为什么端到端智驾方案如此重要且紧迫?

一方面是智驾场景(尤其城区场景)计算的复杂度呈指数级增长,另一方面传统方法人力成本高且难以应对长尾路况(corner case),而端到端技术可高效、低成本应对这些问题。

具体而言,商汤绝影端到端模型泛化能力强、迭代效率快,可以帮助车企低成本快速开城,纯视觉感知的无图方案,进一步降低系统的软硬件成本,助力智驾普及

在端到端系统基础上,商汤绝影还在车展期间带来了新一代自动驾驶大模型DriveAGI,推动自动驾驶从数据驱动向认知驱动的跃迁。

0a5ec38a-03c8-11ef-a297-92fbcf53809c.png

新一代自动驾驶大模型DriveAGI:

可感知、可交互、可信赖

依托多模态大模型,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案,向完全无人驾驶迈出重要一步。

多模态场景大脑

让智能座舱“真”懂你!

前不久上市的小米SU7将AI大模型带进座舱,而商汤“日日新”大模型也全面助力小爱同学车载语音场景应用。

本次车展,商汤绝影展示了以多模态场景大脑为核心的一系列全景感知、主动关怀且富有创造力的大模型座舱产品

多模态场景大脑让智能汽车可以高效准确地全景感知和深度理解用户需求和周围环境,打通不同应用,将离散的单点功能聚合在一起。

0a657176-03c8-11ef-a297-92fbcf53809c.png

多模态大模型可以准确感知并识别车外信息

比如,可以基于地理位置推荐符合用户喜好的餐厅,介绍用户感兴趣的外部自然景物,准确感知识别车型、标志性建筑物等车外信息,打破座舱本身的限制,让用户享受更为自由无束缚的出行体验。

以商汤“大医”医疗健康大模型为桥梁的“旅医”,让用户在座舱内就可以获得专业及个性化的健康管理服务,让出行更安心。

而基于AIGC大模型技术的“神笔”,可以把用户简单的绘画线条转变成具有美感的艺术作品,增添驾乘乐趣。

去年Apple Vision Pro的问世展现了3D交互的创新体验和应用潜力,本次车展,商汤绝影将3D Gaze高精视线交互和3D 动态手势交互这两大全新座舱3D交互演示带到现场,带来如同“Vision Pro”裸眼上车、更符合人类直觉的自然交互体验。

0a909324-03c8-11ef-a297-92fbcf53809c.gif

3D Gaze高精视线交互是商汤绝影全球首创的能够通过视线定位与屏幕图标进行交互的智能座舱技术,让用户无需点按屏幕,通过眼神即可精准控制中控图标,完成多种交互操作

0a9e5b44-03c8-11ef-a297-92fbcf53809c.gif

3D 动态手势交互是行业领先的支持动态手势和手部微动作识别的智能座舱技术,用户通过手势“隔空”实现各类座舱精细化的交互,打破传统按键和屏幕触控方式的繁琐和局限

商汤绝影还在进一步探索舱驾融合,实现智能驾驶和智能座舱在硬件、软件及应用层面的全面融合,提升用户体验、降低系统成本,进一步打破舱内外的界限和束缚,涌现更多创新功能,带来更安全、更加全方位,更具人文关怀的新体验。

加速智能汽车驶入AGI时代

商汤绝影与哪吒汽车全面深化战略合作

AGI的突破掀起技术范式的革新,坚实的核心研发能力成为行业竞争的关键。商汤绝影率先构建了四大技术基座,正在成长为加速智能汽车驶入AGI时代的核心技术伙伴。

SenseCore商汤大装置是行业领先的AI基础设施,能够以高达12,000 petaFLOPS的丰沛算力支持商汤绝影系列原生态大模型的高效迭代;

商汤绝影为智能汽车前瞻构建了UniAD、DriveAGI以及面向座舱的多模态场景大脑等系列原生态大模型,加速端到端自动驾驶和大模型在智能座舱场景的落地;

端云协同和舱驾融合的创新软硬件架构,让智能汽车降本增效、涌现创新功能;

全栈的数据生产管线,实现大模型的高质量训练。

车展上,哪吒汽车官宣与商汤绝影全面深化战略合作,双方将开启合作新篇章。商汤绝影将以大算力和原生态汽车垂类大模型更好地助力哪吒汽车智能化发展,共同探索更前沿的智能驾驶技术以及多模态场景大脑带来的全新智慧出行体验。

0ac71fa2-03c8-11ef-a297-92fbcf53809c.png

未来一到两年,智能汽车处在一个关键的时间节点,它与通用人工智能的深度融合将开启一个全新的时代,车企需要强有力的核心技术伙伴携手共进。

商汤绝影正是行业稀缺的同时具备“算力+算法+量产经验”全栈技术领先的核心供应商,是一匹应势而跃的千里马,能够助力合作伙伴在AGI时代持续领先。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14669

    浏览量

    176504
  • 人工智能技术

    关注

    2

    文章

    222

    浏览量

    10937
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964

原文标题:2024北京车展丨商汤绝影真·端到端自动驾驶解决方案UniAD上车首秀

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智驾仿真软件推荐:全球款ASIL-D认证平台助您突破自动驾驶测试瓶颈

    和独创的aiSim AIR引擎,为自动驾驶安全落地提供数字化解决方案。 一、智驾仿真平台技术标杆 全球认证标杆 aiSim是全球首个通
    的头像 发表于 11-19 13:26 301次阅读

    自动驾驶仿真与基于规则的仿真有什么区别?

    自动驾驶领域,“仿真”指的是将感知控制的整个决策链条视为一个整体,从而进行训练和验证的思路。
    的头像 发表于 11-02 11:33 1424次阅读

    西井科技自动驾驶模型获得国际认可

    近日,西井科技AI创研团队在国际权威自动驾驶算法榜单NAVSIM v2中脱颖而出,凭借创新的自动驾驶模型,以综合得分48.759的成绩
    的头像 发表于 10-15 17:20 1052次阅读

    一文读懂特斯拉自动驾驶FSD从辅助的演进

    [首发于智驾最前沿微信公众号]自动驾驶行业发展至今,特斯拉一直被很多企业对标,其FSD系统的每一次更新,都会获得非常多人的关注。早期自动驾驶是一个分层的、由多模块组成的系统,感知、定位、预测、规划
    的头像 发表于 10-11 09:13 382次阅读
    一文读懂特斯拉<b class='flag-5'>自动驾驶</b>FSD从辅助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演进

    商汤亮相汽车之家全球AI科技大会

    近日,由汽车之家主办的「汽车之家全球AI科技大会」在北京举行。商汤科技联合创始人、执行董事、CTO、商汤CEO王晓刚出席大会,并发表《世界模型:智能
    的头像 发表于 09-29 14:09 423次阅读

    自动驾驶大模型为什么会有不确定性?

    。为了能让自动驾驶汽车做出正确、安全且符合逻辑的行驶动作,大模型被提了出来。
    的头像 发表于 09-28 09:20 542次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型为什么会有不确定性?

    商汤亮相2025长安汽车科技生态大会

    9月5日-8日,商汤受邀参加2025世界智能产业博览会「长安汽车科技生态大会」,作为长安汽车合作伙伴参与行业技术交流,现场展出
    的头像 发表于 09-10 16:33 1405次阅读

    自动驾驶相较传统自动驾驶到底有何提升?

    各自专业模块独立承担,再通过预定的接口协议将信息有序传递。与之相对照,“”(end-to-end)自动驾驶以统一的大规模神经网络为核心,将从摄像头、雷达、激光雷达等传感器采集
    的头像 发表于 09-02 09:09 505次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>相较传统<b class='flag-5'>自动驾驶</b>到底有何提升?

    Nullmax自动驾驶最新研究成果入选ICCV 2025

    近日,国际计算机视觉大会 ICCV 2025 正式公布论文录用结果,Nullmax 感知团队在自动驾驶方向的最新研究成果《HiP-AD: Hierarchical
    的头像 发表于 07-05 15:40 1559次阅读
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>最新研究成果入选ICCV 2025

    为什么自动驾驶大模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶
    的头像 发表于 07-04 16:50 591次阅读
    为什么<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    数据标注方案自动驾驶领域的应用优势

    10-20TB,其中需要标注的数据占比超过60%。在这样的背景下,数据标注方案应运而生,正在重塑自动驾驶的数据生产范式。
    的头像 发表于 06-23 17:27 738次阅读

    一文带你厘清自动驾驶架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了从传统模块化架构
    的头像 发表于 05-08 09:07 786次阅读
    一文带你厘清<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架构差异

    自动驾驶中基于规则的决策和大模型有何区别?

    自动驾驶架构的选择上,也经历了从感知、决策控制、执行的三段式架构到现在火热的大模型,尤其是在2024年特斯拉推出FSD V12后,各车企更是陆续推出自家的
    的头像 发表于 04-13 09:38 3427次阅读
    <b class='flag-5'>自动驾驶</b>中基于规则的决策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有何区别?

    东风汽车推出自动驾驶开源数据集

    近日,智能网联汽车智驾数据空间构建研讨会暨中汽协会智能网联汽车分会、数据分会2024年度会议在上海举办。会上,东风汽车发布行业规模最大、涵盖125万组高质量数据的自动驾驶开源数据
    的头像 发表于 04-01 14:54 1022次阅读

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入202
    的头像 发表于 12-19 13:07 1513次阅读