0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

要长高 2024-10-31 16:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月31日讯,自动驾驶领域的先锋Waymo,作为Alphabet旗下的一员,长久以来将其与谷歌DeepMind的紧密合作及深厚的AI研究底蕴视为其在自动驾驶竞赛中脱颖而出的关键。如今,Waymo再迈新步,为其机器人出租车业务引入了一种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”(EMMA)。

Waymo最新发布的研究论文揭示了EMMA模型的面纱。这一创新的端到端训练模型能够解析传感器数据,预测“自动驾驶车辆的未来行驶轨迹”,从而辅助Waymo的无人驾驶车辆做出精准决策,无论是选择行进路线还是规避障碍物。

尤为引人注目的是,这是自动驾驶领军企业首次公开表示计划将MLLM技术融入其核心业务,预示着MLLM的应用范围或将超越聊天机器人、邮件整理及图像生成等传统领域,向自动驾驶这一前沿阵地拓展。

传统自动驾驶系统往往采用模块化设计,针对感知、地图构建、预测及规划等特定功能分别开发。尽管这种模式在过去取得了显著成效,但Waymo指出,其存在可扩展性问题,模块间的误差累积和通信限制影响了整体性能,且面对新环境时适应性不强。

Waymo认为,像Gemini这样的MLLM能够有效解决上述问题。它们作为互联网大数据培育的“通才”,拥有超越常规驾驶经验的广泛“世界知识”,并通过“链式推理”等先进技术展现出强大的逻辑推理能力,能够模仿人类思维,将复杂任务分解为逻辑步骤。

据Waymo介绍,EMMA模型在应对复杂交通环境时表现出色,如动物穿越道路或道路施工等情况,都能为无人驾驶汽车规划出合理的行驶路径。

值得注意的是,特斯拉等竞争对手也在积极开发自动驾驶汽车的端到端模型。特斯拉CEO埃隆·马斯克曾宣称,其最新版本的FSD 12.5.5采用了“端到端神经网络”AI系统,直接将摄像头图像转化为驾驶决策。

尽管Waymo在部署无人驾驶车辆方面领先于特斯拉,但它同样对端到端系统抱有浓厚兴趣。Waymo表示,其EMMA模型在轨迹预测、物体识别和道路理解方面取得了优异成绩。

然而,EMMA也面临挑战。Waymo承认,在将模型投入实际应用前,还需克服一些障碍,如EMMA目前无法整合来自激光雷达或雷达的3D传感器输入,原因是“计算成本过高”,且仅能处理有限数量的图像帧。

此外,研究论文中未提及的一个潜在风险是,像Gemini这样的MLLM可能会产生“幻觉”,这对于容错率极低的无人驾驶汽车而言是极大的挑战。因此,在MLLM能够大规模应用于自动驾驶之前,仍需开展更多深入研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112181
  • 自动驾驶
    +关注

    关注

    795

    文章

    15056

    浏览量

    181991
  • waymo
    +关注

    关注

    2

    文章

    315

    浏览量

    25587
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么一段式自动驾驶很难落地?

    [首发于智驾最前沿微信公众号]自动驾驶技术在过去十年中经历了从基础辅助驾驶高度自动系统的快速演进。在这一进程中,技术架构的选择始终是决定
    的头像 发表于 03-08 09:44 1887次阅读
    为什么一段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>很难落地?

    自动驾驶为什么会出现黑盒现象?

    自动驾驶领域,(End-to-End)是指从感知环境的原始数据车辆实际控制指令,全部交给一个统一的深度学习
    的头像 发表于 02-20 09:25 9649次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>为什么会出现黑盒现象?

    如何构建适合自动驾驶的世界模型

    [首发于智驾最前沿微信公众号]世界模型经历了系统动力学阶段(1960年~2000年)、认知科学阶段(2001年~2017年)、深度学习阶段(2018年至今),但将其应用到自动驾驶汽车上,还是近几年才
    的头像 发表于 02-18 08:14 1.1w次阅读
    如何构建适合<b class='flag-5'>自动驾驶</b>的世界<b class='flag-5'>模型</b>?

    晶晨携手谷歌,助力侧大模型Gemini的硬件落地

    电子发烧友网报道 在科技飞速发展的当下,侧智能技术正以前所未有的速度渗透各个领域。1月28日,晶晨股份透露,公司与谷歌有着长达十余年的深度合作基础。作为谷歌新一代
    的头像 发表于 01-29 10:44 2573次阅读

    如何训练好自动驾驶模型

    [首发于智驾最前沿微信公众号]最近有位小伙伴在后台留言提问:算法是怎样训练的?是模仿学习、强化学习和离线强化学习这三类吗?其实
    的头像 发表于 12-08 16:31 1681次阅读
    如何训练好<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>?

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    2024年7月,理想汽车发布的基于模型、VLM视觉语言模型和世界模型的全新
    的头像 发表于 11-22 10:59 2676次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    自动驾驶仿真与基于规则的仿真有什么区别?

    自动驾驶领域,“仿真”指的是将感知控制的整个决策链条视为一个整体,从而进行训练和验证的思路。
    的头像 发表于 11-02 11:33 1933次阅读

    自动驾驶中常提的一段式(单段)是个啥?

    自动驾驶技术的发展,催生出技术的应用,一段式
    的头像 发表于 10-18 10:16 1955次阅读

    西井科技自动驾驶模型获得国际认可

    近日,西井科技AI创研团队在国际权威自动驾驶算法榜单NAVSIM v2中脱颖而出,凭借创新的自动驾驶
    的头像 发表于 10-15 17:20 1515次阅读

    一文读懂特斯拉自动驾驶FSD从辅助的演进

    [首发于智驾最前沿微信公众号]自动驾驶行业发展至今,特斯拉一直被很多企业对标,其FSD系统的每一次更新,都会获得非常多人的关注。早期自动驾驶是一个分层的、由多模块组成的系统,感知、定位
    的头像 发表于 10-11 09:13 1243次阅读
    一文读懂特斯拉<b class='flag-5'>自动驾驶</b>FSD从辅助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演进

    自动驾驶模型为什么会有不确定性?

    。为了能让自动驾驶汽车做出正确、安全且符合逻辑的行驶动作,模型被提了出来。
    的头像 发表于 09-28 09:20 1105次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大<b class='flag-5'>模型</b>为什么会有不确定性?

    自动驾驶相较传统自动驾驶到底有何提升?

    各自专业模块独立承担,再通过预定的接口协议将信息有序传递。与之相对照,“”(end-to-end)自动驾驶以统一的大规模神经网络为核心,将从摄像头、雷达、激光雷达等传感器采集
    的头像 发表于 09-02 09:09 1094次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>相较传统<b class='flag-5'>自动驾驶</b>到底有何提升?

    Nullmax自动驾驶最新研究成果入选ICCV 2025

    Nullmax 在一段式核心技术上的深厚积累与创新实力,尤其在
    的头像 发表于 07-05 15:40 2043次阅读
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>最新研究成果入选ICCV 2025

    为什么自动驾驶模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统
    的头像 发表于 07-04 16:50 1112次阅读
    为什么<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大<b class='flag-5'>模型</b>有黑盒特性?

    数据标注方案在自动驾驶领域的应用优势

    10-20TB,其中需要标注的数据占比超过60%。在这样的背景下,数据标注方案应运而生,正在重塑自动驾驶的数据生产范式。
    的头像 发表于 06-23 17:27 1266次阅读