0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

魔视智能MOTOVIS 来源:魔视智能MOTOVIS 2023-07-13 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年7月8日,自动驾驶新势力Tier 1 魔视智能MOTOVIS创始人&CEO虞正华博士受邀参加「2023 WAIC大模型与智能驾驶创新高端闭门会」,与参会人员深度探讨AI大模型在智能驾驶领域的关键应用、技术挑战、协同创新等时下热点。

本场闭门会以“智能驾驶新征程——大模型赋能下的商业化机遇与挑战”为题,由世界人工智能大会组委会办公室、上海市张江科学城建设管理办公室指导,上海张江(集团)有限公司、机器之心联合主办,旨在助力产业链企业更好地把握大模型发展趋势,推动企业间的业务合作与交流,加速智能驾驶商业化进程,为张江的「未来车生态」注入新的活力。

大模型在许多领域展示出了巨大的应用潜力,但在智能驾驶领域至今还未展现出一个非常成功的智能驾驶大模型。智能驾驶作为一个充满挑战和机遇的领域,与大模型的结合将碰撞出怎样的火花?

虞正华博士指出,目前确实有很多视觉大模型的尝试,包括在图像识别、实时目标检测和跟踪方面以及图像合成、图像修复、图像增强等应用的进展,但未来自动驾驶的大模型一定不是纯视觉的大模型,还需要综合视觉、语言等多模态技术。

未来的端到端的自动驾驶大模型,是否能将规划闭环在内还不确定,但是至少可以考虑将感知和预测放在一个端到端的模型中,将这个问题定义为一个泛感知问题,而这个模型的目标就是感知外部的世界,包括现在的和未来的(预测的)目标,为规划提供基础信息。

将语言大模型的“推理”能力跟视觉大模型的“感知”能力去结合,并进一步演变下去,发展成为真正的智能驾驶大模型。这种结合大模型推理能力和环境感知能力的智能驾驶系统,能够在实时感知、决策制定和控制执行方面发挥重要作用。然而,实现自动驾驶仍需综合考虑多个因素,如硬件平台、安全性、法律法规等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能驾驶
    +关注

    关注

    5

    文章

    2949

    浏览量

    50969
  • 自动驾驶
    +关注

    关注

    791

    文章

    14673

    浏览量

    176634
  • 大模型
    +关注

    关注

    2

    文章

    3447

    浏览量

    4974

原文标题:2023 WAIC | 魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

文章出处:【微信号:motovis,微信公众号:魔视智能MOTOVIS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    没有地图,视觉自动驾驶就只能摸瞎吗?

    [首发于智驾最前沿微信公众号]最近在篇讨论高精度地图的文章中,有位小伙伴提到个非常有趣的观点“如果人在陌生的目的地,只依托视觉(眼睛)去辨别道路,若没有导航,就只能摸瞎”。对于
    的头像 发表于 11-27 17:22 1222次阅读
    没有地图,<b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>就只能摸瞎吗?

    VLA能解决自动驾驶中的哪些问题?

    、语言表达和动作控制这三者整合到个统模型框架中。 与传统自动驾驶系统将感知、预测、规划、控制拆解为多个独立模块的做法不同,VLA可以缩短“看见什么”和“如何行动”之间的鸿沟,构建
    的头像 发表于 11-25 08:53 185次阅读
    VLA能解决<b class='flag-5'>自动驾驶</b>中的哪些问题?

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    2024年7月,理想汽车发布的基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构标志着其全栈自研的
    的头像 发表于 11-22 10:59 2281次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    VLA和世界模型,谁才是自动驾驶的最优解?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术发展,其实现路径也呈现出两种趋势,边是以理想、小鹏、小米为代表的VLA(视觉—语言—行动)模型路线;另
    的头像 发表于 11-05 08:55 484次阅读
    VLA和世界<b class='flag-5'>模型</b>,谁才是<b class='flag-5'>自动驾驶</b>的最优解?

    智能华荣获2024年度汽车电子科学技术奖创新人物奖

    近日,在IAEIS 2025第十四届国际汽车电子产业峰会上,智能CEO博士荣膺2024
    的头像 发表于 07-05 11:19 969次阅读

    为什么自动驾驶端到端大模型有黑盒特性?

    、激光雷达数据)映射到控制输出(如方向盘转角、加速度、制动等),以深度神经网络为核心,打通了从视觉驾驶行为的完整链条。它也代表了自动驾驶从“规则驱动”向“数据驱动”的跃迁,展现了极高的潜力。当然这种结构也天然地带来了
    的头像 发表于 07-04 16:50 597次阅读
    为什么<b class='flag-5'>自动驾驶</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作
    的头像 发表于 06-24 08:53 754次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    自动驾驶视觉方案到底有哪些弊端?

    [首发于智驾最前沿微信公众号]随着人工智能与传感器技术的快速发展,自动驾驶汽车逐步走入公众视野。其中,关于感知系统的技术路线选择,始终是大家争论的焦点。尤其是“视觉方案”,也就是主要
    的头像 发表于 06-23 09:27 709次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>纯</b><b class='flag-5'>视觉</b>方案到底有哪些弊端?

    视觉自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这
    的头像 发表于 06-16 09:56 588次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的<b class='flag-5'>自动驾驶</b>会有哪些安全问题?

    视觉自动驾驶如何理解路边画报上的人?

    行业来说,其实是个值得深思的问题。随着自动驾驶技术下沉到消费市场,基于视觉自动驾驶系统就是依托于车载摄像头来识别路况,如果遇到了类似海
    的头像 发表于 05-19 09:16 525次阅读

    智能亮相2025上海车展

    近日,上海国家会展中心,全球汽车科技领域的焦点盛会——上海国际车展正式启幕。作为辅助驾驶技术领域的创新先锋,智能以“智驾全栈,技术领航”为主题,携端到端大
    的头像 发表于 04-27 17:00 975次阅读

    模型如何推动自动驾驶技术革新?

    [首发于智驾最前沿微信公众号]近年来,人工智能技术以前所未有的速度在各个领域渗透与应用,而大模型(大语言模型和多模态大模型)的迅猛发展为
    的头像 发表于 04-20 13:16 694次阅读
    大<b class='flag-5'>模型</b>如何推动<b class='flag-5'>自动驾驶</b>技术革新?

    智能华荣膺2024福布斯中国颠覆力创始人

    近日,首届GBRC全球化创始人峰会暨2024福布斯中国新时代颠覆力创始人评选颁奖典礼在上海外滩瑞吉酒店隆重举行。博士受邀出席颁奖典礼现场,荣膺福布斯中国颁发的“新时代颠覆力创始人”奖项,与百名企业家共同见证这
    的头像 发表于 04-12 09:29 1083次阅读

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    近年来,人工智能技术迅速发展,大规模深度学习模型(即大模型)在自然语言处理、计算机视觉、语音识别以及自动驾驶等多个领域取得了突破性进展。
    的头像 发表于 03-28 09:16 989次阅读

    海康威推出视觉模型系列摄像机

    依托海康观澜大模型技术体系,海康威将大模型能力直接部署至端侧,推出系列视觉模型摄像机。
    的头像 发表于 03-05 14:06 1260次阅读