0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

魔视智能MOTOVIS 来源:魔视智能MOTOVIS 2023-07-13 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年7月8日,自动驾驶新势力Tier 1 魔视智能MOTOVIS创始人&CEO虞正华博士受邀参加「2023 WAIC大模型与智能驾驶创新高端闭门会」,与参会人员深度探讨AI大模型在智能驾驶领域的关键应用、技术挑战、协同创新等时下热点。

本场闭门会以“智能驾驶新征程——大模型赋能下的商业化机遇与挑战”为题,由世界人工智能大会组委会办公室、上海市张江科学城建设管理办公室指导,上海张江(集团)有限公司、机器之心联合主办,旨在助力产业链企业更好地把握大模型发展趋势,推动企业间的业务合作与交流,加速智能驾驶商业化进程,为张江的「未来车生态」注入新的活力。

大模型在许多领域展示出了巨大的应用潜力,但在智能驾驶领域至今还未展现出一个非常成功的智能驾驶大模型。智能驾驶作为一个充满挑战和机遇的领域,与大模型的结合将碰撞出怎样的火花?

虞正华博士指出,目前确实有很多视觉大模型的尝试,包括在图像识别、实时目标检测和跟踪方面以及图像合成、图像修复、图像增强等应用的进展,但未来自动驾驶的大模型一定不是纯视觉的大模型,还需要综合视觉、语言等多模态技术。

未来的端到端的自动驾驶大模型,是否能将规划闭环在内还不确定,但是至少可以考虑将感知和预测放在一个端到端的模型中,将这个问题定义为一个泛感知问题,而这个模型的目标就是感知外部的世界,包括现在的和未来的(预测的)目标,为规划提供基础信息。

将语言大模型的“推理”能力跟视觉大模型的“感知”能力去结合,并进一步演变下去,发展成为真正的智能驾驶大模型。这种结合大模型推理能力和环境感知能力的智能驾驶系统,能够在实时感知、决策制定和控制执行方面发挥重要作用。然而,实现自动驾驶仍需综合考虑多个因素,如硬件平台、安全性、法律法规等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能驾驶
    +关注

    关注

    5

    文章

    3040

    浏览量

    51376
  • 自动驾驶
    +关注

    关注

    794

    文章

    14985

    浏览量

    181461
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:2023 WAIC | 魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

文章出处:【微信号:motovis,微信公众号:魔视智能MOTOVIS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉模型开发实战 - 2026必会

    视觉模型特训:从原理到部署站式学会 在科技飞速发展的当下,视觉模型已成为人工智能领域的
    发表于 04-15 16:06

    理想汽车发布下自动驾驶基础模型MindVLA-o1

    2026年3月17日,理想汽车基座模型负责人詹锟出席NVIDIA GTC 2026,发表主题演讲《MindVLA-o1:开启全能范式——下代统视觉-语言-动作
    的头像 发表于 03-18 11:51 1492次阅读
    理想汽车发布下<b class='flag-5'>一</b>代<b class='flag-5'>自动驾驶</b>基础<b class='flag-5'>模型</b>MindVLA-o1

    为什么光照对视觉自动驾驶影响较大?

    自动驾驶的技术路线中,视觉方案因其模仿人类驾驶逻辑与低廉的硬件成本,直是很多车企的选择。但这种高度依赖摄像头的感知方式,在夜幕降临、车
    的头像 发表于 03-09 17:06 999次阅读

    如何构建适合自动驾驶的世界模型

    提出的。那世界模型自动驾驶落地的正解吗? 什么是世界模型? 世界模型对于自动驾驶汽车来说,更像是给汽车大脑里绘制
    的头像 发表于 02-18 08:14 1.1w次阅读
    如何构建适合<b class='flag-5'>自动驾驶</b>的世界<b class='flag-5'>模型</b>?

    视觉自动驾驶的优势和劣势有哪些?

    [首发于智驾最前沿微信公众号]最近有很多小伙伴在后台询问视觉自动驾驶的优劣,视觉自动驾驶以其
    的头像 发表于 01-18 09:50 2338次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>的优势和劣势有哪些?

    黄仁勋:未来十年很多汽车是自动驾驶 英伟达发布Alpamayo汽车大模型平台

    最看好的AI落地场景就是自动驾驶。在演讲中黄仁勋提到,未来十年,世界上很大部分汽车将是自动驾驶或高度自动驾驶的。你期待吗? 英伟达发布Al
    的头像 发表于 01-06 11:45 1407次阅读

    自动驾驶中常提的世界模型是什么?

    在很多厂家的技术方案中,会提到世界模型的介绍。世界模型,就是自动驾驶系统内部用来表示外部世界并预测未来演变的
    的头像 发表于 01-05 16:23 1088次阅读

    世界模型是让自动驾驶汽车理解世界还是预测未来

      [首发于智驾最前沿微信公众号]世界模型自动驾驶技术中已有广泛应用。但当谈及它对自动驾驶的作用时,难免会出现分歧。它到底是让自动驾驶汽车得以理解世界,还是为其提供了预测
    的头像 发表于 12-16 09:27 1018次阅读
    世界<b class='flag-5'>模型</b>是让<b class='flag-5'>自动驾驶</b>汽车理解世界还是预测<b class='flag-5'>未来</b>?

    视觉自动驾驶会像人眼样“近视”吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,视觉路线逐渐获得了部分从业者和研究者的认可与支持。随着双目乃至三目摄像头方案的应用,通过视差计算、结构约束和算法建模,摄像头已经具备了
    的头像 发表于 12-15 09:23 880次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>会像人眼<b class='flag-5'>一</b>样“近视”吗?

    没有地图,视觉自动驾驶就只能摸瞎吗?

    [首发于智驾最前沿微信公众号]最近在篇讨论高精度地图的文章中,有位小伙伴提到个非常有趣的观点“如果人在陌生的目的地,只依托视觉(眼睛)去辨别道路,若没有导航,就只能摸瞎”。对于
    的头像 发表于 11-27 17:22 1583次阅读
    没有地图,<b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>就只能摸瞎吗?

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    2024年7月,理想汽车发布的基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构标志着其全栈自研的
    的头像 发表于 11-22 10:59 2630次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    VLA和世界模型,谁才是自动驾驶的最优解?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术发展,其实现路径也呈现出两种趋势,边是以理想、小鹏、小米为代表的VLA(视觉—语言—行动)模型路线;另
    的头像 发表于 11-05 08:55 932次阅读
    VLA和世界<b class='flag-5'>模型</b>,谁才是<b class='flag-5'>自动驾驶</b>的最优解?

    智能华荣获2024年度汽车电子科学技术奖创新人物奖

    近日,在IAEIS 2025第十四届国际汽车电子产业峰会上,智能CEO博士荣膺2024
    的头像 发表于 07-05 11:19 1541次阅读

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作
    的头像 发表于 06-24 08:53 1385次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    视觉自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这
    的头像 发表于 06-16 09:56 1161次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的<b class='flag-5'>自动驾驶</b>会有哪些安全问题?