0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多模态:智能座舱的新突破口

要长高 2024-10-12 15:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在智能汽车产业蓬勃发展的当下,智能座舱作为车辆的重要组成部分,正经历着前所未有的变革。清华大学智能绿色车辆与交通全国重点实验室的曹东璞教授在全球智能汽车产业大会(GIV 2024)上指出,国内智能座舱的发展速度惊人,已经从过去的落后状态转变为领先国际。这一转变的背后,AI大模型起到了关键的推动作用。

然而,随着智能座舱市场的快速发展,头部座舱企业已经遇到了瓶颈。为了突破这一困境,多模态成为了智能座舱发展的新热点。多模态是指通过不同的信息来源或形式(如文本、语音、图像、视频等)来传递和接收信息。相较于单一模态,多模态能够更全面、完整地反映真实世界的复杂性和多样性,同时实现不同模态之间的交互和融合。

随着技术的持续迭代和发展,AI大模型正在从单一模态向多模态演进。咨询公司Gartner预测,建立在多模态大模型上的生成式AI应用将在未来几年内实现快速增长。智能汽车作为原生多模态大模型的绝佳落地场景,正引领着这一变革。

商汤绝影和GPT-4V等多模态大模型的发布,标志着AI公司开始在技术框架层将语言模型、视觉模型、声音模型等进行融合。这些模型通过跨模态数据的训练,实现了多模态的对齐和连接,从而能够在更广泛的场景中应用。

商汤绝影将多模态大模型业务分为模型层、引擎层和业务层三层。模型层包括车端侧和云端的模型,用于进行多模态大模型的推理。引擎层则包括座舱大脑和全时驾驶辅助两个产品,分别用于感知座舱内的情况和车外场景。业务层则包括语音助手、ADAS系统、手机运用以及娱乐功能等,与下面的模型层和引擎层进行融合。

然而,多模态大模型在智能座舱中的应用也面临着诸多挑战。首先,车端应用大模型需要强大的算力支持,而如何更优、更好地使用算力是一个亟待解决的问题。其次,集中化跨模态的全链路数据打通和服务接口的标准化等方面也需要进一步努力。此外,多模态大模型在实际应用中的取舍也是一个重要问题。一些新功能虽然看似炫酷,但可能并不符合用户的实际需求,导致资源浪费。

因此,智能座舱的发展需要回归原点,改变车内场景的交互效率。百度智舱业务部总经理李涛指出,如果一个功能频繁被用户使用,可能说明整体车辆设计的智能化程度较低,无法理解用户当前所需。因此,智能座舱的发展应该更加注重用户体验和实际需求,通过多模态大模型等技术手段提高交互效率,为用户带来更加便捷、智能的出行体验。

综上所述,多模态作为智能座舱的新突破口,正引领着智能汽车产业的发展。然而,要实现多模态大模型在智能座舱中的广泛应用,还需要克服诸多技术和市场挑战。未来,随着技术的不断进步和市场的日益成熟,智能座舱将迎来更加广阔的发展前景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38122

    浏览量

    296713
  • 智能汽车
    +关注

    关注

    30

    文章

    3231

    浏览量

    109147
  • 智能座舱
    +关注

    关注

    4

    文章

    1241

    浏览量

    17234
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    博泰车联网荣获2025年度全域AI智能座舱突破企业

    智能座舱领域的技术突破与平台实践,荣膺“年度全域AI智能座舱突破企业”奖项。这标志着其在
    的头像 发表于 11-26 15:07 192次阅读

    格灵深瞳模态大模型Glint-ME让图文互搜更精准

    在电商、安防等场景下,图文互搜应用广泛。随着以CLIP为代表的模态表征方法相继提出,过去单一模态搜索(文搜文、图搜图)被突破,模型可以同时理解文本、图像、音频乃至视频,实现跨
    的头像 发表于 11-02 15:56 1240次阅读
    格灵深瞳<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型Glint-ME让图文互搜更精准

    浅析模态标注对大模型应用落地的重要性与标注实例

    ​在人工智能迈向AGI通用智能的关键道路上,大模型正从单一的文本理解者,演进为能同时看、听、读、想的“多面手”。驱动这一进化的核心燃料,正是高质量的模态数据,而将原始数据转化为“机器
    的头像 发表于 09-05 13:49 774次阅读

    商汤科技模态通用智能战略思考

    时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定“模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。
    的头像 发表于 08-14 09:33 1013次阅读

    汽车模态交互测试:智能交互的深度验证

    在汽车智能座舱测试的关键进程中,北京沃华慧通测控技术有限公司展现出了独特的价值与优势。作为一家专注于测控技术领域的企业,沃华慧通在智能座舱测试方面积累了丰富的经验和专业的技术能力。其研
    的头像 发表于 06-25 09:00 1200次阅读
    汽车<b class='flag-5'>多</b><b class='flag-5'>模态</b>交互测试:<b class='flag-5'>智能</b>交互的深度验证

    模态感知+豆包大模型!家居端侧智能升级

    电子发烧友网报道(文/李弯弯)日前,在火山引擎2025春季FORCE原动力大会上,星宸科技股份有限公司董事副总经理陈立敬谈到,在人工智能技术飞速发展的时代,模态感知与大模型的融合成为推动各行业变革
    的头像 发表于 06-21 00:06 6616次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>感知+豆包大模型!家居端侧<b class='flag-5'>智能</b>升级

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式
    的头像 发表于 06-12 10:17 408次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>+空间<b class='flag-5'>智能</b>:盾华以AI+智慧路灯杆,点亮城市治理新方式

    无人驾驶技术未来在哪里?低速才是突破口

    环境,速度一般不超过30公里每小时。正因为环境可控、速度较低,低速无人驾驶成为自动驾驶技术真正“跑起来”的突破口。 低速无人驾驶的基础,是一整套成熟的感知与决策系统。车辆配备激光雷达、摄像头、毫米波雷达等多种传
    的头像 发表于 05-23 15:38 630次阅读
    无人驾驶技术未来在哪里?低速才是<b class='flag-5'>突破口</b>

    移远通信48 TOPS智能座舱方案落地加速,AI大模型赋能域融合新突破

    进展,标志着产品商业化进程取得关键突破。该模组以48 TOPS高算力与域融合能力为核心,旨在为车企提供“舱泊一体”“舱驾融合”的域控解决方案,赋能下一代智能座舱的沉浸式交互与安全体验
    发表于 04-25 15:04 854次阅读
    移远通信48 TOPS<b class='flag-5'>智能</b><b class='flag-5'>座舱</b>方案落地加速,AI大模型赋能<b class='flag-5'>多</b>域融合新<b class='flag-5'>突破</b>

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    全系智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这一突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    发表于 03-21 14:12 426次阅读
    移远通信<b class='flag-5'>智能</b>模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新体验

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这一突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    的头像 发表于 03-20 19:03 666次阅读
    移远通信<b class='flag-5'>智能</b>模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新体验

    模态交互技术解析

    模态交互 模态交互( Multimodal Interaction )是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行自然、
    的头像 发表于 03-17 15:12 3530次阅读

    空间智能技术助推新型工业化升级

    空间智能视觉技术作为其中的重要突破口,成为释放“中小制造”大能量的关键。
    的头像 发表于 03-17 14:39 664次阅读

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48

    商汤日日新模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态大模型,在权威综合评测权威平台OpenCompass的模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 1501次阅读