近日,由中国电动汽车百人会与中国电信集团有限公司联合主办的AI汽车创新发展论坛在上海成功举办。本次论坛以“AI重塑汽车技术链、价值链、服务链”为主题,吸引了产学研界众多嘉宾齐聚一堂,共同深入探讨AI技术在辅助驾驶、自动驾驶、智能座舱等领域的创新应用与发展趋势。
作为智慧座舱领域的落地实践者和技术支持者,云知声受邀出席此次活动。现场,云知声执行董事&研发部高级副总裁李霄寒以《大模型重新定义人车关系》为题发表精彩演讲,分享了企业在智慧座舱领域的前沿思考与实践成果。
演进之路:从机械操作到智能伙伴的升级跃迁
李霄寒在演讲中详细阐述了智慧座舱的发展历程,指出其经历了多个重要阶段。在1980年以前的机械座舱时代,传统座舱以机械操作为主,人机交互极为简单,仅能满足基本的驾驶信息显示和简单设备控制需求。到了2000年左右的电子化时代,汽车开始引入电子功能,导航、拨打电话、语音控制、媒体播放等功能相继出现,极大地催生了语音交互的需求。而自2020年以来,大模型时代强势登场,以自然对话、AIGC和多模态交互为显著特点,使得车辆进化为能够理解人类语言和行为的智能伙伴,对语音交互也提出了更高层次的要求。
从驱动因素来看,产品功能、用户需求、硬件基础设施的发展相互促进、相辅相成。新型交互方式的引入与加强,既满足了用户体验的需求,也得益于硬件基础设施的不断升级。可以预见,在未来,随着这三者继续齐头并进,新的交互方式必将不断涌现,为汽车行业带来更多创新可能。
技术内核:“车端-云端”协同架构筑牢交互基石
在大模型时代,云知声凭借深厚的技术积累和前瞻性的战略眼光,打造了智慧座舱解决方案,构建了“车端-云端”协同架构,为用户提供全流程智能语音交互服务。
在车端,ECNR技术通过降噪、回声消除、声源定位及蓝牙通话等功能,确保语音采集清晰准确;声纹识别(VPA)能够精准识别用户身份,为身份验证和个性化服务提供有力支撑;语音唤醒(KWS)可响应特定唤醒词,让系统随时待命触发交互;多模态输入融合了语音与手势等信号,拓宽了交互维度,使交互更加自然流畅。
在交互流程中,端侧语音交互与轻量端侧大模型协同工作,能够快速完成本地基础语音识别与初步理解,实现简单指令的快速响应,有效降低交互延迟,同时保护用户隐私。用户语音及环境信息上传至云端后,借助山海大模型(云知大脑的核心),可以进行深度语义理解与复杂任务处理,精准生成内容并执行响应,涵盖路线规划、娱乐推荐等多种场景。最后通过Agent应用,将出行建议、知识问答、儿童陪伴等服务串联起来,整合第三方生态资源,全面延伸服务边界,重塑汽车语音交互体验。李霄寒表示,“AllinLLM”是未来智慧座舱发展的必然趋势,云知声将沿着这一方向持续创新。
破局之道:直面挑战,引领未来演进方向
尽管智慧座舱发展势头迅猛,但现阶段仍面临诸多挑战。李霄寒从实施效率、运营维护、开发模式、成本控制、出海适配五大维度,深入剖析了行业痛点,并提出了相应的解决路径。
面向未来,云知声认为智慧座舱将朝着六大方向演进。一是高度拟人化,使车辆能够更加自然、生动地与用户进行交互,仿佛拥有真实的情感和个性;二是多模态交互,融合语音、手势、视觉等多种交互方式,提供更加丰富、便捷的交互体验;三是长期记忆与知识更新,让车辆能够记住用户的偏好和习惯,并不断学习新知识,为用户提供更加个性化的服务;四是定制化与自学习,根据不同用户的需求和使用场景,提供定制化的交互方案,并通过自学习不断优化交互效果;五是主动需求响应,车辆能够主动感知用户的需求,提前为用户提供相应的服务和建议;六是艺术化表达,使语音交互不仅具有实用性,还具备艺术美感,提升用户的情感体验。
-
自动驾驶
+关注
关注
791文章
14681浏览量
176748 -
云知声
+关注
关注
0文章
286浏览量
9081 -
大模型
+关注
关注
2文章
3460浏览量
4975
原文标题:大模型重构人车交互!云知声执行董事&研发部高级副总裁李霄寒畅谈智慧座舱技术演进与破局之道
文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录

云知声出席2025 AI汽车创新发展论坛
评论