0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

出门问问李勤:芯片、传感器和AI算法融合 打造嵌入式语音交互优质体验

电子观察说 2019-04-28 17:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2019年4月26日,由意法半导体主办的2019年STM32中***会在深圳举行,出门问问工程VP李勤受邀出席大会AIoT沙龙,并在人工智能与计算分会场发表了演讲,分享了出门问问在嵌入式系统上的智能语音交互方案和经验。

深耕万亿级的AIoT市场

在上午主会场的AIoT沙龙环节,李勤与微软首席技术顾问管震、移远通信高级副总裁张栋、意法半导体大中华暨南亚区AMS市场及应用高级总监吴卫东共同探讨了对于人工智能物联网的看法。

李勤表示,中国的AIoT市场是一个万亿级的市场。而其中,AI可穿戴将是重要的增长极,将在未来5年保持高速的增长态势。按照公开数据,预计在未来5年内,全球Wearable IoT的市场规模会达到424亿美元,达到平均每年30%的复合增长率。

芯片、算法传感器的深度集成是AIoT核心的技术之一。未来,算法和芯片的深度融合是一大挑战,即算法去为芯片优化,芯片为算法优化。这也是出门问问的优势所在,可以发挥全栈式的AI语音交互算法能力,以及芯片、算法、产品端的深度整合和系统集成能力,赋能给其他合作伙伴。

将芯片、传感器和AI算法深度集成

在下午的人工智能与计算分会场上,李勤深入地分析了出门问问作为一家AI技术公司是如何做嵌入式系统上的智能语音交互方案的。

李勤指出,AI可穿戴技术的核心是人机交互的过程,而人机交互涉及到多种传感器融合技术以及语音交互技术。多种传感器融合技术包括拾音麦克风、运动传感器(例如加速度器,陀螺仪)、骨传导麦克风、心率传感器、触摸及反馈等,只有把多种传感器融合在一起,才能给用户提供更好的体验。

而语音交互是所有人机交互方式中最重要的一个,在合适的场景下极为高效。它有着不可替代的优势,例如解放双手和双眼;指向明确,语义直达目标,缩短整个的使用路径;自然语言交互,简单人性化,学习成本低,不用记固定命令词;对设备的大小没有特别要求。但当然,语音交互也面临一些挑战,例如受环境影响比较大,前端信号处理的挑战大,受硬件和结构的限制,返回结果的展示形式单一等。

未来3年,AI可穿戴市场将迎来高速发展,整体规模预计达到10亿设备量级,保持30%的高年均增长速度。相应的,未来市场对芯片和传感器的需求都会大量增加。

在高速增长的过程中,AI可穿戴同样面临许多迭代技术挑战,包括设备的小型化设计、低功耗优化等等,在算法上需要大量针对性的优化支持。例如,在地铁嘈杂环境下使用耳机通话,要利用算法实现环境降噪处理;为实现设备更低功耗,需要提高代码效率并对芯片进行优化;协调运动、心率等大量传感器为用户提供有用的信息,也需要算法优化来攻克。

发言中,李勤还指出AIoT的产品一定是设备端到云端的整体系统。而出门问问采用将芯片、传感器和AI算法结合的整体战略,发挥端到端的完整技术栈,将端上和云上的计算融合,以及产品和系统集成经验的竞争优势。另外,出门问问还在开展与芯片厂商的深度合作,实现算法根据使用场景做优化,算法针对芯片的代码优化,结合系统集成和产品验证,提供整套技术方案。这意味着产品厂商不用在算法开发和系统集成工作上消耗企业资源,可以集中精力定义和开发产品。

智能手表AI运动算法TicMotion

在TicWatch智能手表上,出门问问研发了AI运动算法TicMotion,自动识别和记录用户健走、跑步、骑行、游泳时的各项运动数据。该算法基于深度学习的算法架构,支持手势姿态识别、睡眠健康等功能,可运行在MCUDSP或AP芯片上。在意法半导体的STM32F412芯片上,实现16MHz时钟频率下的0.13 MIPS执行效率。

智能手表语音交互算法

针对智能手表的语音交互,出门问问研发了基于深度神经网络的AI语音算法,旗下的出门问问语音助手是谷歌Wear OS官方合作的中文语音助手。

出门问问在智能手表上,拥有单麦和双麦的音频降噪算法,语音信号压缩和BLE语音传输,支持语音唤醒词,支持直接命令词的识别。这些算法也是基于深度学习,但却是超低功耗的,只需要超低的内存需求和计算力便可以运行。例如,唤醒词和命令词模型只有20KB,只需占用50KB左右的内存,在意法半导体的STM32F469芯片上实现了36MIPS的执行效率。

智能耳机交互算法TicHear

针对智能耳机的交互,出门问问自主研发了TicHear语音交互算法,能够有效地屏蔽和抑制环境噪音和干扰,实现小型可穿戴设备语音唤醒及直接命令词控制。

而之所以开发TicHear,是因为出门问问发现在TWS智能耳机上还有很多技术难点没有解决。

一是耳机面向的是复杂的需求和使用场景。在需求上,人们需要用耳机听音乐、打电话、做语音交互。在使用场景上,耳机的使用环境非常复杂多变,基本是走到哪儿戴到哪儿,即使是在地铁、马路边、商场等嘈杂环境,耳机也要能够稳定可靠的工作。这些都对算法地性能提出了极高的要求。

二是耳机的快捷智能控制。对于智能耳机来说,需要有一些常用的直接语音控制命令,尤其在双手都不方便的时候,能够快捷地用语音来实现接听电话、控制音量、切换下一首歌等功能。

三是如何对耳机“说”清楚。过去两年,主动降噪耳机在市场上热销,但它解决的只是“听”清楚的问题,在你听音乐的时候/做飞机的时候,有效实现周围环境噪音的屏蔽效果。但在实际的使用中,如何让你打电话、做语音交互的时候,实现更清晰的声音传递,还是一个有待解决地问题。

另外,智能耳机也面临诸多的技术挑战,例如佩戴舒适性、体积大小,与电池容量、待机时间之间不可调和的矛盾,对芯片和算法低功耗的要求高;系统集成、算法开发的高复杂度;内存空间和算力的资源限制等。

面对用户痛点和技术挑战,出门问问选择创造性的解决问题,采取将硬件结构设计和算法设计相结合;与芯片、系统供应商深度合作;把核心算法的代码用汇编重写以提高运行效率等措施,给客户提供一套完整的解决方案。

具体来说,在音频信号处理上,TicHear算法进行了双麦的波束成形,做定向拾音和降噪的深度优化,可以抑制最高20dB的环境噪音,仅占用20KB的内存,并在高通QCC5100系列芯片上实现15MIPS的执行效率。

在语音交互算法上,TicHear支持语音唤醒词,支持10个左右直接命令词的识别,并且基于深度学习的算法,实现了超低功耗和超低内存占用。将唤醒词和命令词做到大约20KB的模型大小和50KB总的内存占用,在高通QCC5100系列芯片上实现10MIPS的执行效率。同时,TicHear可和手机软件配合开发,支持二次唤醒验证、内容和服务的查询、唤醒词和语音查询一起说出等功能,提供更好的用户体验。

李勤向现场观众展示了出门问问双麦信号处理算法,该算法能够有效地屏蔽环境噪音和干扰,清晰采集语音信号。如图所示,上方的声音波形图是在马路边场景所采集的原始声音信号,下方的声音波形图是经过出门问问双麦信号处理算法处理后的声音信号,可以清晰的看到已将环境噪音降低20db左右,几乎可以忽略不计,经过算法处理后的声音信号,极大地提高了语音识别的准确率和唤醒率。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技推出EPC-TWL无风扇嵌入式系统

    科技近日正式推出全新EPC-TWL无风扇嵌入式系统,采用最新Intel® Twin Lake系列处理,结合高效能运算、低功耗设计与丰富I/O扩充能力,为工业自动化、智能零售、边缘AI
    的头像 发表于 05-28 09:34 255次阅读

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    如何成为一名高薪嵌入式工程师?

    Designer、Eagle等工具,理解高速信号完整性、EMC设计。 传感器与外设:熟悉常见传感器(如加速度计、陀螺仪、温湿度传感器)的接口和驱动开发。 二、深入嵌入式系统开发
    发表于 04-09 09:03

    RZ/V2M:助力嵌入式设备的Vision AI高性能芯片

    RZ/V2M:助力嵌入式设备的Vision AI高性能芯片 在当今嵌入式设备飞速发展的时代,Vision AI技术的应用越来越广泛,对
    的头像 发表于 04-01 13:50 267次阅读

    嵌入式AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    ”与“工业安全”的对立,为嵌入式开发提供“高效+可靠”的全新路径,推动AI技术从实验室走向工业产线,加速企业数字化转型与智能化升级。 ▌降低技术门槛与适配成本:依托图形化低代码开发与一键芯片
    发表于 03-18 13:49

    半导体嵌入式单元测试的核心技术、工具选型与落地全流程

    一个微小的逻辑错误都可能引发硬件锁死、传感器误触发甚至人身安全事故。工业控制领域同样面临着类似的挑战。工业机器人的嵌入式软件需要精确控制多轴运动、实时处理传感器数据,一旦出现故障,可能导致生产线瘫痪
    发表于 03-06 14:55

    嵌入式存储芯片AI智能后视镜中的应用

    在汽车智能化浪潮中,传统后视镜正加速迭代为“AI智能终端”——它不再只是简单的光学反射装置,而是集成了高清摄像、ADAS预警、AR导航、语音交互等多重功能的行车安全核心。而这一切智能体验的背后,都离不开
    的头像 发表于 01-22 14:01 3931次阅读
    <b class='flag-5'>嵌入式</b>存储<b class='flag-5'>芯片</b>在<b class='flag-5'>AI</b>智能后视镜中的应用

    AMD重磅打造边缘AI,CES2026官宣这颗嵌入式处理

    电子发烧友网报道(文/黄晶晶)数据显示,边缘AI嵌入式处理市场将随 AIoT、工业 4.0、自动驾驶等领域渗透加速增长,预计 2026-2030 年复合增长率维持 20% 以上。ABI
    的头像 发表于 01-07 15:19 1.1w次阅读
    AMD重磅<b class='flag-5'>打造</b>边缘<b class='flag-5'>AI</b>,CES2026官宣这颗<b class='flag-5'>嵌入式</b>处理<b class='flag-5'>器</b>!

    嵌入式和FPGA的区别

    、光传输) 高性能计算(算法加速) 原型验证(ASIC前期验证) 军事航天(抗辐射、高可靠需求) 未来发展趋势 随着技术的融合,我们看到嵌入式处理与FPGA结合的SoC器件
    发表于 11-19 06:55

    押注千亿智能家电市场,海思嵌入式AI芯片有何大招?

    在白色家电的控制领域,扮演核心角色,负责传感器数据处理、电机控制和逻辑判断的传统MCU计算力有限,无法支持复杂的AI算法。上海海思针对这一痛点,推出了内置eAI引擎的嵌入式
    的头像 发表于 10-28 07:21 7475次阅读
    押注千亿智能家电市场,海思<b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>有何大招?

    唯创知音AI语音交互芯片与模组介绍

    AI语音交互已经成为智能产品的基础配置,比如常见的AI玩具、智能家居、带AI功能的蓝牙音响,还有汽车的智能车机和智能穿戴设备等。唯创知音顺应
    的头像 发表于 09-17 15:51 1101次阅读
    唯创知音<b class='flag-5'>AI</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b><b class='flag-5'>芯片</b>与模组介绍

    2025嵌入式行业现状如何?

    →CTO。跨界方向:智能硬件产品经理、芯片设计工程师。 2025年嵌入式行业正处于技术变革与市场需求爆发的黄金期,架构革新、AI融合、实时性与安全强化成为核心驱动力。就业市场呈现“初级
    发表于 08-25 11:34

    盘点嵌入式就业所需要的技能有哪些?

    基础,能够进行高性能计算和数据处理。 - 了解自动驾驶技术的基本原理,如传感器融合、路径规划等。 - 具备良好的沟通能力和团队合作精神,能够与不同领域的工程师协作。 2.智能手机行业: - 熟悉嵌入式编程
    发表于 08-11 15:43

    聚徽厂家嵌入式工业平板:低功耗技术与卓越性能的完美融合

    低功耗技术与卓越性能的完美融合,为工业领域用户带来了更优质、高效的设备解决方案。 聚徽嵌入式工业平板的低功耗技术是其核心亮点之一。在硬件层面,聚徽严格筛选低功耗的核心组件。处理作为平
    的头像 发表于 07-01 17:14 856次阅读

    诚邀高校老师参加:2025暑期AI具身智能 + 嵌入式师资班,教您把前沿技术 “搬进” 课堂

    在人工智能与嵌入式技术深度融合的当下,高校教师专业能力提升迫在眉睫。华清远见2025暑假第三十二届全国高校AI具身智能与嵌入式高级师资培训班,精准聚焦行业前沿,为高校教师
    的头像 发表于 06-23 11:27 918次阅读
    诚邀高校老师参加:2025暑期<b class='flag-5'>AI</b>具身智能 + <b class='flag-5'>嵌入式</b>师资班,教您把前沿技术 “搬进” 课堂