0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于语音的虚拟个人助理将驱动音频行业的发展

电子工程师 来源:网络整理 作者:佚名 2019-11-19 08:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“Voice”不仅是始于2010年的国际真人秀电视唱歌比赛(国内是“中国好声音”),还是新的音频行业应用的核心。音频行业已经历了许多发展阶段。20世纪60年代出现了高保真和立体声音乐,以及像平克·弗洛伊德(Pink Floyd)这样的流行乐队。20世纪80年代出现了数字音乐,声音的清晰度成为流行乐队(例如Dire Straits)的特征。但是,在20世纪90年代末和21世纪初,手机的普及带动了语音处理技术的进步。在20世纪10年代初,出现了基于语音的虚拟个人助理(VPA),例如苹果(Apple)的Siri、亚马逊(Amazon)的Alexa和谷歌(Google)的Google Assistant。

据麦姆斯咨询介绍,基于语音的虚拟个人助理是当今音频行业的主要驱动力。该新兴应用的一个有趣特性是它可以在各种系统中“植入”,例如智能手机智能音箱、智能手表、无线耳机、汽车、智能电视和遥控器等,甚至出现了带有语音识别功能的垃圾桶。这种应用基于音频系统的传统组件:麦克风、扬声器、音频编解码器和音频放大器。但它也依赖于与计算和分析语音数据相关的新组件,这是由消费类人工智能AI)的出现而推动发展。

麦克风、音频IC和微型扬声器的消费类市场预计将从2018年的141亿美元增长到2024年的208亿美元,复合年增长率(CAGR)为6.6%。通过观察MEMS麦克风的出货量增长,我们可以了解到所涉及的终端产品的发展情况。智能音箱中的MEMS麦克风出货量正经历13%的复合年增长率,预计2024年将达到12亿颗。在无线耳机方面,MEMS麦克风出货量的复合年增长率达到29%,预计2024年将达到13亿颗。

音频行业生态系统市场预测(2018~2024年)

人工智能(AI)技术为音频行业带来价值

音频行业的部分增长依赖于人工智能带来的价值。更准确地说,人工智能技术使得基于语音的虚拟个人助理可以渗透至智能音箱、无线耳机、智能手表等产品之中,并促使所有音频组件的增长。人工智能支持两项关键的音频功能:“计算”和“分析”。“计算”支持复杂的音频功能,如声源定位和语音识别,并在云平台或边缘设备中执行。“分析”包括更复杂的操作,例如用于市场营销的大数据分析,并在云平台执行。

音频价值链的发展

音频与人工智能的结合产生巨大的商业机会,因为人工智能将音频组件“打进了”很多新系统。对于人类来说,这也是一个好事情,允许人们在烹饪时通过智能音箱,或在慢跑时通过无线耳机,向虚拟个人助理发出语音命令。

如果虚拟个人助理成为汽车人机接口的标准,也可以拯救生命。但是,这些总是处于监听状态的系统可能会对新的音频业务构成威胁。2013年,爱德华·斯诺登(Edward Snowden)披露的全球监控信息表明,这些新技术将如何导致社会的大规模监控。

尽管如此,在音频产业链之中仍存在一场“战斗”——新的人工智能功能应该放入哪个组件?“分析”需要强大的处理能力和对大量数据的访问,预计还将留在云平台。人工智能处理,如语音识别,如今主要在云平台完成。但是,如果应用处理器(AP)拥有更强的计算能力,并能实现更低的延迟和更高的隐私保护,则人工智能处理有望在边缘设备完成。在高端智能手机中,音频专用编解码器和放大器芯片有望保留,因为它们需要精心的模拟设计和制造。

音频产业链

哪些厂商正在享受音频市场的红利?

这个美好的音频市场“大饼”如何在不同的参与者之间分享呢?对于MEMS麦克风,楼氏电子(Knowles)和歌尔股份(Goertek)是主要的参与者,在2018年的12亿美元市场中,楼氏电子占据39%份额,而歌尔股份占据28%份额。近几年,楼氏电子的营收趋于饱和,在“对抗”提供低成本解决方案的中国麦克风厂商。此外,英飞凌(Infineon)除了为歌尔股份和瑞声科技(AAC)等厂商提供麦克风裸片,还开始着手自己生产并销售MEMS麦克风成品。

音频价值链

对于音频编解码器和放大器,Cirrus Logic高通(Qualcomm)、德州仪器Texas Instruments)是主要的参与者,在2018年的34亿美元的市场中,分别占据35%、18%、12%的份额。Cirrus Logic是明确的市场领导者,但依赖于苹果公司。

将来,人工智能处理可能会在厂商之间。苹果、高通和海思等应用处理器厂商将整合人工智能处理功能。楼氏电子和歌尔股份则提议将人工智能功能与编解码器、数字信号处理功能集成于一颗专用音频芯片。另一方面,诸如CEVA和Xperi之类的知识产权(IP)供应商正致力于为人工智能处理设计芯片。不管怎样,人工智能都吸引了所有人的注意力。

最后,不断扩展的用例正在生成大量新数据,这些数据推动了人工智能的发展,并提供更多的功能。还有什么比自己的声音更能无缝地控制智能设备呢?这是整个供应链中音频参与者的下一个“战场”——语音竞技场!

语音技术发展路线图

本报告涉及的部分公司:AAC Technologies, Alibaba, Amazon, ams AG, Analog Devices, Apple, ASE, Audience, Audiopixels, Bosch Sensortec, BSE, CEVA, Cirrus Logic, DSP Group, Gettop, Goertek, Google, Harman, Hosiden, HTC, Huawei, Infineon, Intel, InvenSense, Knowles, MEMSensing, Merus Audio, Motorola, NeoMEMS, Nokia, NXP, Omron, Oppo, Qualcomm, Samsung, SensiBel, Sony, STMicroelectronics, TDK-InvenSense, Texas Instruments, TSMC, USound, Vesper, XFab, Xiaomi, xMOS…

若需要购买《MEMS麦克风、微型扬声器和音频解决方案-2019版》报告,请发E-mail:wangyi#memsconsulting.com(#换成@)。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3226

    浏览量

    86310
  • 语音
    +关注

    关注

    3

    文章

    406

    浏览量

    40086
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266900
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么WT2605C蓝牙音频语音芯片能成为大功率IO驱动的新标杆?

    音频设备日益追求高性能、低功耗的今天,一款芯片能否在驱动能力上实现突破,直接决定了产品的设计灵活性与用户体验。广州唯创电子最新推出的WT2605C蓝牙音频语音芯片,凭借最高可达64m
    的头像 发表于 04-03 08:27 134次阅读
    为什么WT2605C蓝牙<b class='flag-5'>音频</b><b class='flag-5'>语音</b>芯片能成为大功率IO<b class='flag-5'>驱动</b>的新标杆?

    为什么WT2003H语音芯片能实现bin文件板载更新?支持宽范围音频码率有何优势?

    在板更新技术以及8kbps~320kbps的宽范围音频码率支持,正在重新定义语音芯片的应用边界。本文深入解析这款MP3语音芯片的技术亮点及其为各
    的头像 发表于 03-13 08:33 161次阅读
    为什么WT2003H<b class='flag-5'>语音</b>芯片能实现bin文件板载更新?支持宽范围<b class='flag-5'>音频</b>码率有何优势?

    构建语音入口:模组化音频系统选型关键要素

    在构建具备语音交互能力的智能设备时,音频前端系统的稳定性与灵敏度直接影响用户体验。采用集成化音频模组可大幅缩短研发周期,但选型不当易导致唤醒率低、误识别等问题。本文围绕灵敏度、抗干扰、软硬件协同
    的头像 发表于 02-09 15:06 228次阅读
    构建<b class='flag-5'>语音</b>入口:模组化<b class='flag-5'>音频</b>系统选型关键要素

    探索MAX9860:16位单声道音频语音编解码器的卓越性能与应用

    探索MAX9860:16位单声道音频语音编解码器的卓越性能与应用 在当今的音频设备领域,低功耗、高性能的音频编解码器需求日益增长。Maxim Integrated的MAX9860 16
    的头像 发表于 01-28 16:10 294次阅读

    语音跳线:构建高效音频传输系统的核心组件

    在会议系统、录音棚、广播电台等专业音频场景中,语音跳线作为连接麦克风、调音台、功放等设备的“神经末梢”,其性能直接影响声音信号的保真度与传输稳定性。本文从技术原理、应用场景、选型要点三个维度,解析
    的头像 发表于 01-19 10:12 364次阅读
    <b class='flag-5'>语音</b>跳线:构建高效<b class='flag-5'>音频</b>传输系统的核心组件

    商汤科技推出实时语音驱动数字人技术SekoTalk

    在数字人技术蓬勃发展的今天,生成效率仍是行业面临的核心挑战。商汤科技凭借在生成式 AI 与多模态交互领域的深厚积累,推出了实时语音驱动数字人技术——SekoTalk。
    的头像 发表于 12-17 13:52 589次阅读
    商汤科技推出实时<b class='flag-5'>语音</b><b class='flag-5'>驱动</b>数字人技术SekoTalk

    WT2605C蓝牙音频语音芯片:大功率IO驱动能力开启音频技术新纪元

    一、突破性驱动技术重新定义音频芯片标准1.1技术规格的重大飞跃广州唯创电子最新推出的WT2605C蓝牙音频语音芯片,以其卓越的64mA大功率IO驱动
    的头像 发表于 11-11 09:00 874次阅读
    WT2605C蓝牙<b class='flag-5'>音频</b><b class='flag-5'>语音</b>芯片:大功率IO<b class='flag-5'>驱动</b>能力开启<b class='flag-5'>音频</b>技术新纪元

    广州唯创电子WT2003H语音芯片系列:通过bin文件实现板载语音更新,支持宽范围音频码率

    功能和8kbps~320kbps宽范围音频码率支持,为行业提供了高效便捷的声音播报芯片解决方案。一、bin文件板载语音更新:简化流程,高效灵活WT2003H系列语音芯片突
    的头像 发表于 10-27 08:48 644次阅读
    广州唯创电子WT2003H<b class='flag-5'>语音</b>芯片系列:通过bin文件实现板载<b class='flag-5'>语音</b>更新,支持宽范围<b class='flag-5'>音频</b>码率

    广州唯创电子WT2003H MP3语音芯片方案:强大、灵活且易于集成的高性能音频解决方案

    在智能化设备蓬勃发展的数字时代,高品质音频处理能力已成为产品差异化竞争的关键要素。作为专业的语音IC厂家,广州唯创电子推出的WT2003HMP3音频播放芯片方案,以其卓越的
    的头像 发表于 10-27 08:33 591次阅读
    广州唯创电子WT2003H MP3<b class='flag-5'>语音</b>芯片方案:强大、灵活且易于集成的高性能<b class='flag-5'>音频</b>解决方案

    广州唯创电子混音IC播报语音芯片:革新音频应用的新力量

    技术发展的新引擎。广州唯创电子作为国内领先的语音IC厂家,凭借深厚的技术积累和创新研发能力,推出了一系列高性能混音播报语音芯片,为多场景音频应用提供了全新的解决方案
    的头像 发表于 09-24 09:25 691次阅读
    广州唯创电子混音IC播报<b class='flag-5'>语音</b>芯片:革新<b class='flag-5'>音频</b>应用的新力量

    Waytronic广州唯创电子 MP3语音芯片:现代智能设备的音频解决方案

    高品质音频与低功耗设计的完美结合,为智能设备注入声音灵魂在智能化浪潮席卷全球的今天,语音交互已成为人机互动的重要方式。MP3语音芯片作为高度集成的音频处理解决方案,正以其出色的性能和创
    的头像 发表于 09-23 08:41 1015次阅读
    Waytronic广州唯创电子 MP3<b class='flag-5'>语音</b>芯片:现代智能设备的<b class='flag-5'>音频</b>解决方案

    开源TTS应用:打破技术垄断,让语音合成成为每个人的创造力工具

    传统语音合成技术往往被巨头垄断,成本高且定制难。开源TTS应用的诞生,彻底改变游戏规则。其开放源代码让中小企业、个人开发者乃至普通用户都能低成本接入并改造语音技术,TTS变为触手可及
    的头像 发表于 08-15 14:03 723次阅读
    开源TTS应用:打破技术垄断,让<b class='flag-5'>语音</b>合成成为每<b class='flag-5'>个人</b>的创造力工具

    解锁高品质音频体验:探索音频质量评估与测试的科学之道

    。主观方法如MOS评分直观反映人类听感,而客观方法如PESQ和E-model以高效算法驱动自动化测试,二者结合为行业提供了精准的质量评估方案。本文深入解析音频质量评估的核心方法与测试
    发表于 07-22 11:15

    芯资讯|广州唯创电子MP3语音芯片IC的音频解码方式解析

    音频解码是语音芯片的核心功能之一,决定了音质表现和应用场景的适配性。广州唯创电子作为国内领先的语音芯片厂商,其MP3语音芯片系列(如WT2003H)以灵活的解码能力和高兼容性著称。本文
    的头像 发表于 05-28 08:48 1009次阅读
    芯资讯|广州唯创电子MP3<b class='flag-5'>语音</b>芯片IC的<b class='flag-5'>音频</b>解码方式解析

    芯知识|广州唯创电子WT2605C音频蓝牙语音芯片:多模式音频更新与核心特性解析

    随着物联网与智能设备的快速发展语音交互技术成为提升用户体验的关键。广州唯创电子推出的WT2605C音频蓝牙语音芯片,凭借其高度集成化设计、多样化的
    的头像 发表于 05-22 08:49 809次阅读
    芯知识|广州唯创电子WT2605C<b class='flag-5'>音频</b>蓝牙<b class='flag-5'>语音</b>芯片:多模式<b class='flag-5'>音频</b>更新与核心特性解析