0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于语音的虚拟个人助理将驱动音频行业的发展

电子工程师 来源:网络整理 作者:佚名 2019-11-19 08:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“Voice”不仅是始于2010年的国际真人秀电视唱歌比赛(国内是“中国好声音”),还是新的音频行业应用的核心。音频行业已经历了许多发展阶段。20世纪60年代出现了高保真和立体声音乐,以及像平克·弗洛伊德(Pink Floyd)这样的流行乐队。20世纪80年代出现了数字音乐,声音的清晰度成为流行乐队(例如Dire Straits)的特征。但是,在20世纪90年代末和21世纪初,手机的普及带动了语音处理技术的进步。在20世纪10年代初,出现了基于语音的虚拟个人助理(VPA),例如苹果(Apple)的Siri、亚马逊(Amazon)的Alexa和谷歌(Google)的Google Assistant。

据麦姆斯咨询介绍,基于语音的虚拟个人助理是当今音频行业的主要驱动力。该新兴应用的一个有趣特性是它可以在各种系统中“植入”,例如智能手机智能音箱、智能手表、无线耳机、汽车、智能电视和遥控器等,甚至出现了带有语音识别功能的垃圾桶。这种应用基于音频系统的传统组件:麦克风、扬声器、音频编解码器和音频放大器。但它也依赖于与计算和分析语音数据相关的新组件,这是由消费类人工智能AI)的出现而推动发展。

麦克风、音频IC和微型扬声器的消费类市场预计将从2018年的141亿美元增长到2024年的208亿美元,复合年增长率(CAGR)为6.6%。通过观察MEMS麦克风的出货量增长,我们可以了解到所涉及的终端产品的发展情况。智能音箱中的MEMS麦克风出货量正经历13%的复合年增长率,预计2024年将达到12亿颗。在无线耳机方面,MEMS麦克风出货量的复合年增长率达到29%,预计2024年将达到13亿颗。

音频行业生态系统市场预测(2018~2024年)

人工智能(AI)技术为音频行业带来价值

音频行业的部分增长依赖于人工智能带来的价值。更准确地说,人工智能技术使得基于语音的虚拟个人助理可以渗透至智能音箱、无线耳机、智能手表等产品之中,并促使所有音频组件的增长。人工智能支持两项关键的音频功能:“计算”和“分析”。“计算”支持复杂的音频功能,如声源定位和语音识别,并在云平台或边缘设备中执行。“分析”包括更复杂的操作,例如用于市场营销的大数据分析,并在云平台执行。

音频价值链的发展

音频与人工智能的结合产生巨大的商业机会,因为人工智能将音频组件“打进了”很多新系统。对于人类来说,这也是一个好事情,允许人们在烹饪时通过智能音箱,或在慢跑时通过无线耳机,向虚拟个人助理发出语音命令。

如果虚拟个人助理成为汽车人机接口的标准,也可以拯救生命。但是,这些总是处于监听状态的系统可能会对新的音频业务构成威胁。2013年,爱德华·斯诺登(Edward Snowden)披露的全球监控信息表明,这些新技术将如何导致社会的大规模监控。

尽管如此,在音频产业链之中仍存在一场“战斗”——新的人工智能功能应该放入哪个组件?“分析”需要强大的处理能力和对大量数据的访问,预计还将留在云平台。人工智能处理,如语音识别,如今主要在云平台完成。但是,如果应用处理器(AP)拥有更强的计算能力,并能实现更低的延迟和更高的隐私保护,则人工智能处理有望在边缘设备完成。在高端智能手机中,音频专用编解码器和放大器芯片有望保留,因为它们需要精心的模拟设计和制造。

音频产业链

哪些厂商正在享受音频市场的红利?

这个美好的音频市场“大饼”如何在不同的参与者之间分享呢?对于MEMS麦克风,楼氏电子(Knowles)和歌尔股份(Goertek)是主要的参与者,在2018年的12亿美元市场中,楼氏电子占据39%份额,而歌尔股份占据28%份额。近几年,楼氏电子的营收趋于饱和,在“对抗”提供低成本解决方案的中国麦克风厂商。此外,英飞凌(Infineon)除了为歌尔股份和瑞声科技(AAC)等厂商提供麦克风裸片,还开始着手自己生产并销售MEMS麦克风成品。

音频价值链

对于音频编解码器和放大器,Cirrus Logic高通(Qualcomm)、德州仪器Texas Instruments)是主要的参与者,在2018年的34亿美元的市场中,分别占据35%、18%、12%的份额。Cirrus Logic是明确的市场领导者,但依赖于苹果公司。

将来,人工智能处理可能会在厂商之间。苹果、高通和海思等应用处理器厂商将整合人工智能处理功能。楼氏电子和歌尔股份则提议将人工智能功能与编解码器、数字信号处理功能集成于一颗专用音频芯片。另一方面,诸如CEVA和Xperi之类的知识产权(IP)供应商正致力于为人工智能处理设计芯片。不管怎样,人工智能都吸引了所有人的注意力。

最后,不断扩展的用例正在生成大量新数据,这些数据推动了人工智能的发展,并提供更多的功能。还有什么比自己的声音更能无缝地控制智能设备呢?这是整个供应链中音频参与者的下一个“战场”——语音竞技场!

语音技术发展路线图

本报告涉及的部分公司:AAC Technologies, Alibaba, Amazon, ams AG, Analog Devices, Apple, ASE, Audience, Audiopixels, Bosch Sensortec, BSE, CEVA, Cirrus Logic, DSP Group, Gettop, Goertek, Google, Harman, Hosiden, HTC, Huawei, Infineon, Intel, InvenSense, Knowles, MEMSensing, Merus Audio, Motorola, NeoMEMS, Nokia, NXP, Omron, Oppo, Qualcomm, Samsung, SensiBel, Sony, STMicroelectronics, TDK-InvenSense, Texas Instruments, TSMC, USound, Vesper, XFab, Xiaomi, xMOS…

若需要购买《MEMS麦克风、微型扬声器和音频解决方案-2019版》报告,请发E-mail:wangyi#memsconsulting.com(#换成@)。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3135

    浏览量

    84933
  • 语音
    +关注

    关注

    3

    文章

    403

    浏览量

    39493
  • 人工智能
    +关注

    关注

    1813

    文章

    49743

    浏览量

    261583
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    WT2605C蓝牙音频语音芯片:大功率IO驱动能力开启音频技术新纪元

    一、突破性驱动技术重新定义音频芯片标准1.1技术规格的重大飞跃广州唯创电子最新推出的WT2605C蓝牙音频语音芯片,以其卓越的64mA大功率IO驱动
    的头像 发表于 11-11 09:00 403次阅读
    WT2605C蓝牙<b class='flag-5'>音频</b><b class='flag-5'>语音</b>芯片:大功率IO<b class='flag-5'>驱动</b>能力开启<b class='flag-5'>音频</b>技术新纪元

    语音芯片白噪音支持功能详解:打造舒适音频体验的关键技术 | 广州唯创电子语音IC厂家

    前言:探索语音芯片的白噪音技术世界在现代电子设备日益普及的今天,语音芯片的功能创新正在不断丰富着我们的日常生活体验。作为专业的语音IC厂家,广州唯创电子始终致力于音频技术的创新研发,其
    的头像 发表于 11-06 08:56 180次阅读
    <b class='flag-5'>语音</b>芯片白噪音支持功能详解:打造舒适<b class='flag-5'>音频</b>体验的关键技术 | 广州唯创电子<b class='flag-5'>语音</b>IC厂家

    广州唯创电子WT2003H语音芯片系列:通过bin文件实现板载语音更新,支持宽范围音频码率

    功能和8kbps~320kbps宽范围音频码率支持,为行业提供了高效便捷的声音播报芯片解决方案。一、bin文件板载语音更新:简化流程,高效灵活WT2003H系列语音芯片突
    的头像 发表于 10-27 08:48 227次阅读
    广州唯创电子WT2003H<b class='flag-5'>语音</b>芯片系列:通过bin文件实现板载<b class='flag-5'>语音</b>更新,支持宽范围<b class='flag-5'>音频</b>码率

    广州唯创电子WT2003H MP3语音芯片方案:强大、灵活且易于集成的高性能音频解决方案

    在智能化设备蓬勃发展的数字时代,高品质音频处理能力已成为产品差异化竞争的关键要素。作为专业的语音IC厂家,广州唯创电子推出的WT2003HMP3音频播放芯片方案,以其卓越的
    的头像 发表于 10-27 08:33 178次阅读
    广州唯创电子WT2003H MP3<b class='flag-5'>语音</b>芯片方案:强大、灵活且易于集成的高性能<b class='flag-5'>音频</b>解决方案

    广州唯创电子混音IC播报语音芯片:革新音频应用的新力量

    技术发展的新引擎。广州唯创电子作为国内领先的语音IC厂家,凭借深厚的技术积累和创新研发能力,推出了一系列高性能混音播报语音芯片,为多场景音频应用提供了全新的解决方案
    的头像 发表于 09-24 09:25 359次阅读
    广州唯创电子混音IC播报<b class='flag-5'>语音</b>芯片:革新<b class='flag-5'>音频</b>应用的新力量

    Waytronic广州唯创电子 MP3语音芯片:现代智能设备的音频解决方案

    高品质音频与低功耗设计的完美结合,为智能设备注入声音灵魂在智能化浪潮席卷全球的今天,语音交互已成为人机互动的重要方式。MP3语音芯片作为高度集成的音频处理解决方案,正以其出色的性能和创
    的头像 发表于 09-23 08:41 343次阅读
    Waytronic广州唯创电子 MP3<b class='flag-5'>语音</b>芯片:现代智能设备的<b class='flag-5'>音频</b>解决方案

    开源TTS应用:打破技术垄断,让语音合成成为每个人的创造力工具

    传统语音合成技术往往被巨头垄断,成本高且定制难。开源TTS应用的诞生,彻底改变游戏规则。其开放源代码让中小企业、个人开发者乃至普通用户都能低成本接入并改造语音技术,TTS变为触手可及
    的头像 发表于 08-15 14:03 424次阅读
    开源TTS应用:打破技术垄断,让<b class='flag-5'>语音</b>合成成为每<b class='flag-5'>个人</b>的创造力工具

    解锁高品质音频体验:探索音频质量评估与测试的科学之道

    。主观方法如MOS评分直观反映人类听感,而客观方法如PESQ和E-model以高效算法驱动自动化测试,二者结合为行业提供了精准的质量评估方案。本文深入解析音频质量评估的核心方法与测试
    发表于 07-22 11:15

    芯资讯|广州唯创电子MP3语音芯片IC的音频解码方式解析

    音频解码是语音芯片的核心功能之一,决定了音质表现和应用场景的适配性。广州唯创电子作为国内领先的语音芯片厂商,其MP3语音芯片系列(如WT2003H)以灵活的解码能力和高兼容性著称。本文
    的头像 发表于 05-28 08:48 562次阅读
    芯资讯|广州唯创电子MP3<b class='flag-5'>语音</b>芯片IC的<b class='flag-5'>音频</b>解码方式解析

    芯知识|广州唯创电子WT2605C音频蓝牙语音芯片:多模式音频更新与核心特性解析

    随着物联网与智能设备的快速发展语音交互技术成为提升用户体验的关键。广州唯创电子推出的WT2605C音频蓝牙语音芯片,凭借其高度集成化设计、多样化的
    的头像 发表于 05-22 08:49 464次阅读
    芯知识|广州唯创电子WT2605C<b class='flag-5'>音频</b>蓝牙<b class='flag-5'>语音</b>芯片:多模式<b class='flag-5'>音频</b>更新与核心特性解析

    工业电机行业现状及未来发展趋势分析

    引言:工业电机行业作为现代制造业的核心动力设备之一,具有广阔的发展前景和巨大的市场潜力。随着技术的不断进步和市场需求的持续增长,工业电机行业迎来更多的
    发表于 03-31 14:35

    2025年全球个人智能音频市场出货量增至5.33亿台

    根据知名市场调研机构Canalys的最新报告,2025年全球个人智能音频市场迎来显著增长,预计出货量达到5.33亿台,相较于2024年的4.94亿台,实现了8%的同比增长。这一数据
    的头像 发表于 02-18 13:55 1348次阅读

    联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

    智能手机、智能电视、Android平板电脑、语音助理设备(Voice Assistant Devices, VAD),以及基于Arm架构Chromebook的芯片出货量皆居行业翘楚,并大力投资多项技术
    的头像 发表于 01-07 16:26 830次阅读

    高效电梯语音播报:基于复旦微FM33LF016的DAC音频方案

    目前,电梯语音播报常用的音频输出技术包括PWM(脉冲宽度调制)和DAC(数字-模拟转换器)。相比PWM,DAC技术通过数字音频信号转换为模拟信号,提供更高的音质和更低的失真度。无论是
    的头像 发表于 12-27 16:33 993次阅读
    高效电梯<b class='flag-5'>语音</b>播报:基于复旦微FM33LF016的DAC<b class='flag-5'>音频</b>方案

    大联大推出基于MediaTek Genio 130与ChatGPT的AI语音助理方案

    大联大控股,作为亚太地区市场领先的半导体元器件分销商,近日宣布了一项重要创新。其旗下子公司品佳,成功推出了基于联发科技(MediaTek)Genio 130芯片与ChatGPT功能的AI语音助理方案
    的头像 发表于 12-11 11:07 1122次阅读