0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

离线语音进入快车道,启英泰伦发布全新AI语音芯片!

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-08-05 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)语音识别人工智能的重要分支之一,早在2010年开始就得到发展,并且逐渐在各个领域成熟应用。不过AI语音芯片和算法的研发仍然面临众多难题,不少企业为此坚持研究,不断对技术和产品进行迭代升级,以求取得突破。

启英泰伦是国内领先的AI语音芯片企业,日前,该公司正式发布了全新的第三代智能语音芯片系列,相比于上一代产品,这款芯片创下了算力更高、高度集成和算法新高的记录,进一步解决了业界长久以来难以突破的难题。

AI语音芯片研发面临哪些难题

近几年,AI语音芯片在智能家居、智能车载、智能穿戴等领域的渗透率快速提升,未来随着技术的不断迭代,AI语音芯片在各领域的渗透率和市场规模将会持续扩大。

智能家居方面,当前随着AI语音芯片的价格已经大幅下降,越来越多的厂商倾向于采用AI语音芯片,来替代传统的AP及MCU芯片和IOT芯片,如今AI语音芯片在风扇、茶吧机、取暖桌、空调、插座等众多领域已经开始大规模批量应用。根据调研数据预测,未来5年AI语音芯片在智能家居领域的市场规模将能达到每年2.5亿颗。

智能汽车方面,目前智能汽车中的语音交互多是在云端进行识别处理,然而云端的方式存在无法实时响应、网络无连接时不能使用等问题,因此业界认为端侧语音芯片将会很好的补充云端芯片的不足,预计未来端侧AI语音芯片在车载领域的市场需求每年能达到1亿颗左右。

智能穿戴方面,未来随着芯片尺寸越来越小,成本越来越低,AI语音芯片在穿戴设备上的应用将会越来越多,预计该市场对AI语音芯片的市场需求每年会在千万颗左右。

除了上述市场之外,AI语音芯片还可以在医疗设备、机器人、工业检测等领域得到应用,整体来看,预计未来几年AI语音芯片的市场规模将会快速发展到每年5到10亿颗,随着应用不断拓宽和渗透率不断提升,市场规模可能还将持续不断提升。

虽然存在较大的市场,然而企业在AI语音识别芯片和算法的研发也面临众多需要不断攻克的难题,在此次发布会上,启英泰伦创始人兼CEO何云鹏提到了几点:



1、各种应用场景存在复杂的背景噪声,会影响识别,比如厨电的烟机噪声、炒菜声,客厅的电视声、音乐声,会场的多人声、卖场的高音喇叭声等;2、人类语言种类繁多,如果考虑各地的方言口音,几乎没办法通过大数据训练模型,来满足所有地域口音的识别;3、人类语言的表达非常丰富,要想在设备端实现对任意语言表达的意图理解,也十分困难。

同时,电子设备的发展往往要求在性能或价格上,能够不断改进,这些对于AI语音芯片的研发来说,都是比较大的挑战。

算法、芯片上不断升级,攻克一个个难题


如何解决这些难题呢?一直以来,启英泰伦坚持在芯片和算法两方面不断发力,力求攻克一个个业内难题。截至目前,启英泰伦的技术平台BNPU(脑神经网络处理器)已经迭代三次,从BNPU1.0,BNPU2.0,到BNPU3.0。何云鹏表示,每一代BNPU的问世,都是离线语音芯片和算法的一次突破和语音应用的助推。



具体来看,集成BNPU1.0的一代芯片C11006/CI1002,实现的是端侧语音识别,这是行业首款集成神经网络处理器的语音AI芯片,是离线语音产业应用兴起的标志;集成BNPU2.0的二代芯片CI1102/CI1103及CI1122,不仅实现了离线语音识别功能,还实现了离线声纹识别和命令词自学习等功能。

每颗芯片的迭代,集成度不断增加,成本快速下降,算法功能不断提升。据何云鹏介绍,集成度上,二代系列芯片集成了Audio CODEC、Flash等单元,增加了双麦阵增强处理能力;成本上,一代芯片CI1006成本价为50到90元,CI1102下降到30到40元,二代芯片CI1102/CI1103为15元到25,CI1122下降到了10元到15元之间;算法上,正常安静家居环境下,识别都达到98%以上,65dB左右中强环境噪声下也能实现较好的识别效果。

发布全新三代芯片,端侧NLP技术实现自然语音交互

尽管过去几年在算法和芯片上不断提升,逐渐解决了业界面临的一些难题,然而整个行业仍然存在极难克服的问题,比如:1、离线语音仍然是以命令词为主,对于用户来说,如果命令词多的话,就会很难记住;2、电视新闻,多人声环境,以及噪声强度达到75dB以上的复杂强噪声环境的识别存在困难;3、离线命令词自学习的效果,与大数据训练模型效果仍然存在明显差距,这使得方言问题没有得到彻底解决。

为了攻克这些难题,启英泰伦经过三年时间研发,最终带来BNPU3.0版本,并基于此发布了三代两大系类芯片,一大系列是三代智能语音MCU13;另一大系列是智能语音IOT 23。

相比之前的芯片,三代系列芯片具有更高算力、更高集成度,更高性能。首先看CI13系列芯片,算力方面,该系列内置BNPU 3.0,支持DSP指令扩展的RISC CPU两大内核,主频高达240MHz,具有640KB SRAM,而二代芯片主频是160MHz,内置BNPU2.0,512KB SRAM。



集成度方面,CI13系列芯片集成了Audio Codec模拟MIC接口、数字PDM麦克DMIC接口、通用ADC及MCU常见串口、PWM、GPIO等接口,还集成了4线NOR Flash、3路LDO PMU、高精度RC振荡器等。

通过接上MIC,简单的语音识别应用,外围电路仅需十几个电阻电容,多数情况下可以不需要加晶振;通过串口可以扩展上位机MCU,或WiFi、BLE、2.4G射频芯片;通过通用ADC或IIC可以输入温度、湿度等传感器信号;通过PWM或其它GPIO,可以实现对开关控制电机控制、SPI屏或段码屏显示控制、红外收发控制等。这样,CI13系列芯片既可以作为语音识别或语音信号处理的专用芯片,也可以作为带语音识别功能的MCU主控芯片。



算法方面,CI13系列芯片几乎支持全部信号处理和识别技术,包括单麦自适应降噪、降混响、回声消除、DOA、波束形成、盲源分离、语音活动检测等传统信号技术。

除了具有二代芯片的语音识别、声纹识别外,三代CI13系列芯片还支持基于深度学习的降噪技术(深度降噪)、人声分离技术(深度分离)、以及离线NLP技术。深度降噪技术能在信噪比-5dB 到-10dB的环境噪声下将人声提取出来,实现良好识别。

端侧NLP技术在原来的声学模型、语言模型的基础上增加了意图模型,该意图模型采用联合规则和统计训练的模型来实现端侧语音识别+语义理解。端侧NLP技术具备上下文关联、多轮对话、意图理解等云端NLP的功能,该技术的突破,使得设备彻底不需要依赖云端,也可以实现自然随心的语音交互。



接下来看三代芯片CI23系列CI2305 和CI2306,CI23系列芯片在语音功能和性能与CI13系列芯片相同,主要增加集成了WiFi和BLE,形成语音+WiFi+BLE三合一单芯片,其中CI2305支持离线语音+IOT,CI2306还支持将语音上传,实现离线语音+在线语音+IOT功能。

何云鹏认为对设备控制交互在本地计算会更好,这样可以解决云端计算带来的响应延迟太大体验差,断网无法使用及用户隐私泄露风险,以及云端建设和运营成本太高等问题。

除了不断升级芯片算法性能,降低芯片方案成本,启英泰伦还持续提升应用开发平台和合作生态建设,努力降低AI语音应用的门槛。

据启英泰伦介绍,经过近7年发展,公司已经积累B端客户超过5000名,平台开发者超过了1万名,使用启英泰伦智能语音平台的在校AI学员超过10万名。现在,离线语音方案的年装机量超过2000万,并正快速向上亿年装机量发展。

小结

经过过去这些年的发展,语音交互逐渐进入人们的生活,并带来极大的便利,然而不可否认的是,背景噪声大影响语音识别的准确性,命令词太多容易记不住等问题依然存在,而启英泰伦发布的第三代语音芯片,通过算力、集成度、算法的不断升级,完美解决了这些问题,随着各项难题的进一步突破,预计未来AI语音芯片将会在更多的场景中得到更好的应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53577

    浏览量

    459457
  • 启英泰伦
    +关注

    关注

    1

    文章

    57

    浏览量

    1683
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新品 | Module ASR,AI智能离线语音模块

    ModuleASR是一款基于CI1302芯片设计的AI智能离线语音模块。配备麦克风用于清晰音频采集,并内置扬声器提供高质量的音频反馈。同时支持中途
    的头像 发表于 12-05 18:15 130次阅读
    新品 | Module ASR,<b class='flag-5'>AI</b>智能<b class='flag-5'>离线</b><b class='flag-5'>语音</b>模块

    出海贸易快车道:50+国际采购团坐镇CES Asia2026 助企业足不出户链全球

    出海贸易快车道:50+国际采购团坐镇CES Asia2026 助企业足不出户链全球
    的头像 发表于 11-26 11:17 110次阅读

    AI在此10 成立10周年啦!

    听懂这声“你好”并作出回应时这背后很可能就跳动着一颗由我们赋予的“中国芯”下面是交出的十年答卷2015年●在成都高新区注册成立,致力于端侧A
    的头像 发表于 11-25 09:29 367次阅读
    <b class='flag-5'>AI</b>在此10 <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>成立10周年啦!

    什么是离线语音识别芯片离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 285次阅读

    喜报 | 获得2025年成都市企业技术中心认定!

    近日,成都市经济和信息化局公布了2025年度市级企业技术中心认定名单,(国家专精特新“小巨人”企业)凭借在人工智能语音
    的头像 发表于 09-28 17:10 808次阅读
    喜报 | <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>获得2025年成都市企业技术中心认定!

    哪些离线语音芯片适用于家电设备

    ​哪些离线语音芯片适用于家电设备?选择适用于家电设备的离线语音芯片时,需综合考量家电的使用环境、
    的头像 发表于 08-06 17:27 653次阅读
    哪些<b class='flag-5'>离线</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>适用于家电设备

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型
    发表于 07-04 11:14

    开发案例 | 用CI1302 AI语音开发板4步打造智能语音床头小夜灯,手残党也能玩转开发!

    。最近一直在琢磨,怎么给家里的小夜灯加点"黑科技",让它不再只是个普通的照明工具。直到发现了的CI13XX系列AI
    的头像 发表于 06-13 14:53 1337次阅读
    开发案例 | 用CI1302 <b class='flag-5'>AI</b><b class='flag-5'>语音</b>开发板4步打造智能<b class='flag-5'>语音</b>床头小夜灯,手残党也能玩转开发!

    鸿雁电器携手智芯科推出离线双核语音控制单火线开关

    近日,杭州鸿雁电器携手智芯科,基于其领先的双核离线语音识别芯片技术,联合开发出离线双核语音控制单火线开关,为智能家居行业带来了
    的头像 发表于 06-11 10:23 692次阅读

    亮相成都人工智能专场路演,发布具身智能新战略!

    "语音入口"到"机器人大脑":端侧AI芯片的三步跃迁在路演中,
    的头像 发表于 06-06 17:56 958次阅读
    <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>亮相成都人工智能专场路演,<b class='flag-5'>发布</b>具身智能新战略!

    NRK3301 AI语音芯片:玩具语音交互革新方案

    玩具AI语音芯片开发在玩具智能化浪潮中,九芯电子的NRK3301AI语音芯片凭借卓越性能与独特蓝
    的头像 发表于 05-09 13:49 654次阅读
    NRK3301 <b class='flag-5'>AI</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>:玩具<b class='flag-5'>语音</b>交互革新方案

    喜讯丨入选2025成都硬科技企业扑克牌榜单

    科技企业扑克牌”榜单。经过指标模型评选、线上公众投票、专家委员会评审三轮筛选,作为人工智能语音
    的头像 发表于 04-18 17:23 910次阅读
    喜讯丨<b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>入选2025成都硬科技企业扑克牌榜单

    新品发布|联合启明云端推出离在线语音大模型方案

    数据及大规模计算任务带来的响应延迟。其根本原因在于缺乏一颗强计算性能的端侧语音处理芯片。近日,
    的头像 发表于 03-11 14:07 1007次阅读
    新品<b class='flag-5'>发布</b>|<b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>联合启明云端推出离在线<b class='flag-5'>语音</b>大模型方案

    佛山市市委常委、政法委书记陈小坚一行到考察调研

    2月10日,佛山市市委常委、政法委书记陈小坚一行到考察调研,深入了解
    的头像 发表于 02-11 17:07 1733次阅读
    佛山市市委常委、政法委书记陈小坚一行到<b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>考察调研

    新推出多意图自然说,重塑离线人机交互新标准!

    智能语音识别技术作为人机交互领域的一场革命性突破,正逐步重塑我们与智能设备的交互方式。近期,新推出了多意图自然说技术,进一步增强了人
    的头像 发表于 01-03 16:01 850次阅读
    <b class='flag-5'>启</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>伦</b>新推出多意图自然说,重塑<b class='flag-5'>离线</b>人机交互新标准!