0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

回顾声智科技发布全新的DSP低功耗语音交互方案参与中国用户大会

声智科技 来源:djl 作者:声智科技 2019-08-12 17:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一年一度的Cadence CDNLive中国用户大会2018于8月10日在上海浦东嘉里大酒店开幕,作为Cadence的战略级合作伙伴,声智科技带着全新的DSP低功耗语音交互方案出席了此次大会。

CDNLive大会是由Cadence公司举办的一年一度的全球巡回用户大会。从今年4月由美国硅谷伊始,覆盖德国、日本、***、印度、以色列等七大地区和国家。大会以“联结、分享、启发”为主题,行业巨头、技术用户、业界顶尖开发者与业界专家都将聚集于此,共同分享高阶工艺芯片、复杂SoC和系统设计的技术和理念,为行业的发展提供灵感和启发。对于科技行业来说,这个集会可谓是一年一度最大的盛典。

2017年声智科技与Cadence建立了战略合作关系,开始为CadenceTensilicaDSP系列产品研发设计低功耗远场智能语音交互解决方案。本次Cadence CDNLive中国用户大会上,声智科技展示了基于Cadence Tensilica Fusion和HiFi DSP设计的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统。

融合远场语音交互和远场实时通话技术的SoundAI Voice Kit(以下简称SVK)是一款为手机、智能机器人、智能电视、机顶盒、机顶盒等消费电子产品和IOT产品提供低功耗的远场语音唤醒,语音识别,语音控制,语音搜索,远场声纹识别,远场实时通话(VoIP)等功能的理想软件解决方案。

(1)满足低功耗需求

随着亚马逊Echo、谷歌Google Home,阿里天猫精灵、小米小爱同学等产品在市场上大获成功,支持远场语音交互的智能设备越来越普及。远场智能语音交互势必是未来人机交互的新趋势。智能语音交互必然会推动消费电子品、物联网的革命,包括如汽车、家用设备,手机以及可穿戴设备。然而,耗能过高的困扰一直是制约物联网发展。

本次大会推出的SVK智能语音交互系统提供的远场语音唤醒算法,具有低功耗的特点,可以保证SoC和系统成本,也可以满足家居和移动场景的不同需求。该算法计算量少,计算复杂度低,占CPU内存小,但是语音交互的顺畅度不打折。

该算法搭载了最新的Voice Activity Detection技术,可拾取环境语音以检测和响应唤醒词或触发命令,通过关键字检测支持低功耗实时监听,实现低功耗远场语音唤醒功能。而且针对可能出现的多线程同时工作场景,也可以随时唤醒识别,不影响人机交流自然顺畅的体验,只为语音交互带来方便,不增加重量。在手机上应用,可实现锁屏唤醒、多任务唤醒、远场声纹唤醒等功能。

该远场语音唤醒算法可实现五米之内95%以上的唤醒率,支持Duel-wake(双名唤醒)、Free-cut(随时打断、随时唤醒)、One-shot(一句连控)的功能。目前,小米、百度、阿里、腾讯、华为、联想、猎豹移动等公司均采用声智科技提供的远场语音唤醒技术。

Dual-wake(双名唤醒),即唤醒词不再是单一的一个,设备可以拥有两个名字,使用任意一个名字都可以将其唤醒并进行无差别的操作,这样的设计与改进为设备后期功能扩展以及实现智能家电之间的联动留下了空间。

Free-cut(随时打断、随时唤醒)技术可以让设备任意时刻终止当前任务,立即响应新的用户需求,这就实现了连续唤醒执行新的命令,而无需等待上一任务完成后响应,随叫随应。

One-shot(一句连控),采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间无缝对接,用户叫了设备的名字后无需等待设备应答就可以直接说出命令,无需等待设备回应“诶”、“我在”等之后才能说出命令,响应速度更快,更加符合人类语音交互习惯。

(2)匹配复杂场景

随着智能语音设备应用场景的增加,由近场语音交互过渡到远场语音交互,场景中的噪声种类越来越多,越来越复杂,对于语音交互的要求也越来越高。针对可能出现的极端噪声场景,本次推出的SoundAI Voice Kit智能语音交互系统也进行了定制优化。

集成通话降噪、混响抑制、回声抵消、噪声抑制、波束形成、增益控制等噪声抑制技术,针对远场语音交互所处的复杂应用场景,定制了OpenAEC算法,可以解决弱参考信号或者无参考信号等更为复杂场景的回声抵消(自噪声抑制)问题,可实现更加精准的唤醒。

同时搭载了针对智能家居、办公环境、车载等场景的抗强噪唤醒算法(AKS技术),保证在噪声环境中,也实现精准的远场语音唤醒。在车载环境中,针对主副驾驶的方向性降噪问题,通过麦克风阵列波束成型技术在主方向语音不失真的前提下,有效去除空调、胎噪等平稳噪声,平稳噪声抑制量大于30dB。

并在保护主方向语音的同时,去除环境中的语音、车载娱乐设施等非稳态噪声的干扰。其中非稳态噪声抑制量大于20dB,在噪音环境下可以大幅提升远场语音唤醒和识别率。解决行车过程中,主驾驶与智能语音设备语音交互易受干扰的问题,确保准确识别主驾驶方向的指令,抑制其他方向噪声。

针对家庭场景下,易出现的大电视噪声、音响噪声等非稳态噪声,声智推出了

家庭非稳态噪声抑制技术、垂直抗强噪识别技术,专门匹配相应场景,带来更出色的远场交互体验,无惧环境,想说就说,声随心动,保证远场语音交互的完美体验。

(3)快速开发集成

声智科技推出的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit是众多audio/voice/speech软硬件合作伙伴生态系统的重要支撑,通过提供包括唤醒、降噪、ASR、NLP在内的领先的语音交互技术,帮助用户快速打造自己的硬件产品,更加易于集成,易于开发,易于扩展,更安全,更自由。

一直以来,DSP芯片具有大规模集成性、稳定性好、精度高、可嵌入性、接口和集成方便等特点,而且相较于通用芯片(AP芯片),价格更具优势。随着智能电子消费品、IOT产品越来越多的涌现,目前市场还没有专门的语音芯片应用到智能语音设备中,还没有经过市场验证。

目前更多的还是采用通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等组合的方式。DSP芯片通过对数字信号进行处理,包括回声消除、噪声抑制、语音降噪/增强等,使语音便于后端的语音识别,再由通用芯片进行处理传输到云端提供语音处理的计算力支持。

人工智能的大爆发给消费电子产品和IOT设备的变革塑造了更多的可能性。此次出席Cadence大会,声智科技带来的全新的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统,将更好的赋能客户的智能硬件产品快速的落地,拥有更精准的、更符合人性习惯的远场语音交互能力与智能语音交互体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1804

    浏览量

    115579
  • 智能机器人
    +关注

    关注

    17

    文章

    913

    浏览量

    85411
  • 语音交互
    +关注

    关注

    3

    文章

    339

    浏览量

    29064
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高能效、低功耗、小体积,炬芯科技发布全新CGM连续血糖监测方案

    及数字健康设备提供小体积、低功耗、高能效的解决方案 ,为医疗级连续血糖监测系统提供可靠的硬件基础。 随着数字医疗与生理数据监测需求不断发展,传统CGM设备在功耗、体积及无线传输性能上仍面临挑战。炬芯科技凭借在
    的头像 发表于 12-01 16:57 412次阅读
    高能效、<b class='flag-5'>低功耗</b>、小体积,炬芯科技<b class='flag-5'>发布</b><b class='flag-5'>全新</b>CGM连续血糖监测<b class='flag-5'>方案</b>

    CadenceLIVE China 2025中国用户大会精彩收官

    2025 年 8 月 19 日,一年一度的 CadenceLIVE China 中国用户大会在上海盛大收官。本次盛会汇聚众多集成电路领域的行业翘楚,吸引了逾千位专业人士参与,大家齐聚一堂,以“智能系统设计”为支点,共同探索技术突
    的头像 发表于 08-21 09:47 775次阅读

    AT6811-超低功耗离线智能语音识别 SoC

    AT6811芯片以0.8mA超低功耗实现离线语音交互,在嘈杂环境中仍保持92%识别率,已赋能空调、电动工具、助听器等设备,让万物拥有自然对话能力。
    的头像 发表于 08-07 17:44 946次阅读

    AT6803是一款超低功耗的离线智能语音识别芯片

    AT6803作为当前语音交互领域的前沿产品,其技术突破正悄然改变智能家居、可穿戴设备等低功耗场景的应用格局。
    的头像 发表于 07-26 12:00 1080次阅读

    低功耗语音芯片有哪些?

    ​ 超低功耗语音芯片有哪些好处?当然是给产品带来更好的续航表现和更好的节电表现,但是一位的追求低功耗的也是不对的,因为功耗和产品性能之间始终是要做取舍的。下面小编给大家带来一些超
    的头像 发表于 07-02 17:27 604次阅读
    超<b class='flag-5'>低功耗</b><b class='flag-5'>语音</b>芯片有哪些?

    蓝牙语音遥控器:智能家居的智慧控制核心

    低功耗特性,成为理想选择。 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能的语音交互低功耗设计,为
    发表于 06-01 20:24

    蓝牙语音遥控器 低功耗芯片选型HS6621CxC/OM6621

    系列凭借高集成度和低功耗特性,成为理想选择 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能的语音交互低功耗
    发表于 05-22 15:23

    虹科邀您相约MATLAB EXPO 2025中国用户大会

    作为全球科技领域的重要盛会,MATLAB EXPO 2025中国用户大会将于5月20号(上海)和5月27号(北京)双城联动启幕。
    的头像 发表于 05-12 15:21 921次阅读

    智能语音交互方案在客服领域的应用

    着客服行业的面貌,为企业和用户带来了全新的体验。 语音识别模型优化私部署 方案:精准高效,定制专属服务 语音识别技术作为智能
    的头像 发表于 04-11 14:35 632次阅读

    Credo发布Lark系列——为低功耗800G光学DSP树立新标杆

    荣幸地宣布:推出其超低功耗的Lark系列光DSP产品。 Lark系列包含两款创新光DSP产品。Lark 800是一款高性能、高可靠性、低功耗DSP
    的头像 发表于 04-02 12:56 642次阅读

    智能语音芯片WT588F02B-8S:低功耗设计赋能多元化场景应用

    在智能交互设备快速发展的今天,语音芯片作为人机交互的核心组件,其性能直接影响用户体验与产品竞争力。广州唯创电子推出的WT588F02B-8S语音
    的头像 发表于 04-02 08:36 678次阅读
    智能<b class='flag-5'>语音</b>芯片WT588F02B-8S:<b class='flag-5'>低功耗</b>设计赋能多元化场景应用

    芯资讯|WT3000T8语音合成芯片:高性价比语音交互解决方案

    在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的语音处理能力
    的头像 发表于 03-24 09:05 868次阅读
    芯资讯|WT3000T8<b class='flag-5'>语音</b>合成芯片:高性价比<b class='flag-5'>语音</b><b class='flag-5'>交互</b>解决<b class='flag-5'>方案</b>

    基于WTV380-8S语音芯片的智能电子锁语音交互系统设计方案介绍

    ​一、方案背景与需求智能电子锁作为现代家居安防的核心设备,用户交互友好性、功能多样性和系统稳定性的需求日益提升。WTV380-8S语音芯片凭借多模式控制、高集成度、
    的头像 发表于 03-06 08:56 759次阅读
    基于WTV380-8S<b class='flag-5'>语音</b>芯片的智能电子锁<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统设计<b class='flag-5'>方案</b>介绍

    基于WTVxxx语音芯片的智能清洁机器人语音交互系统设计方案介绍

    集成度、低功耗、多控制模式及传感器扩展能力,为智能清洁机器人提供了高效的语音交互解决方案。核心需求分析:1、实时状态反馈:工作模式切换、电量提醒、故障报警等
    的头像 发表于 03-06 08:27 667次阅读
    基于WTVxxx<b class='flag-5'>语音</b>芯片的智能清洁机器人<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统设计<b class='flag-5'>方案</b>介绍

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

    语音命令Q 识别,适用于智能家居控制、玩具、人机交互等多个领域。该模块以其高识别率、低功耗和易于集成的特点受到广大开发者的青睐。 主要技术及功能有: 磁力搅拌、重量采集、语音识别、
    发表于 01-02 18:15