0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

快商通李稀敏:近场声纹识别将普及,本地化的AI能力是刚需

智能生物识别说 2019-11-01 18:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

快商通公检法事业线总经理李稀敏博士就“人机语音交互是否必须要先唤醒和离线语音技术在本地端上的实现是否未来的趋势”为题进行分享:


01 人机交互必须要先唤醒吗?


语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。就目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。比如“小度小度”“若琪”“叮咚叮咚”。那么,人机交互我们必须要先唤醒吗?李稀敏认为:随着技术场景越来越成熟,当机器具备足够的智能化,机器是可以不需要唤醒词,就像跟人对话一样自然。但距离无唤醒交互的实现,还有一段路要走。从声纹识别的角度来看有两种场景,第一种,用唤醒词作为命令词,设备在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步。第二种设置一个“唤醒词”,这时候我们可以将设备唤醒比作水龙头的开关,如果水龙头没有开关的话,摁都摁不住是吧?就像智能音响交互的时候,设备乱七八糟的识别了一大堆语音,这个东西出来摁都摁不住,所以人机交互还是要有“唤醒”步骤。但是否需要唤醒词,还需根据场景的需求来决定,没有所谓的通用答案。


02 声纹识别是否可以改进人机交互方式?


最近一段时间很火的苹果AirPods,华为荣耀FlyPods Pro都在主打身份识别。目前的唤醒大家都是在用这个特定的唤醒词,如果改用声纹识别,是否可以改变这种交互的方式?李稀敏认为:在不同的场景中,最佳的唤醒的方式可以不同,但在耳机等可穿戴设备的场景中,声纹识别因其高易用性、非接触、不需要前置设备等优点,相对其他生物识别技术,能够更好的解决该场景的实际身份认证的问题,进而改进人机交互体验。


03 实现本地端离线语音技术是未来趋势?


“在贴身的耳机,也就是本地端做声纹识别,其实避免了一个技术问题:远场识别”,李稀敏解释。远场的文本无关身份识别由于复杂的信号传播环境等原因,是目前的技术难点,还有很长的路要走。但相对来说,近场的身份识别,在本地端可以通过技术手段快速解决问题。所以,接下来本地端近场身份识别能够大面积普及,在今后很多场景,我们随身携带一个小设备都能够直接识别身份。


关于本地化是不是未来的趋势。从数据的角度来讲,很多人是不希望自己的声音信息,人脸信息,通过设备或各种隐私接口上传到云端且变为不可控。李稀敏认为,从这个角度来看,本地化的AI的能力是一个刚需。


04 大热的语音合成技术TTS,跟声纹识别PK,谁会更胜一筹?


对于使用录音、合成语音等攻击手段的识别,是声纹识别必须要解决的问题。快商通在为银行、保险等金融客户设计声纹身份识别系统,这个是第一个需要解决的问题。


目前,对声纹认证的攻击,大概分成几类,第一类是模仿,第二类是语音合成或者语音转换,第三类是录音重放。根据实际欺诈的手段来讲,目前主要是防录音重放。其中,录音重放是最难检测的。解决了录音重放问题,就相当于解决了语音拼接和语音合成问题。


快商通在这一点上做得比较领先,我们的首席科学家李海洲院士,团队在ASVspoof2017自动说话人验证欺骗和对策挑战赛中获得第一名。包括在许多银行客户的测试中,我们都是100%检测到录音重放。


另外分享个故事,除了算法和系统本身领先,解决方案还需要数据驱动,大量的录音样本、各种设备、各种采样率、各种时长、各种环境的训练。1年前,我们在北京几家银行做测试的时候,白天我们在地铁上,在最嘈杂的环境下,各种测试都攻不破。


但晚上,我住在清华大学里,在10:00、11:00左右夜深人静、一点声音都没有的时候,掏出了我们的APP进行测试,却被攻破了。说明当时我们的训练数据没有覆盖到无杂音、无噪音的情况,当然,现在已经覆盖到了(笑)。


关于快商通:


快商通是一家从事人工智能技术与应用研发的创新型科技企业,在声纹识别、自然语言处理、深度学习、大数据等方面拥有原创核心竞争力。


面向企业服务、金融、公检法、医疗、物联网等领域,为全球客户提供包含人工智能算法、应用软件、平台软件及内嵌人工智能功能的软硬件一体化解决方案。致力于持续为客户创造价值,让人工智能走进每个人的生活。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大华股份以AI声纹识别技术守护万物共生

    当城市的喧嚣淹没林间啁啾、迁徙的雀鸣渐远于车水马龙,那些消散的自然之声,是生物多样性发出的“沉默警报”。恰逢鸟类繁殖季,在国际生物多样性日的温情氛围里,大华股份以数智之力为笔、以AI声纹识别技术为墨,书写科技护境的绿色答卷,让每一声啼鸣成为守护自然的力量。
    的头像 发表于 05-25 16:13 249次阅读

    整流变压器声纹传感器:智能应用

    状态监测开辟了新维度。本文聚焦整流变压器声纹传感器的技术原理与应用价值,解析其如何通过声音信号实现故障预警与智能诊断。声纹识别技术原理与优势声纹传感器通过麦克风阵列
    的头像 发表于 05-13 15:58 130次阅读
    整流变压器<b class='flag-5'>声纹</b>传感器:智能<b class='flag-5'>化</b>应用

    AI算力会“光伏”,而156.25MHz差分晶振,为什么反而更

    AI 算力光伏 + 高基频时代:156.25M / 312.5M / 625M 差分晶振为何成为金字塔? 2026年,AI产业链一边
    的头像 发表于 04-30 17:35 351次阅读
    <b class='flag-5'>AI</b>算力会“光伏<b class='flag-5'>化</b>”,而156.25MHz差分晶振,为什么反而更<b class='flag-5'>刚</b><b class='flag-5'>需</b>?

    神笔AI×悟空达成合作!首发4大电AI技能,上线钉钉AI能力广场

    商家,提供开箱即用的AI自动运营能力。 本次上线的4大神笔AI Agent技能,均来自电商家高频
    的头像 发表于 04-07 15:51 297次阅读
    神笔<b class='flag-5'>AI</b>×悟空达成合作!首发4大电<b class='flag-5'>商</b><b class='flag-5'>AI</b>技能,上线钉钉<b class='flag-5'>AI</b><b class='flag-5'>能力</b>广场

    使用NORDIC AI的好处

    运动/手势识别、可穿戴健康监测、预测性维护、楼宇与工业传感网络本地分析、声音/关键词/图像识别等,都有官方明确提到的典型用例。[Unlock Edge AI 博客; Nordic E
    发表于 01-31 23:16

    小鹏汽车正式启动其马来西亚本地化生产项目

    近日,小鹏汽车与马来西亚EPMB集团签约,正式启动其马来西亚本地化生产项目。这是继印尼、奥地利之后,小鹏在全球布局的第三个本地化生产项目。
    的头像 发表于 12-18 14:16 758次阅读

    打造本地化智能的“最强大脑”, 米尔RK3576 AI边缘计算盒

    在人工智能与边缘计算深度融合的浪潮中,本地化智能需求正重塑产业格局。米尔电子推出的RK3576边缘计算盒,具备高算力、低功耗与强扩展性,凭借其卓越的硬件架构与多场景适配能力,正成为推动工业视觉
    的头像 发表于 12-11 08:05 1178次阅读
    打造<b class='flag-5'>本地化</b>智能的“最强大脑”, 米尔RK3576 <b class='flag-5'>AI</b>边缘计算盒

    涂鸦网关本地化进阶能力来袭!周期/区间/批量联动全掌控,解锁高阶场景应用

    在物联网自动场景体系中,网关是连接云端与终端设备的关键中枢,其本地化处理能力直接决定场景联动的可靠性与精细化水平。然而,传统自动场景多依赖云端判定与指令下发,在断网自控、复杂逻辑运
    的头像 发表于 11-27 18:27 808次阅读
    涂鸦网关<b class='flag-5'>本地化</b>进阶<b class='flag-5'>能力</b>来袭!周期/区间/批量联动全掌控,解锁高阶场景应用

    发布元服务配置本地化基础信息(应用名称、图标)

    您可以添加元服务支持的语言,并配置对应语言的本地化信息。 例如,当您设置简体中文为默认语言,并且只配置中文的本地化信息,那么元服务在所有设置的发布国家或地区的信息都将显示中文。如果您还设置了英文
    发表于 10-24 17:42

    破解非洲数字鸿沟:传音控股以本地化创新与教育合作助力可持续发展

    科技出海企业代表传音控股继续秉持“全球视野,本地化创新”理念,通过技术研发与公益投入双轮驱动,助力非洲跨越数字鸿沟。深耕本地化创新,传音赋能非洲数字发展在非洲
    的头像 发表于 09-25 16:46 1441次阅读
    破解非洲数字鸿沟:传音控股以<b class='flag-5'>本地化</b>创新与教育合作助力可持续发展

    小鹏汽车首个欧洲本地化生产项目启动

    小鹏汽车正式官宣欧洲本地化生产的重要规划,与位于奥地利格拉茨的麦格纳工厂展开深度合作,借助该工厂现有的成熟生产线,大力推动电动汽车在欧洲的本地化生产进程。
    的头像 发表于 09-15 15:02 1201次阅读

    能源监测管理平台是本地化部署好还是云端部署好?

    能源监测管理平台本地化部署和云端部署各有优劣,企业根据自身需求和实际情况来选择。如果企业对数据安全要求极高、网络环境特殊且预算充足,本地化部署可能更合适;若企业注重灵活性、成本效益和便捷访问,云端
    的头像 发表于 07-22 15:16 736次阅读
    能源监测管理平台是<b class='flag-5'>本地化</b>部署好还是云端部署好?

    传音控股本地化战略的跨区域成功:驱动东南亚、南亚数字浪潮 ​

    全球新兴市场智能终端竞争进入新阶段,传音控股继续凭借“本地化”战略优势书写着从非洲到全球的扩张传奇。与印尼电信巨头IOH达成战略合作、优化游戏体验、研发全肤色影像技术,传音正在将成熟的本地化模式成功
    的头像 发表于 07-18 16:09 1318次阅读
    传音控股<b class='flag-5'>本地化</b>战略的跨区域成功:驱动东南亚、南亚数字<b class='flag-5'>化</b>浪潮 ​

    AI+能源数字破局者故事5:斯伦贝谢 x IBM 咨询之 “全球经营与本地化适配”

    斯伦贝谢与 IBM 的合作建立在技术专长、交付能力本地化支持的基础上,IBM 的强大技术实力和本地经验,使其成为斯伦贝谢推动数字转型的重要合作伙伴
    的头像 发表于 07-17 19:02 1680次阅读

    施耐德电气与奇安信共建技术本地化创新中心

     在施耐德电气技术本地化创新日上 ; 施耐德电气与奇安信集团宣布成立 施耐德电气(中国)技术本地化创新中心。 该中心将提供 针对国产基础软硬件的深度适配服务,以信息技术共创和生态协同为核心 ,更好
    的头像 发表于 07-10 19:01 1314次阅读
    施耐德电气与奇安信共建技术<b class='flag-5'>本地化</b>创新中心