0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声纹识别技术排名全球前三,快商通凭什么?

电子工程师 来源:lp 2019-03-15 14:57 次阅读

在由美国国家标准技术署(NIST)主办的说话人识别技术评测(Speaker Recognition Evaluation, SRE)公布的最新评测结果中,由快商通首席科学家李海洲教授及快商通声纹研究院领衔的I4U团队获得综合成绩第三名的好成绩,在大中华区参赛团队中排名第一。

lNIST SRE:国际最权威、标准最严、影响力最大的声纹识别技术评测

SRE 2018 是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院,直属美国商务部)承办的国际上规模最大、标准最严、最权威的声纹识别技术评测,为全球参赛研究机构提供了一个公平的统一测试平台,旨在关注声纹识别领域的核心技术问题。从1996年开始举办至今,参加 NIST SRE 评测的队伍逐年增加,今年有包括麻省理工、清华大学、声扬科技等在内的25个国家、78支队伍参赛。

近年来,NIST SRE 的重点任务是对于现阶段实用领域中,口语对话电话语音(CTS)的说话人检测

今年,除了在各种手机上录制的CTS 之外,SRE18中的开发和测试材料还加入了IP语音(VOIP)数据,以及视频音频(AfV)数据。数据库环境的复杂程度更高、干扰因素更多,已远远超过一般的实际应用场景,意味着对参评机构的算法性能和系统鲁棒性等提出更高的要求。

另外,由于现实应用中,系统往往要根据不同的需求来决定阈值的选取。今年,为综合考核参评系统的灵活度、实用度以及综合实力,NIST 将C_primary(或称为actDCF)作为首要核心指标,用于描述说话人识别系统的整体辨别能力,评判标准不再仅看在某个阈值点的FAR/FRR或DCF,进一步提升了竞赛的难度。

因此,NIST SRE 测评结果不仅为当前说话人识别的最新技术进步水平,也代表着该技术在目前实战场景应用中能够具备的最佳表现。

l 声纹识别技术排名全球前三,快商通凭什么?

在众多多场景测评中,快商通声纹识别系统在十万分之一的误报率下识别准确率超过99%。是国内声纹识别领域企业中在该指标下的最好水平,也体现了我国说话人识别技术已达到世界领先水平。

“NIST SRE 评测挑战最大的是单信道多说话人识别。”快商通AI事业部研究员叶志坚表示,“测试数据中,每段语音使用麦克风阵列录制用来混合测试,比如电话信道涵盖了移动电话,固定电话等。麦克风类型也几乎覆盖实际应用中所有类型。其次,环境噪声也更‘广义化’,包括环境噪声、人声非语言、彩铃炫铃等各种背景噪声情况。我们的系统采用了经典的DNN-ivector系统和基于端到端深度神经网络(DNN)的说话人特征提取系统,在不同语种中使用的结果都不错。”

今年,快商通声纹研究院在单信道多说话人识别方面取得了重大的进展,提出“单耳语音分离技术”,实现单音频定向人声分离,开创性解决声纹识别中“鸡尾酒会问题”难题。经实测、在嘈杂的环境中能够准确分辨多说话人声音。

这套强大声纹识别系统出色的完成了 NIST SRE 的说话人检测任务,特别是在降低环境“噪声”干扰,以及同一段语音中多声纹特征提取方面表现优异,系统将语音样本分割聚类成独立的片段,准确标注出“谁”从“什么时候”到“什么时候”在说话。

l 美国“最严技术封锁”,国产AI能力崛起

美国商务部工业安全署(BIS)根据出口行政规定(ExportAdministration Regulations, EAR)对军民两用和较为不敏感的军品出口进行监管,主要甄别涉及国家安全和高技术范畴的出口。根据美国商务部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),从美国公布的清单中甄别筛选出的代表性产业类别来看,可谓条条针对中国最新计划发展的高科技产业。

图:美国拟管制的14项技术出口

来源:据公开资料查找

近年来,中国人工智能高速发展。无人超市,无人物流,无人加油站,无人驾驶,无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。

在人脸识别技术的研发和应用上,中国在其上投入巨大,在各项国际人脸领域的评测中中国的企业稳拿第一,如依图科技,旷世科技,商汤科技(SenseTime)、云从科技、百度等企业。

在声纹领域,快商通已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。 在丰富项目经验积累下,快商通在国内银行、保险等领域商业测试中均取得声纹技术排名第一,目前,快商通已为平安集团、上海华瑞银行,国家电网、常州司法局等用户落地声纹行业解决方案。

在推动人工智能落地应用的同时,快商通也在持续加大对前沿技术投入。在成立快商通新加坡研究院之后,还与福建本土高校厦门大学、华侨大学建立联合建立人工智能研究院,推进产学研用结合,为厦门市乃至福建省的人工智能产业规模化发展增光添彩,为提升我国科技创新实力、为我国高科技产业的核心技术发展做积极贡献。

2018年,快商通首席科学家李海洲教授带领的新加坡国立大学团队荣获2018年第二届国际大学生类脑计算大赛一等奖;

2017年,快商通声纹团队在Interspeech2017的ASVspoof2017自动说话人验证欺骗和对策挑战赛(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,获得全球第一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63368
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230596
  • 声纹识别
    +关注

    关注

    3

    文章

    137

    浏览量

    21357

原文标题:声纹识别最权威评测 NIST SRE18结果公布:快商通排名全球前三!

文章出处:【微信号:kuairobot,微信公众号:小快机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智能声控灯具应用语音识别芯片AT6811

    AT6811是一款超低功耗的离线智能语音识别芯片,集成了先进的语音活动监测(VAD)、声纹识别、自动消噪神经网络,拥有高效的电源管理模块、数字和模拟语音信号输入接口以及ARMCortex-M0内核,并且搭配了GPIO、UART、SPI、I2C、I2S等片内外设。
    的头像 发表于 02-28 16:41 166次阅读
    智能声控灯具应用语音<b class='flag-5'>识别</b>芯片AT6811

    测电源噪声纹波时为什么选无源探头

    在测量电源的噪声纹波时,采用无源探头是一种常见的选择。无源探头是指在测量过程中不需要额外的电源供电的探头。那么,为什么我们要选择无源探头呢?下面将详细解释这个问题。 首先,无源探头具有高频
    的头像 发表于 02-01 10:10 180次阅读
    测电源噪<b class='flag-5'>声纹</b>波时为什么选无源探头

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连接,极大地提升了语音
    发表于 11-24 17:41

    汽车多模态交互研究:大模型及多模态融合,推进AI Agent上车

    语音交互方面:语音交互在AI大模型的赋能下,功能愈加智能化、情感化。唇动识别声纹识别技术的上车,使语音交互精准度得到进一步提升,控制范围也从车内拓展至车外;
    的头像 发表于 11-24 16:12 616次阅读
    汽车多模态交互研究:大模型及多模态融合,推进AI Agent上车

    广和通与华大北斗达成全球战略合作,携手打造高精度GNSS定位解决方案

    其GNSS产品定位精度高、覆盖范围广、成本优化等优势,双方将持续加大技术投入,以北斗高精度导航定位解决方案创新物联网定位新生态。 华大北斗总经理孙中亮表示:“北斗号开通稳定运行并进入全球服务的新阶段
    发表于 09-13 09:58

    生物识别和人脸识别的区别

      生物识别和人脸识别都是当今广泛应用于安全领域的技术。生物识别是一种基于个体生理和行为特征的识别技术
    发表于 08-28 17:29 877次阅读

    卷积神经网络的变压器铁心松动故障声纹识别方法

    卷积神经网络的变压器铁心松动故障声纹识别方法 随着卷积神经网络的广泛应用,其在声纹识别领域中的应用也越来越受到关注。然而,在实际应用中,存在许多挑战,如何有效地解决这些挑战并实现高效的声纹识别是当前
    的头像 发表于 08-17 16:30 535次阅读

    启英泰伦新成果发布交流会线上直播预约开启

    信号的清晰度和逼真度,使得通话更加清晰、准确,提高语音交流的效率和舒适性,为用户提供更好的使用体验。 04 声纹识别突破性进展 启英泰伦声纹识别技术再上一台阶。可同时注册多个身份认证,并在较短时间内进行
    发表于 08-15 14:31

    生物识别与脑机接口的关系

    、互相促进的关系。 生物识别技术是一种通过对人体生理特征和行为特征进行识别来确认身份的技术,主要包括指纹识别、人脸识别、虹膜
    的头像 发表于 08-12 14:56 341次阅读

    主打自动分析数据,DesignDash凭什么拉升芯片设计生产力?

    原文标题:主打自动分析数据,DesignDash凭什么拉升芯片设计生产力? 文章出处:【微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 07-13 18:10 215次阅读

    声智“声纹数据驾驶舱”助力多元行业发展

    随着声纹识别技术的日益成熟,其已被广泛应用到信息、公共安全、金融、智能安防和智能家居等各个领域。声纹是一种具有显著声学特性的生物特征信息,与指纹、人脸、虹膜等生物识别信息一样,能够用于
    的头像 发表于 07-04 15:11 633次阅读

    如何开发智能家居语音控制方案

    极高。 语音响应速度,准确度高,体验极佳 BNPU3.0语音算法 如上图所示,启英泰伦第代智能语音芯片采用行业首创的BNPU3.0语音算法,通过将不同方向人声分离,抑制干扰人声等技术,提高目标人声
    发表于 05-31 09:50

    语音识别技术的概念及应用前景

    解决的问题,就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。 智能语音的基础在于通过神经网络技术,提升语音识别识别率,同时可以用语义理解分析出人的意图,进行
    发表于 05-27 09:41

    手语识别技术的应用和前景

    手语识别技术是一种通过分析人类手部动作来识别其所表达意义的技术。随着人口老龄化趋势的加剧和多元文化的融合,手语识别
    的头像 发表于 05-19 17:59 1858次阅读

    中国信通院公布 5G 标准必要专利全球最新排名:华为第一、小米首次进入

    “5G-Advanced”)的第二阶段。5G经过多年的快速发展已实现大规模商用,逐渐成为推动人类社会数字化转型升级的关键支撑。根据GSA的研究,截至2023年3月,全球97个国家或地区的运营已部署249个
    发表于 05-10 10:39