0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声纹识别技术排名全球前三,快商通凭什么?

电子工程师 来源:lp 2019-03-15 14:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在由美国国家标准技术署(NIST)主办的说话人识别技术评测(Speaker Recognition Evaluation, SRE)公布的最新评测结果中,由快商通首席科学家李海洲教授及快商通声纹研究院领衔的I4U团队获得综合成绩第三名的好成绩,在大中华区参赛团队中排名第一。

lNIST SRE:国际最权威、标准最严、影响力最大的声纹识别技术评测

SRE 2018 是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院,直属美国商务部)承办的国际上规模最大、标准最严、最权威的声纹识别技术评测,为全球参赛研究机构提供了一个公平的统一测试平台,旨在关注声纹识别领域的核心技术问题。从1996年开始举办至今,参加 NIST SRE 评测的队伍逐年增加,今年有包括麻省理工、清华大学、声扬科技等在内的25个国家、78支队伍参赛。

近年来,NIST SRE 的重点任务是对于现阶段实用领域中,口语对话电话语音(CTS)的说话人检测。

今年,除了在各种手机上录制的CTS 之外,SRE18中的开发和测试材料还加入了IP语音(VOIP)数据,以及视频音频(AfV)数据。数据库环境的复杂程度更高、干扰因素更多,已远远超过一般的实际应用场景,意味着对参评机构的算法性能和系统鲁棒性等提出更高的要求。

另外,由于现实应用中,系统往往要根据不同的需求来决定阈值的选取。今年,为综合考核参评系统的灵活度、实用度以及综合实力,NIST 将C_primary(或称为actDCF)作为首要核心指标,用于描述说话人识别系统的整体辨别能力,评判标准不再仅看在某个阈值点的FAR/FRR或DCF,进一步提升了竞赛的难度。

因此,NIST SRE 测评结果不仅为当前说话人识别的最新技术进步水平,也代表着该技术在目前实战场景应用中能够具备的最佳表现。

l 声纹识别技术排名全球前三,快商通凭什么?

在众多多场景测评中,快商通声纹识别系统在十万分之一的误报率下识别准确率超过99%。是国内声纹识别领域企业中在该指标下的最好水平,也体现了我国说话人识别技术已达到世界领先水平。

“NIST SRE 评测挑战最大的是单信道多说话人识别。”快商通AI事业部研究员叶志坚表示,“测试数据中,每段语音使用麦克风阵列录制用来混合测试,比如电话信道涵盖了移动电话,固定电话等。麦克风类型也几乎覆盖实际应用中所有类型。其次,环境噪声也更‘广义化’,包括环境噪声、人声非语言、彩铃炫铃等各种背景噪声情况。我们的系统采用了经典的DNN-ivector系统和基于端到端深度神经网络(DNN)的说话人特征提取系统,在不同语种中使用的结果都不错。”

今年,快商通声纹研究院在单信道多说话人识别方面取得了重大的进展,提出“单耳语音分离技术”,实现单音频定向人声分离,开创性解决声纹识别中“鸡尾酒会问题”难题。经实测、在嘈杂的环境中能够准确分辨多说话人声音。

这套强大声纹识别系统出色的完成了 NIST SRE 的说话人检测任务,特别是在降低环境“噪声”干扰,以及同一段语音中多声纹特征提取方面表现优异,系统将语音样本分割聚类成独立的片段,准确标注出“谁”从“什么时候”到“什么时候”在说话。

l 美国“最严技术封锁”,国产AI能力崛起

美国商务部工业安全署(BIS)根据出口行政规定(ExportAdministration Regulations, EAR)对军民两用和较为不敏感的军品出口进行监管,主要甄别涉及国家安全和高技术范畴的出口。根据美国商务部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),从美国公布的清单中甄别筛选出的代表性产业类别来看,可谓条条针对中国最新计划发展的高科技产业。

图:美国拟管制的14项技术出口

来源:据公开资料查找

近年来,中国人工智能高速发展。无人超市,无人物流,无人加油站,无人驾驶,无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。

在人脸识别技术的研发和应用上,中国在其上投入巨大,在各项国际人脸领域的评测中中国的企业稳拿第一,如依图科技,旷世科技,商汤科技(SenseTime)、云从科技、百度等企业。

在声纹领域,快商通已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。 在丰富项目经验积累下,快商通在国内银行、保险等领域商业测试中均取得声纹技术排名第一,目前,快商通已为平安集团、上海华瑞银行,国家电网、常州司法局等用户落地声纹行业解决方案。

在推动人工智能落地应用的同时,快商通也在持续加大对前沿技术投入。在成立快商通新加坡研究院之后,还与福建本土高校厦门大学、华侨大学建立联合建立人工智能研究院,推进产学研用结合,为厦门市乃至福建省的人工智能产业规模化发展增光添彩,为提升我国科技创新实力、为我国高科技产业的核心技术发展做积极贡献。

2018年,快商通首席科学家李海洲教授带领的新加坡国立大学团队荣获2018年第二届国际大学生类脑计算大赛一等奖;

2017年,快商通声纹团队在Interspeech2017的ASVspoof2017自动说话人验证欺骗和对策挑战赛(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,获得全球第一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3993

    浏览量

    67730
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261473
  • 声纹识别
    +关注

    关注

    3

    文章

    143

    浏览量

    22268

原文标题:声纹识别最权威评测 NIST SRE18结果公布:快商通排名全球前三!

文章出处:【微信号:kuairobot,微信公众号:小快机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    油浸变压器声纹传感器:以声纹特征识别为核心的智能监测方案

    文章由山东华科信息技术有限公司提供在电力设备状态监测领域,油浸变压器作为电网核心设备,其运行安全直接影响电力系统稳定性。声纹传感器通过捕捉设备运行时的声纹特征,实现对变压器内部异常状态的精准
    的头像 发表于 11-04 09:25 187次阅读
    油浸变压器<b class='flag-5'>声纹</b>传感器:以<b class='flag-5'>声纹</b>特征<b class='flag-5'>识别</b>为核心的智能监测方案

    油浸变压器声纹监测:以声音守护设备健康

    ,已成为变压器状态评估的重要手段。本文将从技术原理、应用价值及发展趋势个维度,系统解析油浸变压器声纹监测的科学内涵与实践意义。声纹监测的核心原理基于设备运行声音的“
    的头像 发表于 10-29 09:07 178次阅读
    油浸变压器<b class='flag-5'>声纹</b>监测:以声音守护设备健康

    工业配电房滤波声纹传感器的技术解析与运维价值

    文章由山东华科信息技术有限公司提供在工业配电房设备状态监测领域,滤波声纹传感器作为新兴的声学感知技术,正逐步成为设备运维的关键工具。该技术通过捕捉设备运行中的
    的头像 发表于 10-17 09:12 182次阅读
    工业配电房滤波<b class='flag-5'>声纹</b>传感器的<b class='flag-5'>技术</b>解析与运维价值

    调压变压器声纹监测:电力设备健康管理的“声波密码”

    成为设备状态评估的新维度。本文从技术原理、实施路径与价值延伸方面,解析调压变压器声纹监测的智能化升级路径。声纹监测的技术逻辑:从声音到状态
    的头像 发表于 09-24 09:33 364次阅读
    调压变压器<b class='flag-5'>声纹</b>监测:电力设备健康管理的“声波密码”

    时空壶新品W4 AI同传耳机发布,“骨声纹技术有何神奇魔力?

    全球目光,为解决跨语言交流难题提供了新的思路与方案。“骨声纹技术革新:打破传统拾音局限长久以来,传统翻译设备的拾音方式在嘈杂环境中饱受诟病。常规麦克风易受外界
    的头像 发表于 09-12 11:02 705次阅读
    时空壶新品W4 AI同传耳机发布,“骨<b class='flag-5'>声纹</b>”<b class='flag-5'>技术</b>有何神奇魔力?

    变压器振动温度传感器的多模态监测技术解析与应用展望

    文章由山东华科信息技术有限公司提供在电力设备智能化运维领域,变压器振动温度传感器正通过多参数融合检测技术,为电力变压器运行状态评估提供全维度数据支撑。该传感器集成声纹识别、振动监测与温度感知
    的头像 发表于 09-01 13:49 464次阅读
    变压器振动温度传感器的多模态监测<b class='flag-5'>技术</b>解析与应用展望

    睿海光电领航AI光模块:超交付与全场景兼容赋能智算时代——以创新实力助力全球客户构建高效算力底座

    深圳、北京、香港大运营中心,提供本地化技术服务网络。公司首创“年质保、终身维修”政策,累计服务全球1560余家客户,涵盖头部云厂商、电信运营
    发表于 08-13 19:03

    配电房自适应滤波声纹传感器

    了"智能耳朵",实现了从被动响应到主动预防的运维模式革新。该技术的核心在于自适应滤波与声纹识别的深度结合。传感器内置的数字信号处理器可实时分析环境噪声特征,通过LMS算法动
    的头像 发表于 08-08 09:36 690次阅读
    配电房自适应滤波<b class='flag-5'>声纹</b>传感器

    开关柜体振动声纹监测设备技术解析

    文章由山东华科信息技术有限公司提供开关柜作为电力分配与控制的核心设备,其运行状态直接影响电网稳定性。传统巡检方式难以捕捉早期机械故障,振动声纹监测技术通过解析设备运行产生的振动与声音信号,为状态评估
    的头像 发表于 07-03 10:08 526次阅读
    开关柜体振动<b class='flag-5'>声纹</b>监测设备<b class='flag-5'>技术</b>解析

    华为智能光伏第全球安装大会圆满收官

    华为智能光伏第全球安装大会在东莞丫坡盛大召开,来自欧洲、亚太、拉美等全球各地的伙伴和头部安装
    的头像 发表于 06-20 09:51 928次阅读

    电网运维动态声纹特征分析系统:聆听设备“心跳”的智能守护者

    文章由山东华科信息技术有限公司提供在电网智能化转型的浪潮中,设备运维模式正经历深刻变革。传统人工巡检依赖经验判断,难以捕捉设备早期隐性故障。动态声纹特征分析系统通过解析设备运行声纹,为电网运维装上
    的头像 发表于 05-13 09:44 579次阅读
    电网运维动态<b class='flag-5'>声纹</b>特征分析系统:聆听设备“心跳”的智能守护者

    智能电力声纹监测系统:守护电网安全的“声纹卫士”

    文章由山东华科信息技术有限公司提供在科技日新月异的今天,电力系统的智能化转型已成为行业发展的必然趋势。其中,智能电力声纹监测系统作为一种创新的监测技术,正逐步成为守护电网安全的重要工具。2025年
    的头像 发表于 04-23 09:32 964次阅读
    智能电力<b class='flag-5'>声纹</b>监测系统:守护电网安全的“<b class='flag-5'>声纹</b>卫士”

    京朗仕特工业声纹检测设备支持定向拾音

    的一款将收集到的声纹转换成可视化图像的设备,以便帮助工作人员识别各种设备发出的声纹和气体泄漏的声纹,用以判断被检测设备运行状态是否正常,或是设备、管道等是否存在气体
    的头像 发表于 03-05 14:43 665次阅读
    京朗仕特工业<b class='flag-5'>声纹</b>检测设备支持定向拾音

    新品| Unit ASR,一体化离线语音识别单元

    UnitASR是一款AI语音识别单元,内置AI智能离线语音模块CI-03T。它具有语音识别声纹识别、语音增强和语音检测等多项功能,同时支持回声消除(AEC),有效减少噪声和回声干扰,确保语音
    的头像 发表于 02-14 18:34 744次阅读
    新品| Unit ASR,一体化离线语音<b class='flag-5'>识别</b>单元

    聚焦AI语音!声扬科技张伟彬博士受邀为中山大学深圳校区师生作分享

    近日,声扬科技联合创始人、总经理张伟彬博士受邀前往中山大学深圳校区,为学校师生作“声纹识别技术及其产业化应用”主题分享。凭借深厚的专业知识,结合前沿的产业落地实践,张伟彬博士深入浅出地分享了声纹识别
    的头像 发表于 12-31 10:45 1350次阅读
    聚焦AI语音!声扬科技张伟彬博士受邀为中山大学深圳校区师生作分享