0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声纹识别技术排名全球前三,快商通凭什么?

电子工程师 来源:lp 2019-03-15 14:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在由美国国家标准技术署(NIST)主办的说话人识别技术评测(Speaker Recognition Evaluation, SRE)公布的最新评测结果中,由快商通首席科学家李海洲教授及快商通声纹研究院领衔的I4U团队获得综合成绩第三名的好成绩,在大中华区参赛团队中排名第一。

lNIST SRE:国际最权威、标准最严、影响力最大的声纹识别技术评测

SRE 2018 是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院,直属美国商务部)承办的国际上规模最大、标准最严、最权威的声纹识别技术评测,为全球参赛研究机构提供了一个公平的统一测试平台,旨在关注声纹识别领域的核心技术问题。从1996年开始举办至今,参加 NIST SRE 评测的队伍逐年增加,今年有包括麻省理工、清华大学、声扬科技等在内的25个国家、78支队伍参赛。

近年来,NIST SRE 的重点任务是对于现阶段实用领域中,口语对话电话语音(CTS)的说话人检测。

今年,除了在各种手机上录制的CTS 之外,SRE18中的开发和测试材料还加入了IP语音(VOIP)数据,以及视频音频(AfV)数据。数据库环境的复杂程度更高、干扰因素更多,已远远超过一般的实际应用场景,意味着对参评机构的算法性能和系统鲁棒性等提出更高的要求。

另外,由于现实应用中,系统往往要根据不同的需求来决定阈值的选取。今年,为综合考核参评系统的灵活度、实用度以及综合实力,NIST 将C_primary(或称为actDCF)作为首要核心指标,用于描述说话人识别系统的整体辨别能力,评判标准不再仅看在某个阈值点的FAR/FRR或DCF,进一步提升了竞赛的难度。

因此,NIST SRE 测评结果不仅为当前说话人识别的最新技术进步水平,也代表着该技术在目前实战场景应用中能够具备的最佳表现。

l 声纹识别技术排名全球前三,快商通凭什么?

在众多多场景测评中,快商通声纹识别系统在十万分之一的误报率下识别准确率超过99%。是国内声纹识别领域企业中在该指标下的最好水平,也体现了我国说话人识别技术已达到世界领先水平。

“NIST SRE 评测挑战最大的是单信道多说话人识别。”快商通AI事业部研究员叶志坚表示,“测试数据中,每段语音使用麦克风阵列录制用来混合测试,比如电话信道涵盖了移动电话,固定电话等。麦克风类型也几乎覆盖实际应用中所有类型。其次,环境噪声也更‘广义化’,包括环境噪声、人声非语言、彩铃炫铃等各种背景噪声情况。我们的系统采用了经典的DNN-ivector系统和基于端到端深度神经网络(DNN)的说话人特征提取系统,在不同语种中使用的结果都不错。”

今年,快商通声纹研究院在单信道多说话人识别方面取得了重大的进展,提出“单耳语音分离技术”,实现单音频定向人声分离,开创性解决声纹识别中“鸡尾酒会问题”难题。经实测、在嘈杂的环境中能够准确分辨多说话人声音。

这套强大声纹识别系统出色的完成了 NIST SRE 的说话人检测任务,特别是在降低环境“噪声”干扰,以及同一段语音中多声纹特征提取方面表现优异,系统将语音样本分割聚类成独立的片段,准确标注出“谁”从“什么时候”到“什么时候”在说话。

l 美国“最严技术封锁”,国产AI能力崛起

美国商务部工业安全署(BIS)根据出口行政规定(ExportAdministration Regulations, EAR)对军民两用和较为不敏感的军品出口进行监管,主要甄别涉及国家安全和高技术范畴的出口。根据美国商务部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),从美国公布的清单中甄别筛选出的代表性产业类别来看,可谓条条针对中国最新计划发展的高科技产业。

图:美国拟管制的14项技术出口

来源:据公开资料查找

近年来,中国人工智能高速发展。无人超市,无人物流,无人加油站,无人驾驶,无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。

在人脸识别技术的研发和应用上,中国在其上投入巨大,在各项国际人脸领域的评测中中国的企业稳拿第一,如依图科技,旷世科技,商汤科技(SenseTime)、云从科技、百度等企业。

在声纹领域,快商通已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。 在丰富项目经验积累下,快商通在国内银行、保险等领域商业测试中均取得声纹技术排名第一,目前,快商通已为平安集团、上海华瑞银行,国家电网、常州司法局等用户落地声纹行业解决方案。

在推动人工智能落地应用的同时,快商通也在持续加大对前沿技术投入。在成立快商通新加坡研究院之后,还与福建本土高校厦门大学、华侨大学建立联合建立人工智能研究院,推进产学研用结合,为厦门市乃至福建省的人工智能产业规模化发展增光添彩,为提升我国科技创新实力、为我国高科技产业的核心技术发展做积极贡献。

2018年,快商通首席科学家李海洲教授带领的新加坡国立大学团队荣获2018年第二届国际大学生类脑计算大赛一等奖;

2017年,快商通声纹团队在Interspeech2017的ASVspoof2017自动说话人验证欺骗和对策挑战赛(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,获得全球第一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    4093

    浏览量

    68688
  • 人工智能
    +关注

    关注

    1821

    文章

    50530

    浏览量

    267806
  • 声纹识别
    +关注

    关注

    3

    文章

    145

    浏览量

    22443

原文标题:声纹识别最权威评测 NIST SRE18结果公布:快商通排名全球前三!

文章出处:【微信号:kuairobot,微信公众号:小快机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大华股份以AI声纹识别技术守护万物共生

    当城市的喧嚣淹没林间啁啾、迁徙的雀鸣渐远于车水马龙,那些消散的自然之声,是生物多样性发出的“沉默警报”。恰逢鸟类繁殖季,在国际生物多样性日的温情氛围里,大华股份以数智之力为笔、以AI声纹识别技术为墨,书写科技护境的绿色答卷,让每一声啼鸣成为守护自然的力量。
    的头像 发表于 05-25 16:13 206次阅读

    油浸变压器声纹监测:技术解析

    文章由山东华科信息技术有限公司提供油浸变压器作为电力系统核心设备,其运行状态直接影响电网安全。声纹监测技术通过采集变压器运行时的声波信号,结合智能算法分析声音特征,可实现设备故障的早期预警与精准诊断
    的头像 发表于 05-14 10:59 337次阅读
    油浸变压器<b class='flag-5'>声纹</b>监测:<b class='flag-5'>技术</b>解析

    整流变压器声纹传感器:智能化应用

    状态监测开辟了新维度。本文聚焦整流变压器声纹传感器的技术原理与应用价值,解析其如何通过声音信号实现故障预警与智能诊断。声纹识别技术原理与优势声纹
    的头像 发表于 05-13 15:58 123次阅读
    整流变压器<b class='flag-5'>声纹</b>传感器:智能化应用

    电源变压器声纹传感器:设备健康管理新范式

    文章由山东华科信息技术有限公司提供在电力设备状态监测领域,声纹传感器通过捕捉设备运行时的声波特征,为电源变压器等核心设备的健康管理提供全新视角。该技术基于声学指纹识别原理,将设备运行声
    的头像 发表于 04-24 15:35 171次阅读
    电源变压器<b class='flag-5'>声纹</b>传感器:设备健康管理新范式

    马尔圆度仪供货有哪些

    与材料检测设备解决方案提供,金相制样领域全球标杆品牌,行业权威性极强,专注材料样品处理设备研发近90年,技术积淀深厚。 产品与选型 :核心主推标乐磨抛机AutoMet 250/30
    发表于 03-24 15:08

    隧道管廊配电房合一传感器---技术解析

    设施的前提下,通过模块化传感器阵列完成多维度数据采集。【技术原理与参数配置】该传感器内置组独立采集单元:声纹识别模块采用0.5-4.5kHz带宽的宽频响应设计,可
    的头像 发表于 02-25 10:30 443次阅读
    隧道管廊配电房<b class='flag-5'>三</b>合一传感器---<b class='flag-5'>技术</b>解析

    油浸变压器声纹传感器:以声纹特征识别为核心的智能监测方案

    文章由山东华科信息技术有限公司提供在电力设备状态监测领域,油浸变压器作为电网核心设备,其运行安全直接影响电力系统稳定性。声纹传感器通过捕捉设备运行时的声纹特征,实现对变压器内部异常状态的精准
    的头像 发表于 11-04 09:25 858次阅读
    油浸变压器<b class='flag-5'>声纹</b>传感器:以<b class='flag-5'>声纹</b>特征<b class='flag-5'>识别</b>为核心的智能监测方案

    油浸变压器声纹监测:以声音守护设备健康

    ,已成为变压器状态评估的重要手段。本文将从技术原理、应用价值及发展趋势个维度,系统解析油浸变压器声纹监测的科学内涵与实践意义。声纹监测的核心原理基于设备运行声音的“
    的头像 发表于 10-29 09:07 658次阅读
    油浸变压器<b class='flag-5'>声纹</b>监测:以声音守护设备健康

    工业配电房滤波声纹传感器的技术解析与运维价值

    文章由山东华科信息技术有限公司提供在工业配电房设备状态监测领域,滤波声纹传感器作为新兴的声学感知技术,正逐步成为设备运维的关键工具。该技术通过捕捉设备运行中的
    的头像 发表于 10-17 09:12 556次阅读
    工业配电房滤波<b class='flag-5'>声纹</b>传感器的<b class='flag-5'>技术</b>解析与运维价值

    调压变压器声纹监测:电力设备健康管理的“声波密码”

    成为设备状态评估的新维度。本文从技术原理、实施路径与价值延伸方面,解析调压变压器声纹监测的智能化升级路径。声纹监测的技术逻辑:从声音到状态
    的头像 发表于 09-24 09:33 814次阅读
    调压变压器<b class='flag-5'>声纹</b>监测:电力设备健康管理的“声波密码”

    时空壶新品W4 AI同传耳机发布,“骨声纹技术有何神奇魔力?

    全球目光,为解决跨语言交流难题提供了新的思路与方案。“骨声纹技术革新:打破传统拾音局限长久以来,传统翻译设备的拾音方式在嘈杂环境中饱受诟病。常规麦克风易受外界
    的头像 发表于 09-12 11:02 1319次阅读
    时空壶新品W4 AI同传耳机发布,“骨<b class='flag-5'>声纹</b>”<b class='flag-5'>技术</b>有何神奇魔力?

    变压器振动温度传感器的多模态监测技术解析与应用展望

    文章由山东华科信息技术有限公司提供在电力设备智能化运维领域,变压器振动温度传感器正通过多参数融合检测技术,为电力变压器运行状态评估提供全维度数据支撑。该传感器集成声纹识别、振动监测与温度感知
    的头像 发表于 09-01 13:49 939次阅读
    变压器振动温度传感器的多模态监测<b class='flag-5'>技术</b>解析与应用展望

    配电房自适应滤波声纹传感器

    了"智能耳朵",实现了从被动响应到主动预防的运维模式革新。该技术的核心在于自适应滤波与声纹识别的深度结合。传感器内置的数字信号处理器可实时分析环境噪声特征,通过LMS算法动
    的头像 发表于 08-08 09:36 1237次阅读
    配电房自适应滤波<b class='flag-5'>声纹</b>传感器

    开关柜体振动声纹监测设备技术解析

    文章由山东华科信息技术有限公司提供开关柜作为电力分配与控制的核心设备,其运行状态直接影响电网稳定性。传统巡检方式难以捕捉早期机械故障,振动声纹监测技术通过解析设备运行产生的振动与声音信号,为状态评估
    的头像 发表于 07-03 10:08 1129次阅读
    开关柜体振动<b class='flag-5'>声纹</b>监测设备<b class='flag-5'>技术</b>解析

    华为智能光伏第全球安装大会圆满收官

    华为智能光伏第全球安装大会在东莞丫坡盛大召开,来自欧洲、亚太、拉美等全球各地的伙伴和头部安装
    的头像 发表于 06-20 09:51 1435次阅读