侵权投诉

什么是声纹?声纹识别的原理是什么?

MEMS 2019-03-11 09:16 次阅读

一、什么是声纹?

声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。

人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,发声器官–舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。

每个人的语音声学特征既有相对稳定性,又有变异性,不是一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。

尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。

声纹不如图像那样直观展现,在实际分析中,可通过波形图和语谱图进行展现,如下所示:

二、声纹识别的原理

人在讲话时使用的发声器官在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,主要体现在如下方面:

共鸣方式特征:咽腔共鸣、鼻腔共鸣和口腔共鸣

嗓音纯度特征:不同人的嗓音,纯度一般是不一样的,粗略地可分为高纯度(明亮)、低纯度(沙哑)和中等纯度三个等级

平均音高特征:平均音高的高低就是一般所说的嗓音是高亢还是低沉

音域特征:音域的高低就是通常所说的声音饱满还是干瘪

不同人的声音在语谱图中共振峰的分布情况不同,声纹识别正是通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人,从而实现“闻声识人”的功能。

三、声纹识别算法的技术指标

声纹识别在算法层面可通过如下基本的技术指标来判断其性能,除此之外还有其它的一些指标,如:信道鲁棒性、时变鲁棒性、假冒攻击鲁棒性、群体普适性等指标,这部分后续于详细展开讲解。

错误拒绝率(False Rejection Rate, FRR):分类问题中,若两个样本为同类(同一个人),却被系统误认为异类(非同一个人),则为错误拒绝案例。错误拒绝率为错误拒绝案例在所有同类匹配案例的比例。

错误接受率(False Acceptance Rate, FAR) :分类问题中,若两个样本为异类(非同一个人),却被系统误认为同类(同一个人),则为错误接受案例。错误接受率为错误接受案例在所有异类匹配案例的比例。

等错误率(Equal Error Rate,EER):调整阈值,使得误拒绝率(False Rejection Rate,FRR)等于误接受率(False Acceptance Rate,FAR),此时的FAR与FRR的值称为等错误率。

准确率(Accuracy,ACC):调整阈值,使得FAR+FRR最小,1减去这个值即为识别准确率,即ACC=1 – min(FAR+FRR)

速度:(提取速度:提取声纹速度与音频时长有关、验证比对速度):Real Time Factor 实时比(衡量提取时间跟音频时长的关系,比如:1秒能够处理80s的音频,那么实时比就是1:80)。验证比对速度是指平均每秒钟能进行的声纹比对次数。

ROC曲线:描述FAR与FRR之间相互变化关系的曲线,X轴为FAR的值,Y轴为FRR的值。从左到右,当阈值增长期间,每一个时刻都有一对FAR和FRR的值,将这些值在图上描点连成一条曲线,就是ROC曲线。

阈值:在接受/拒绝二元分类系统中,通常会设定一个阈值,分数超过该值时才做出接受决定。调节阈值可以根据业务需求平衡FAR与FRR。 当设定高阈值时,系统做出接受决定的得分要求较为严格,FAR降低,FRR升高;当设定低阈值时,系统做出接受决定的得分要求较为宽松,FAR升高,FRR降低。在不同应用场景下,调整不同的阈值,则可在安全性和方便性间平平衡,如下图所示:

四、影响声纹识别水平的因素

训练数据和算法是影响声纹识别水平的两个重要因素,在应用落地过程中,还会受很多因素的影响。

声源采样率:

人类语音的频段集中于50Hz ~ 8KHz之间,尤其在4KHz以下频段

离散信号覆盖频段为信号采样率的一半(奈奎斯特采样定理)。

采样率越高,信息量越大。

常用采样率:8KHz (即0 ~ 4KHz频段),16KHz(即0 ~ 8KHz频段)。

信噪比(SNR):

信噪比衡量一段音频中语音信号与噪声的能量比,即语音的干净程度:

15dB以上(基本干净)

6dB(嘈杂)

0dB(非常吵)

信道:

不同的采集设备,以及通信过程会引入不同的失真。

声纹识别算法与模型需要覆盖尽可能多的信道。

手机麦克风、桌面麦克风、固话、移动通信(CDMA, TD-LTE等)、微信……

语音时长:

语音时长(包括注册语音条数)会影响声纹识别的精度。

有效语音时长越长,算法得到的数据越多,精度也会越高。

短语音(1~3s)

长语音(20s+)

文本内容:

通俗地说,声纹识别系统通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人。

固定文本:注册与验证内容相同

半固定文本:内容一样但顺序不同;文本属于固定集合

自由文本

五、声纹识别的应用流程

声纹识别(VPR) ,生物识别技术的一种,也称为说话人识别 ,是从说话人发出的语音信号中提取声纹信息。

从应用上看,可分为:

说话人辨认(Speaker Identification):用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;

说话人确认(Speaker Verification):用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。

声纹识别在应用中分注册和验证两个主流程,根据不同的应用中,部分处理流程会存在差异,一般的声纹识别应用流程如下图所示:

六、声纹识别的应用场景

声纹识别作为生物识别技术的一种,有非常多好的应用场景,根据声音的特性,下面从公共安全、金融、社保、智能硬件四个领域介绍声纹识别的应用。

1. 公安领域

声纹作为一种生物特征,最早在刑侦和鉴识领域成功应用。

近年来,由于互联网的发展,语音案件也呈现出井喷的趋势,在这些语音案件中,声纹识别成了唯一一种有效的技术侦破手段,通过的声纹识别和声纹大数据技术进行重点人员监管、反电信诈骗、反恐、刑事案件侦破、身份查询与核验,助力公安有效遏制与打击犯罪,构建和强化安全的社会公众环境。

2. 金融

针对银行、互联网金融等各类金融及服务机构,通过声纹识别技术,提供了用户注册、远程验证、金融生物识别解决方案,大幅提高金融机构的风险防范系统安全性,强化风控能力,增加用户的安全性,防范身份欺诈。

另外在电话客服系统中,通过声纹识别技术,可实时识别出用户的身份,从而提供个性化的客户服务。

3. 社保

我国针对离退休人员,每年至少需要进行一次生存状态验证,并以此为依据进行养老金的发放,目前可通过到指定社保大厅或自助终端进行生存验证,对于一些行动不便的老人家,这种方式也是非常不便利。

声纹识别技术在远程身份验证中有着天然的优势,只需要一个电话(手机或固话都可以),即可完成生存验证,为参保人员提供了便利,同时也为国家节省大量成本,避免养老金流失。

4. 智能硬件

在智能硬件产品中,声纹识别解决了当前智能产品只能识别用户所说的内容,而不能区分说话人身份的问题,让智能产品能够区分不同的角色,实现“听声识人”。

让系统针对性对每个人提供不同的内容与服务,让人机交互更加简单,让用户享受更轻松、更具个性化、更安全的产品体验。

七、总结

声纹识别作为最前沿的生物识别技术,随着技术的成熟,将会在越来越多的应用场景下落地。

我们相信:在不久的将来,在第三代身份证上,声纹将成为继指纹、人像后又一个新增的公民身份ID。

声音将在我们未来的科技生活中扮演眼越来越重要的角色。

原文标题:人工智能老司机带你认识声音黑科技:声纹识别

文章出处:【微信号:MEMSensor,微信公众号:MEMS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

声纹识别全面应用需要多长的时间

随着远场语音技术的成熟和声纹传感器技术的进步,语音交互应用正在得到快速的发展,声纹识别发展前景也在不....
发表于 01-09 10:39 74次 阅读
声纹识别全面应用需要多长的时间

声纹识别发展优势明显 但想真正全面推广还需时日

和指纹、虹膜等生物特征一样,声纹也是我们唯一的、稳定的生物特征,在身份认证信息安全市场中扮演着重要的....
发表于 01-08 11:41 221次 阅读
声纹识别发展优势明显 但想真正全面推广还需时日

声纹识别应用于智能锁 安全性能否得到保证还未可知

近日,科大讯飞公司对外宣 称,该公司开发出新型的人工智能技术,可通过声音准确识别身份,该技术可应用于....
发表于 01-06 09:01 127次 阅读
声纹识别应用于智能锁 安全性能否得到保证还未可知

智能家居与声纹识别之间是怎样的联系

声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。
发表于 01-05 10:34 143次 阅读
智能家居与声纹识别之间是怎样的联系

人机交互趋势预测:语音识别+声纹识别+NLP,让设备识你懂你

日前,微软研究院对其2019年的研究进行了全方位盘点,“人机交互”赫然纸上。自从人类发明了计算机,就持续面临着
的头像 智能生物识别说 发表于 12-27 17:51 538次 阅读
人机交互趋势预测:语音识别+声纹识别+NLP,让设备识你懂你

人工智能是如何防范网络金融欺诈的

声纹识别是通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,简单的说就是辨别某一句话是否....
发表于 12-16 16:19 84次 阅读
人工智能是如何防范网络金融欺诈的

声纹识别技术能否不像其他技术那样多难

声纹识别就是通过声音识别说话人的一项技术。该技术是把人体声音信号转换为电信号,再用计算机进行识别。
发表于 12-04 15:48 142次 阅读
声纹识别技术能否不像其他技术那样多难

声音的模仿会影响声纹识别吗

配音演员模仿其他人的声音,虽然听觉上相似,但也无法模仿说话者最本质的特性。从声纹特征分析上还是会有差....
发表于 12-02 13:50 98次 阅读
声音的模仿会影响声纹识别吗

声纹识别准确率已超过99% 开始逐渐进入我们的生活

继“刷脸”之后 声纹识别也已进入我们的生活。近日,平安科技和金融壹账通联合项目组与广发银行签署了声纹....
发表于 12-02 10:07 292次 阅读
声纹识别准确率已超过99% 开始逐渐进入我们的生活

骨头的声波识别是怎么回事

生物识别技术比传统的身份鉴定方法更具安全、保密和方便性。
发表于 11-20 11:45 103次 阅读
骨头的声波识别是怎么回事

小米电视5将上线声纹识别功能,功能很好很强大

近日小米电视部总经理李肖爽曝光了小米电视5即将上线的声纹识别功能,他称:“给大家介绍一下小米电视5正....
的头像 汽车玩家 发表于 11-19 10:31 819次 阅读
小米电视5将上线声纹识别功能,功能很好很强大

哪一些生物识别技术是逃犯的克星

通过人脸识别、指纹识别、声纹识别等智能生物识别技术,可以在海量目标中快速、精准的锁定嫌疑人,让逃犯无....
发表于 11-12 10:18 159次 阅读
哪一些生物识别技术是逃犯的克星

人工智能界的逃犯克星不止人脸识别,声纹识别也能助力公安追逃

为全力落实扫黑除恶百日追逃行动,11月4日,公安部发布A级通缉令,公开通缉20名重大黑恶在逃人员。据公安部相关
的头像 智能生物识别说 发表于 11-06 17:27 1194次 阅读
人工智能界的逃犯克星不止人脸识别,声纹识别也能助力公安追逃

人脸识别和声纹识别加在一起会有什么后果

声纹识别面临的威胁主要有声音模仿、语音合成(一段话中掺入一两句原声)、人工智能技术合成的声音、剪辑拼....
发表于 11-04 15:59 573次 阅读
人脸识别和声纹识别加在一起会有什么后果

声纹识别是怎样的一情况

声纹识别,生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。
发表于 10-31 15:03 199次 阅读
声纹识别是怎样的一情况

声扬科技斩获“直通乌镇”全球互联网大赛总决赛三等奖

本届世界互联网大会有来自超过80个国家和地区的约1500名嘉宾参会。自2014年首次举办以来,大会逐....
的头像 人间烟火123 发表于 10-22 15:59 1050次 阅读
声扬科技斩获“直通乌镇”全球互联网大赛总决赛三等奖

声纹识别未来的研究方向会是往哪里

目前,指纹识别、人脸识别已经被大众所熟知,但同样作为生物识别的声纹识别,还处于技术挑战的前沿地带。
发表于 10-22 11:27 155次 阅读
声纹识别未来的研究方向会是往哪里

声纹识别技术研究的方向在哪里

目前,指纹识别、人脸识别已经被大众所熟知,但同样作为生物识别的声纹识别,还处于技术挑战的前沿地带。
发表于 10-18 15:45 202次 阅读
声纹识别技术研究的方向在哪里

声纹识别:保护声音安全性与真实性的利器

鹅厂喜提“嘀嘀嘀嘀嘀嘀”声音商标去年,北京市高级人民法院终审判决,认定腾讯公司申请的“嘀嘀嘀嘀嘀嘀”声音商标具
的头像 智能生物识别说 发表于 10-16 17:53 819次 阅读
声纹识别:保护声音安全性与真实性的利器

回顾霍尼韦尔与车萝卜联合发布的产品功能介绍和与应用

守霍者是第一个基于大数据分析和机器学习的汽车安全隐患检测仪,在每次出行前“体检”车辆,以更科学的方式....
的头像 霍尼韦尔传感智联 发表于 10-15 17:09 414次 阅读
回顾霍尼韦尔与车萝卜联合发布的产品功能介绍和与应用

用人工智能保护地球生态从哪里开始

人工智能助力生物多样性保护的事业刚刚启动,未来还需要不断的创新与尝试,随着技术的发展与环境保护重要性....
发表于 10-12 11:30 176次 阅读
用人工智能保护地球生态从哪里开始

如何利用人工智能防止网络欺诈

声纹识别是通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,简单的说就是辨别某一句话是否....
发表于 10-12 11:25 1437次 阅读
如何利用人工智能防止网络欺诈

快商通首席科学家:语音识别的后半段路,从语言处理走向语言理解

在近二十年来,尤其是引入深度学习以后,语音识别取得了一系列重大突破,并一步步走向市场并搭载到终端产品中。然而在
发表于 10-11 23:11 154次 阅读
快商通首席科学家:语音识别的后半段路,从语言处理走向语言理解

刷脸支付安全隐患引人深思,声纹识别“动态”优势凸显

据中央广播电视总台中国之声《新闻纵横》报道,随着二维码支付的普及,一种新型的支付方式——刷脸支付逐渐走进人们的生活。今年...
发表于 10-11 10:28 270次 阅读
刷脸支付安全隐患引人深思,声纹识别“动态”优势凸显

闻声识人——声纹识别如何走过规模商用前夜?

作为语音赛道一个重度垂直的领域,声纹识别终于从“等风来”,成为站在“风口”上的技术。随着新一波人工智....
的头像 墨记 发表于 10-09 07:26 2637次 阅读
闻声识人——声纹识别如何走过规模商用前夜?

声纹识别市场庞大 闻声识人时代或将到来

证明“我是我”是一个历久弥新的话题,近年来,生物识别技术迎来市场爆发,向商用和民用领域加速扩张:指纹....
发表于 10-08 08:57 231次 阅读
声纹识别市场庞大 闻声识人时代或将到来

声纹识别具备怎样的优势

随着5G的商用进一步的推进了物联网的构建,万物互联作为发展目标,非接触式识别技术声纹识别必定会有非常....
发表于 09-30 10:38 293次 阅读
声纹识别具备怎样的优势

声纹识别相对来说具有怎样的优势

在虚拟网络上的出入凭证不在是身份证,而是人们身上具备的唯一地生物属性。
发表于 09-25 11:49 279次 阅读
声纹识别相对来说具有怎样的优势

声纹识别在安防领域表现亮眼 但依旧面临诸多问题

同属于生物识别技术,与火爆的人脸识别相比,声纹识别表现得很低调,然而并不影响这一黑科技魅力的散发:巴....
发表于 09-16 09:21 594次 阅读
声纹识别在安防领域表现亮眼 但依旧面临诸多问题

君林科技应邀做了《声纹识别技术及其在电梯声音监控及分析领域的应用》主题演讲

作为国内规格最高和规模最大的物联网行业盛会,本届博览会向行业和公众展示了物联网在民用及工业多个领域的....
的头像 倩倩 发表于 09-11 15:30 948次 阅读
君林科技应邀做了《声纹识别技术及其在电梯声音监控及分析领域的应用》主题演讲

声纹识别:国内竞争格局基本形成,规模商用在即?

随着5G催生全新应用场景,连接能力将增强至百亿级,车联网、物联网、工业互联网等领域将获得全新的技术赋....
的头像 墨记 发表于 09-11 01:10 4156次 阅读
声纹识别:国内竞争格局基本形成,规模商用在即?

声纹识别的应用和介绍

与此同时,为保障用户登陆的“安全性”,云知声为平安好医生客户端声纹登录系统提供数字串注册和登录的“文....
的头像 云知声 发表于 08-08 10:19 1838次 阅读
声纹识别的应用和介绍

声纹识别将成为下一个杀手级应用吗

虽然目前声纹识别还没在智能手机这样的消费级产品中普及,但其实在银行交易和国防安全等领域已经广泛应用。
发表于 07-18 11:44 661次 阅读
声纹识别将成为下一个杀手级应用吗

深度神经网络算法打造顶尖声纹识别技术

灵云声纹识别能力平台可私有化部署在企业内部,支持大规模声纹注册、验证、变更、注销等业务需求,以及对声....
的头像 CTI论坛 发表于 04-30 14:27 1440次 阅读
深度神经网络算法打造顶尖声纹识别技术

快商通即将将亮相此次2019华为全球金融峰会

为极大限度地降低身份盗用风险,向各个金融机构提供高效精准的身份认证和反欺诈服务,快商通推出“金融反欺....
的头像 电子发烧友网工程师 发表于 04-26 17:12 2500次 阅读
快商通即将将亮相此次2019华为全球金融峰会

东进技术前沿的产品和解决方案

东进声纹识别系统是东进技术基于先进的声纹识别技术开发的,全新的、受专利保护的验证系统。该系统基于文本....
的头像 CTI论坛 发表于 04-11 15:52 2180次 阅读
东进技术前沿的产品和解决方案

国美FenmmyNote声纹识别体验 到底好不好用

创新是引领发展的第一动力,而对于国产手机行业来说,近年来的创新似乎少了一点。虽然最近OV的两款可升降....
的头像 39度创意研究所 发表于 04-03 10:53 1202次 阅读
国美FenmmyNote声纹识别体验 到底好不好用

快商通监狱智慧化解决方案现已成功应用到监狱管理的各个环节之中

作为一家实力雄厚的民族AI企业,快商通以用声纹识别和自然语言处理技术解决国家切实问题为己任。在监狱方....
的头像 电子发烧友网工程师 发表于 03-29 14:10 1558次 阅读
快商通监狱智慧化解决方案现已成功应用到监狱管理的各个环节之中

快商通正式对外发布第五代智能门禁产品,全球首款搭载AI芯片的智能门禁

对物业来说,该设备可实现业主与访客远程可视对讲,无需社区管理人员电话询问。基于访客留影功能,物业通过....
的头像 电子发烧友网工程师 发表于 03-16 10:48 2007次 阅读
快商通正式对外发布第五代智能门禁产品,全球首款搭载AI芯片的智能门禁

声纹识别技术排名全球前三,快商通凭什么?

近年来,中国人工智能高速发展。无人超市,无人物流,无人加油站,无人驾驶,无人酒店……再加上各种功能健....
的头像 电子发烧友网工程师 发表于 03-15 14:57 4430次 阅读
声纹识别技术排名全球前三,快商通凭什么?

快商通多产品落地,全方位覆盖公安需求

以网络安全为例,随着短视频的迅速发展,各平台每天都需要上传上亿的短视频数据,为给网络安全的监管带来巨....
的头像 电子发烧友网工程师 发表于 03-15 14:53 2238次 阅读
快商通多产品落地,全方位覆盖公安需求

新闻快讯 AI广告跃盟科技融资1.25亿 外骨骼机器人傲鲨智能获投资

声扬科技(VoiceAI)是一家声纹识别和智能语音解决方案提供商,致力于AI语音领域核心算法的研发,....
的头像 创伙伴 发表于 02-22 11:18 2007次 阅读
新闻快讯 AI广告跃盟科技融资1.25亿 外骨骼机器人傲鲨智能获投资

一种用于手机的新型用户身份验证方式

上海交通大学的俞嘉地副教授说:“为了抵御攻击,现有的解决方案要么使用专门的基础设施,如Apple F....
的头像 IEEE电气电子工程师学会 发表于 02-18 11:06 2339次 阅读
一种用于手机的新型用户身份验证方式

苹果新专利,能让机器通过说话者的语言来分辨这个用户是谁

Apple今天新批下来的专利或许能改变这个现状。“这项专利能够让机器通过说话者的语言来分辨这个用户是....
发表于 08-22 16:15 420次 阅读
苹果新专利,能让机器通过说话者的语言来分辨这个用户是谁

声纹识别:让安全的声音响彻你的耳边

据新华网报道,继去年广州等地推出“微信身份证”后,我国首个基于声纹识别技术的互联网身份认证云项目落户....
的头像 安全自动化 发表于 07-09 08:59 2261次 阅读
声纹识别:让安全的声音响彻你的耳边

动态声纹识别与人脸识别能代替指纹识别码

回顾手机解锁方式的发展,从功能机时代的密码解锁,到智能机的图案解锁,指纹解锁,以及近来广泛应用的脸部....
发表于 06-26 15:30 1110次 阅读
动态声纹识别与人脸识别能代替指纹识别码

小豹AI音箱上手评测:499元价位综合表现最好的智能音箱,没有之一

3月21日,猎豹移动联合旗下人工智能公司猎户星空在北京水立方举行“猎豹3.21机器人之夜”发布会,小....
的头像 39度创意研究所 发表于 06-11 10:50 8388次 阅读
小豹AI音箱上手评测:499元价位综合表现最好的智能音箱,没有之一

声纹识别公司SpeakIn获IDG领投近亿元融资

近日,声纹识别人工智能公司SpeakIn(势必可赢科技)及其全资子公司国音科技,宣布已于5月完成近亿....
的头像 MEMS 发表于 06-01 16:33 2964次 阅读
声纹识别公司SpeakIn获IDG领投近亿元融资

君林科技:用声纹识别来解放你的双手

因为现在的智能音箱是可以进行语音模糊搜索的,这对于智能硬件达到真正的语音交互是十分重要的。这意味着你....
的头像 Duke 发表于 05-29 18:22 3002次 阅读
君林科技:用声纹识别来解放你的双手

“人工智能”纳入政府工作报告 声纹识别引领未来新潮流

传统上,我们对人工智能有一个很大的误区,认为人工智能就是机器人;但其实,人工智能并不能简单等同于机器....
发表于 05-15 10:27 486次 阅读
“人工智能”纳入政府工作报告 声纹识别引领未来新潮流