0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

吱一声就知道你是谁,深度学习识别短片段说话人

Hf1h_BigDataDig 来源:YXQ 2019-07-30 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

UtterIdNet是一种新型的具有短语音片段识别能力的深度神经网络。该模型的灵感来自于两个成功且非常流行的深度神经网络架构:ResNet和DeepID3。据该模型背后的研究人员称,该模型采用了一种新的体系结构,通过在短语音片段中有效地增加信息的使用,使其适合于短片段说话人的识别。

他们在VoxCeleb数据集上对UtterIdNet进行了训练和测试,这是说话人识别的最新基准,并证明UtterIdNet在短片段上的表现优于最先进的技术。对不同分段持续时间的评估显示,短分段的性能一致且稳定,对于2秒、1秒、特别是微秒的分段,与之前的模型相比有显著改进。

随着智能虚拟助手的不断发展,它们对增强语音识别算法的要求也越来越高。与传统的先进模型相比,该模型显示了更好的结果。虽然在完整的语音片段中表现出了微弱的优势,这也是研究人员打算在未来的工作中进行研究的,但是UtterIdNet在增强短片段语音识别方面有很大的潜力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116236
  • 深度学习
    +关注

    关注

    73

    文章

    5607

    浏览量

    124626

原文标题:机器有了综合感官?新研究结合视觉和听觉进行情感预测 | 一周AI最火论文

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片到底是怎么工作的?篇讲透核心技术原理与国产选型指南

    有没有好奇过:喊一声“打开空调”,空调怎么就“听懂”了的话?智能门锁凭什么能靠句“开门”就解锁?这些看似简单的语音交互背后,其实都藏着
    的头像 发表于 04-17 09:06 97次阅读
    语音<b class='flag-5'>识别</b>芯片到底是怎么工作的?<b class='flag-5'>一</b>篇讲透核心技术原理与国产选型指南

    贴就见效,用谁知道

    前言贴就见效,用谁知道!今天小编讲述款理论产品落地的灵丹妙药——吸波材料。其实吸波材料在最近几年的发展非常迅速,从最开始航天军工的应
    的头像 发表于 03-31 11:34 1241次阅读
    <b class='flag-5'>一</b>贴就见效,<b class='flag-5'>谁</b>用谁<b class='flag-5'>知道</b>!

    上海海思HiSpark平台重新定义下代智能玩具

    今年春晚,直呼一声“科技春晚”也不为过。机器的组团亮相让我们看到,短短年,他们从扶着下台进化到“武林高手”。
    的头像 发表于 03-11 14:09 294次阅读

    小型自重构机器能不能帮忙做个?

    **! --- # 六、我可以继续帮你做这些(全部免费) 只要说一声,我马上给你: 1. **完整 3D 结构图纸(STL)** 2. **接线图** 3. **ESP32S3 全套代码
    发表于 02-21 19:24

    瑞芯微(EASY EAI)RV1126B 语音识别

    字符序列。与说话识别说话确认不同,后者尝试识别或确认发出语音的
    的头像 发表于 01-21 10:43 1026次阅读
    瑞芯微(EASY EAI)RV1126B 语音<b class='flag-5'>识别</b>

    机器学习深度学习中需避免的 7 个常见错误与局限性

    无论是刚入门还是已经从事人工智能模型相关工作段时间,机器学习深度学习中都存在些我们需要时
    的头像 发表于 01-07 15:37 349次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    如何深度学习机器视觉的应用场景

    检测应用 微细缺陷识别:检测肉眼难以发现的微小缺陷和异常 纹理分析:对材料表面纹理进行智能分析和缺陷识别 3D表面重建:通过深度学习进行高精度3D建模和检测 电子行业应用 PCB板复杂
    的头像 发表于 11-27 10:19 327次阅读

    瑞芯微RK3576体关键点识别算法(骨骼点)

    人体关键点识别种基于深度学习的对进行检测定位与姿势估计的模型,广泛应用于体育分析、动物行为监测和机器
    的头像 发表于 08-27 10:07 1154次阅读
    瑞芯微RK3576<b class='flag-5'>人</b>体关键点<b class='flag-5'>识别</b>算法(骨骼点)

    为什么说电容是 “电子设备的第一声心跳”?开机瞬间的关键作用

    电子设备能够平稳、可靠地启动。这种开机瞬间的关键作用,让电容赢得了"电子设备的第一声心跳"的美誉。 要理解电容为何如此重要,我们需要从它的基本特性说起。电容是种能够存储电荷的被动电子元件,由两个导体极板和中间的绝缘介质组成。当电压
    的头像 发表于 08-20 16:12 1160次阅读

    瑞芯微RK3576语音识别算法

    字符序列。与说话识别说话确认不同,后者尝试识别或确认发出语音的
    的头像 发表于 08-15 15:13 2437次阅读
    瑞芯微RK3576语音<b class='flag-5'>识别</b>算法

    深度学习遇上嵌入式资源困境,特征空间如何破局?

    近年来,随着人工智能(AI)技术的迅猛发展,深度学习(Deep Learning)成为最热门的研究领域之。在语音识别、图像识别、自然语言处
    发表于 07-14 14:50 1320次阅读
    当<b class='flag-5'>深度</b><b class='flag-5'>学习</b>遇上嵌入式资源困境,特征空间如何破局?

    深度学习赋能:正面吊车载箱号识别系统的核心技术

    支撑。 深度学习驱动的智能识别 传统OCR技术易受光线、污损或箱体图案干扰,而新识别系统通过深度卷积神经网络(CNN)和注意力机制,实现
    的头像 发表于 05-07 10:10 670次阅读

    【「# ROS 2智能机器开发实践」阅读体验】视觉实现的基础算法的应用

    、机器视觉:从理论到实践 第7章详细介绍了ROS2在机器视觉领域的应用,涵盖了相机标定、OpenCV集成、视觉巡线、二维码识别以及深度学习
    发表于 05-03 19:41