0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究证明:商业语音识别系统的错误率非常高

如意 来源:雷锋网 作者:杨丽 2020-10-26 16:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

某些语音识别系统(ASR)的准确性可能要比之前假定的差很多。”这是最近约翰·霍普金斯大学、波兰波兹南工业大学、弗罗茨瓦夫科技大学以及初创公司Avaya的研究人员一项正在进行的研究主要发现。

这项研究对内部创建的数据集上的商业语音识别模型进行了基准测试。共同作者声称,词错误率(Word Error Rate, WER)(一种常见的语音识别性能指标)要显著高于最佳报告结果,这可能表明自然语言处理(NLP)领域存在更多待克服的问题。

据了解,目前ASR已广泛应用于诸多场景中,如电话会议、电子邮件、智能设备等。ASR模型的综合基准中,标准语料库的WER仅有2%~3%,而正是这一统计数据遭到了上述作者的质疑。他们声称,大多数ASR的交互场景都是在“类似于聊天机器人”的背景下进行的,说话人往往因为意识到跟他们的交互对象是聊天机器人,因此通常会将命令简化成结构紧凑的简短词语,而非正常的自然对话。作者基于来自1595个供应商和1261个客户的50个呼叫中心对话数据集对几套ASR系统进行了评估。其通常时间长达8.5个小时,其中2.2个小时是对话。通过测试,作者发现ASR系统的错误率基本在15%以下,这与基准测试中的2%相悖。

研究证明:商业语音识别系统的错误率非常高

而基于保险、通信、预定等金融行业的语料库中,作者发现其WER的测试结果高达23.31%。其中,预定和通信的错误率最高,可能是因为对话涉及特定的日期、时间、订单金额、地点、产品和公司名称等。但在所有领域的测试中,其错误率均高于13.73%。

研究人员将这一问题归结为领域适应性问题——基准测试使用了单一性语料,例如Librispeech(1000小时英语有声读物录音)、WSJ(新闻口述的谈话)和Switchboard(电话交谈),这些都可能太过简单而无法真正挑战ASR系统的可靠性。

而且,尽管他们试图刻意模仿真实、自发的对话,但本质上还是受约束的,比如需要配音演员,就某一合适主题进行脚本/半脚本对话,而且正是由于配音演员的存在,几乎都不需要考虑因性别、母语因素而产生的发音问题。

作为一种补救措施,研究人员建议ASR和NLP社区收集和注释音频数据集,使其更好地与ASR系统的实际应用场景保持一致,他们还呼吁建立更具包容性的声学模型,更广泛的方言语料库,这些改变将会促进音频信号处理的技术改进。

因此,这些问题并非无法克服。“学界和工业界应该深思熟虑,考虑可以创建高质量的测试数据集。我们认为,对ASR准确性的过于乐观会损害NLP领域下游应用程序的开发。”研究人员最后表示。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 软件
    +关注

    关注

    69

    文章

    5360

    浏览量

    91881
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116236
  • ASR
    ASR
    +关注

    关注

    2

    文章

    45

    浏览量

    19452
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    指令的识别与响应。无论是在家庭还是嘈杂的工业场合,这一类芯片都可以实现准确的智能语音交互,这种离线控制方式为用户提供了极大的便利。
    的头像 发表于 10-31 15:27 673次阅读

    水下目标智能识别系统平台全面解析

    水下目标智能识别系统平台全面解析
    的头像 发表于 10-17 17:09 486次阅读
    水下目标智能<b class='flag-5'>识别系统</b>平台全面解析

    水下目标智能识别系统软件平台

    水下目标智能识别系统软件平台
    的头像 发表于 07-16 15:28 679次阅读
    水下目标智能<b class='flag-5'>识别系统</b>软件平台

    基于FPGA的数字识别系统设计

    在图像处理领域,图像识别是较为困难而关键的技术。这项技术被广泛的应用到娱乐、工业、军事等领域。本次设计数字识别系统已经在车牌识别、运动员号码识别等多处运用。本
    的头像 发表于 07-16 14:28 1913次阅读
    基于FPGA的数字<b class='flag-5'>识别系统</b>设计

    铁路车号识别系统的基本原理与应用

    铁路车号识别系统是铁路运输智能化管理的关键技术之一,它通过自动化手段实现对货运列车的高效精准识别,为矿区及铁路运输管理提供了重要的技术支撑。以下从系统原理、核心组件及技术优势三个方面展开说明。 一
    的头像 发表于 07-07 10:30 1346次阅读
    铁路车号<b class='flag-5'>识别系统</b>的基本原理与应用

    无人机AI视觉行为识别系统

    无人机AI视觉行为识别系统 随着无人机技术的快速发展和计算机视觉领域的突破性进展,无人机AI视觉行为识别系统应运而生。传统监控系统受限于固定视角和有限覆盖范围,难以满足现代社会对全方位、智能化监控
    的头像 发表于 07-04 16:53 1205次阅读

    铁路车号智能识别系统AI助力铁路高效运转

    识别系统
    jf_84977585
    发布于 :2025年06月27日 16:24:19

    龙门吊箱号识别系统助力码头智能化升级#龙门吊箱号识别系统

    识别系统
    jf_60141436
    发布于 :2025年05月26日 11:05:07

    工地AI行为识别系统作用

    等),并即时预警,帮助工地实现从“人防”到“技防”的转型升级。 为什么工地需要AI行为识别系统? 1、事故频发,安全难保障 工地环境复杂,工人违规操作、防护缺失等问题频出,传统人工巡检难以及时发现风险。 2、监管成本,效率低 2
    的头像 发表于 05-08 12:00 1090次阅读

    景区AI行为识别系统作用

    景区AI行为识别系统作用 景区AI行为识别系统是什么? 景区AI行为识别系统是利用人工智能技术(如视频分析、人脸识别)构建的智能管理方案。通过部署摄像头+AI算法,实时监控游客行为,自
    的头像 发表于 05-07 15:32 1184次阅读
    景区AI行为<b class='flag-5'>识别系统</b>作用

    工厂园区AI行为识别系统作用

    工厂园区AI行为识别系统作用 工厂园区AI行为识别系统是什么? 工厂园区AI行为识别系统是基于人工智能技术的智能化管理方案,通过摄像头与AI算法融合,实时监控人员行为、设备操作寄环境状态,自动
    的头像 发表于 05-06 17:49 1001次阅读