0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能阅读的突破唇语

我快闭嘴 来源: 智东西 作者: 智东西 2020-01-29 16:28 次阅读

12月5日消息,据外媒报道,阿里巴巴浙江大学研究中心和史蒂文斯理工学院(Stevens Institute of Technology)的研究人员近日推出了一种提升AI阅读唇语准确率的方法——“Lip by Speech(LIBS)”。该方法利用视频中的语音信息作为辅助线索,减少了AI对视频中无关帧的关注,使其注意力更加集中。据研究人员称,使用该方法的AI在两个唇语阅读基准测试中,字符错误率分别降低了7.66%和2.75%。

一、图像语音相结合解读唇语

▲面部图像识别的过程示例

实际上,能够从视频中读唇语的AI和机器学习算法并不是什么新鲜事物。早在2016年,谷歌和牛津大学的研究人员就详细介绍了一种系统,该系统可以以46.8%的精度注释视频素材,优于专业读唇语人员12.4%的精度。但是,即使是最先进的系统也难以解决唇部运动的“一语多义”问题,从而使唇语识别的准确率一直无法超越语音识别

为了追求唇语阅读性能更加强大的系统,阿里巴巴浙江大学研究中心和史蒂文斯理工学院的研究人员设计了一种方法,称为“Lip by Speech(LIBS)”。该方法利用从语音识别器中提取的特征信息作为补充线索。他们说,利用该方法的系统在两个基准测试中都达到了业界领先的准确性,在字符错误率方面分别降低了7.66%和2.75%。

LIBS和其他类似的解决方案可以帮助那些听障人士观看缺少字幕的视频。据估计,全世界有4.66亿人患有失能性听力障碍(disabling hearing loss),约占世界人口的5%。根据世界卫生组织的数据,到2050年,这一数字可能会超过9亿。

二、LIBS方法是怎样应用的?

▲WAS与LIBS方法唇语解读标记范围的对比

LIBS会以多种规模等级,从有声视频中提取有用的音频数据,包括序列级(sequence level)、文本级(context level)和帧级(frame level)。然后,将这些提取的数据与视频数据通过他们之间的对应关系对齐,最后利用一种筛选(filtering)技术来优化(refine)提取的数据。

LIBS的语音识别器和唇语阅读器这两部分均为一种“基于注意力的序列到序列的(attention-based sequence-to-sequence)”体系结构,这种体系结构可将一段音频或视频序列的输入信息转化为带有标签和注意价值(attention value)的输出信息。

研究人员通过上述方法在LRS2数据集上对系统进行训练,LRS2包含来自BBC的45,000多个口头句子,同时也在CMLR上训练,CMLR是现有的最大中文普通话口语语料库,具有来自中国网络电视台的10万多个自然句子(包括3,000多个中文字符和20,000个词组)。

三、“帧级知识提取”是关键

该团队指出,由于LRS2数据集中的某些句子过短,该系统难以在LRS2数据集上实现“合理的”结果。但是,一旦对最大长度为16个单词的句子进行了预训练,解码器就可以利用文本级的知识,提高LRS2数据集中句子结尾部分的质量。

研究人员在论文中写道:“LIBS减少了对无关帧的关注”,“帧级知识的提取(frame-level knowledge distillation)进一步提高了视频帧特征的可分辨性,使注意力更加集中。”

结语:AI唇语识别市场仍具有较高增长潜力

目前AI唇语识别在基准测试中的准确率仍然在50%左右,现实应用价值还有待于准确率的进一步提升。此次新提出的LIBS方法为这一领域的研究提供了更好的思路,一种视频语音相结合的研究思路。金融身份识别、嘈杂环境下的语音识别辅助、听障人士的辅助交流等领域均为AI唇语识别的重要应用场景。期待国内外科技巨头在该领域有更多新的突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43863

    浏览量

    230614
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1571

    浏览量

    46436
  • 唇语识别
    +关注

    关注

    0

    文章

    4

    浏览量

    1986
收藏 人收藏

    评论

    相关推荐

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗?如果技术成熟的那一天
    发表于 09-16 15:40

    百度总裁:百度在人工智能领域已有重大突破

      随着阿法狗大战李世石,人工智能引发越来越多的关注。百度总裁张亚勤28日表示,百度长期坚持技术创新,2015年研发投入超过100亿元,目前在人工智能领域已有重大突破。  张亚勤在天津夏季达沃斯论坛
    发表于 07-01 15:22

    百度人工智能大神离职,人工智能的出路在哪?

    `今天,吴恩达确认离职百度的消息迅速在业界刷屏。吴恩达曾不止一次感慨,现在人工智能最大的问题就是“机会太多,但人才太少”。AI,人工智能,该领域的研究包括机器人、语言识别、图像识别、自然语言处理
    发表于 03-23 17:00

    人工智能就业前景

    据相关招聘机构数据显示,2018年AI领域仍然是大部分资深技术人才转岗的首选目标,在人才最紧缺的前十大职位中,时下最火的大数据、人工智能、算法类岗位占据半壁江山。据调查指出,2017年技术研发类岗位
    发表于 03-29 15:46

    人工智能的影响超乎你想象

    本帖最后由 一只耳朵怪 于 2018-6-22 15:50 编辑 人工智能对中国的意义超乎你想象 去年以来,人工智能便成了科技圈的宠儿,其他诸如AR、VR的,似乎都消失不见。而在今年的两会
    发表于 06-22 14:40

    解读人工智能的未来

    `已历经60多年的人工智能在物联网以及大数据的推动下,实现飞跃式的发展,并且迎来了第三个黄金周期。必优传感今天和大家解读一下关于人工智能的未来。自从有了人工智能,引发了人类的各种“未来论”。有人说
    发表于 11-14 10:43

    【2019人工智能大会】大咖齐聚,共同探讨加速人工智能技术落地

    金额就突破了 1500 亿元。2017 年,全球人工智能芯片市场规模是 44.7 亿美元,2018 年达到 57 亿美元,预计 2020 年有望突破百亿大关,而到 2025 年人工智能
    发表于 01-21 17:20

    人工智能医生未来或上线,人工智能医疗市场规模持续增长

      导读:机构预测,中国医疗人工智能的市场需求已达数百亿元。专家认为,“人工智能医生”的应用,有利于缓解社会老龄化带来的医疗资源供需失衡以及地域分配不均等问题。那么,“人工智能医生”何时能真正
    发表于 02-24 09:29

    人工智能:超越炒作

    开车或飞行,您可以相信会涉及一些严重的AI功能。阅读,说话或翻译语言,预测物体的质量和速度,代表你购买股票,识别面部或诊断乳腺癌,都是通过算法完成的人工智能特征。现在,想象一下整个AI事物的连接世界
    发表于 05-29 10:46

    什么是基于云计算的人工智能服务?

    如今,采用人工智能的企业遇到了一个主要障碍,那就是在内部开发人工智能产品成本高昂,因此有了外包人工智能产品的需求。而对于从中小企业到预算受限的大型企业来说,通过云计算来采用人工智能的成
    发表于 09-11 11:51

    人工智能未来的突破点究竟在哪里?是电子硬件还是软件呢?

    在给定的硅片上能装多少个晶体管?人工智能未来的突破点究竟在哪里?是电子硬件还是软件呢?
    发表于 06-17 06:13

    人工智能芯片是人工智能发展的

    人工智能芯片是人工智能发展的 | 特伦斯谢诺夫斯基责编 | 屠敏本文内容经授权摘自《深度学习 智能时代的核心驱动力量》从AlphaGo的人机对战,到无人驾驶汽车的上路,再到AI合成主播上岗
    发表于 07-27 07:02

    物联网人工智能是什么?

    一、人工智能介绍工作以后想要拿高薪的话,人工智能是你的不二之选,那么问题来了,究竟什么是人工智能呢?又需要了解哪些才能去开发人工智能产品呢?接下来小编带领大家进入
    发表于 09-09 14:12

    嵌入式与人工智能关系是什么

    嵌入式与人工智能关系_嵌入式人工智能的发展趋势  所谓嵌入式人工智能,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感
    发表于 10-27 07:41

    《移动终端人工智能技术与应用开发》人工智能的发展与AI技术的进步

    人工智能的发展是随着人类生活需要,产业需求不断提升的,其中人工智能的发展很大程度上受到了计算机算力的影响,随着数据处理量的增大,人工智能算法对算力的要求逐年增加,而且没过两年算力上升一倍,因此往往
    发表于 02-17 11:00