0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

推出“唇语识别”技术, 搜狗再上热门 不出声也能“听”懂你

Qp2m_ggservicer 2017-12-15 11:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能概念火热的当下,人机交互的发展方向也正趋于多元化,从最初的键盘打字到触控屏,再到现在的语音交互和手势交互,无一不是前沿技术落地的结果。

12月14日消息,搜狗今天正式推出全新的人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统,通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。

与已有的语音识别产品不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。

搜狗语音交互中心技术总监陈伟告诉记者,搜狗的唇语识别技术首创了复杂端到端深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练,加上搜狗在自然语言处理方面的强大优势,最终取得了业界领先的唇语识别效果。

按照搜狗方面提供的数据显示,在非特定人开放口语测试集上,搜狗唇语识别系统已经达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。

在这里要着重说明的是,中文唇语识别的难度要高于英文唇语识别。

陈伟解释到,中文有四个声调,英文的基本发音单元在50个左右,而如果中文的声韵母切开来看,建模数量会超过200个。

在刚结束不久的乌镇世界互联网大会上,搜狗唇语识别技术亮相,在业内大多数唇语识别技术实用性尚待考证的环境下,成功完成了业内首个中文唇语识别系统的公开演示。

国内大部分企业都扎堆聚集在智能语音、图像识别等领域,陈伟表示,搜狗开发唇语识别技术是希望解决嘈杂环境下的语音识别准确度问题。

目前有两种方式可以解决这个问题:一是硬件层面的语音增强,对噪音进行屏蔽;二是增加多模态信息,比如唇语识别的图像信息。

作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。

比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也可以保证说话内容的私密性;在安防领域,由于目前多数监控只有摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情分析带来很多难题,而唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。

除此之外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。

搜狗近年来一直在集中资源做自然语言的研究,目前在语音识别、语义理解、机器翻译等方面均取得了比较领先的成果并实现产品落地,此次推出唇语识别技术,将推动整个AI行业的技术革新。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 搜狗
    +关注

    关注

    0

    文章

    91

    浏览量

    14231

原文标题:GGAI 技术前沿 | 搜狗推出“唇语识别”技术:不出声也能“听”懂你

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    真正“懂你”的输入法长什么样?讯飞用AI键作答

    一个日活亿级的表达市集,让输入法真的“懂你
    的头像 发表于 11-08 23:33 5033次阅读
    真正“<b class='flag-5'>懂你</b>”的输入法长什么样?讯飞用AI键作答

    AI如何让家电更懂你

    自生成式 AI 爆发以来,多模态 AI、智能终端尤其是「具身智能」等领域迅速发展。在智能家电等设备中集成 AI 技术,正在成为热门的发展趋势。
    的头像 发表于 08-21 16:52 917次阅读

    找正方形的代码我把roi删除过后识别到正方形,加上roi后就识别不出来,为什么?

    找正方形的代码我把roi删除过后识别到正方形,加上roi后就识别不出来,更改roi为更大更稳定的范围
    发表于 08-14 06:23

    k230接入规定电源后,只亮红灯,按键都没有反应,电脑识别不出sdcard,请问是烧坏了吗?

    k230接入规定电源后,只亮红灯,按键都没有反应,电脑识别不出sdcard,请问是烧坏了吗
    发表于 07-29 12:25

    旷世之声全新无损蓝牙发射器支持骁龙畅技术

    近日,旷世之声正式推出QCC Dongle Pro和QCC Dongle无损蓝牙发射器,该系列产品分别搭载第二代高通S5音频平台和第二代高通S3音频平台,支持Snapdragon Sound 骁龙畅技术,赋
    的头像 发表于 07-14 15:22 1046次阅读

    NRK3502语音识别芯片:开启自动炒菜机智能烹饪新时代

    "动口不动手"的烹饪革命来了!NRK3502语音芯片让自动炒菜机听懂你的每句话,3-5米远场精准识别,在油烟嘈杂中秒懂指令。从此预热、炒菜、暂停全语音操控,边做饭边处理其他事,厨房
    的头像 发表于 06-25 13:57 434次阅读

    佛瑞亚车携手Smart Eye推出车内安全生物识别认证技术

    全球汽车技术与可持续移动出行解决方案领导者FORVIA佛瑞亚集团携手汽车行业人类洞察力人工智能(Human Insight AI)领域的领先供应商Smart Eye,共同推出最新创新成果:基于虹膜
    的头像 发表于 04-29 17:03 1785次阅读

    战时库室调度 “快准稳”:RFID 射频识别技术如何赋信息化保障能力跃升?

    高效又精准的库室管理,成了摆在眼前急需解决的难题。好在现在有了 RFID 技术,也就是射频识别技术,它可先进了。这种技术不用直接接触,就能快速识别
    的头像 发表于 04-16 17:09 461次阅读
    战时库室调度 “快准稳”:RFID 射频<b class='flag-5'>识别</b><b class='flag-5'>技术</b>如何赋<b class='flag-5'>能</b>信息化保障能力跃升?

    原来他们不出你的证件照!人证比对一体机提高识别准确度

    一个人。而且很多人都疑惑,海关人员真的准确认出来吗?近日,一项外国的研究就表明,那些负责签发护照的人可能不出来。英国阿伯丁、约克和澳大利亚悉尼针对澳大利亚护
    的头像 发表于 04-08 10:42 658次阅读
    原来他们<b class='flag-5'>也</b>认<b class='flag-5'>不出</b>你的证件照!人证比对一体机提高<b class='flag-5'>识别</b>准确度

    智能语音新风尚:WTK6900语音识别芯片赋未来家居,让凉爽触“声”可及

    起点,我们开启一场“解放双手”的科技革命,让每一缕凉风都随“声”而至。一、核心技术:精准识别,无惧环境挑战自适应降噪,听懂你的每一句话WTK6900系列芯片搭载前
    的头像 发表于 04-08 08:43 965次阅读
    智能语音新风尚:WTK6900语音<b class='flag-5'>识别</b>芯片赋<b class='flag-5'>能</b>未来家居,让凉爽触“声”可及

    Snapdragon Sound骁龙畅技术解锁高品质听音体验

    体验,Snapdragon Sound 骁龙畅技术将无线音频、连接和移动领域的多种技术进行优化组合,带来清晰的音质、可靠的连接和超低时延,让用户在多种场景下都能解锁高品质听音体验。
    的头像 发表于 03-12 15:55 1485次阅读

    dac播放提示音时,仔细会有规律的哒哒声,这个软件有办法消除吗?还得得修改硬件?

    dac播放提示音时,仔细会有规律的哒哒声,这个软件有办法消除吗?还得得修改硬件?
    发表于 03-05 22:30

    98%识别率!语音+触摸方案,让卫浴操控一步到位!

    体验,让舒适与便捷一步到位!方案亮点:技术,精准高效高精度语音识别:语音识别率高达98%,支持多语言指令;在嘈杂环境
    的头像 发表于 02-26 15:49 799次阅读
    98%<b class='flag-5'>识别</b>率!语音+触摸方案,让卫浴操控一步到位!

    中科芯:科技之光温暖障人群

    树立行业标杆,讲好中国故事,传递中国声音,充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。近日,“崛起的民族品牌”专题系列节目对话天津中科芯科技有限公司(简称:中科芯)的创始人兼总经理
    的头像 发表于 01-13 10:54 832次阅读
    中科<b class='flag-5'>听</b>芯:科技之光温暖<b class='flag-5'>听</b>障人群

    ADS1255断电之后再上电就不可以读取了,是什么原因?

    如题,使用ADS1255芯片做数据采集的时候,STM32F107在下载数据之后第一次正确AD数据采集,在仿真的时候可以一直做AD数据采集。但是断电之后再上电就不可以读取了,请教一下什么原因。采集电压不变,VREF不变。
    发表于 01-10 08:06