0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯、百度、软银都在研究,利用AI技术将手语转文字有多重要?

Carol Li 来源:电子发烧友网 作者:李弯弯 2021-11-15 09:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)据外媒报道,日本电气大学与软银公司联合,通过人工智能AI技术,能将手语直接翻译成日语,这将使聋哑人士的沟通更顺畅。

目前该系统只能用于柜台设备上,聋哑人士能在摄像头前通过手语沟通,然后系统用图像识别技术,分析手指和手臂等身体几个部位的骨骼运动,将手势翻译成日文,显示在工作人员的电脑屏幕上,随后口头回复以文本的形式出现在听障人士面前的屏幕上,使交流更加顺畅。

该系统的核心技术由ABEJA提供,谷歌2018年投资了它,ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中,ABEJA通过让AI学习了5万个手语视频,使其捕捉到手语特征和变化,目前该系统能准确将手势翻译成大约1500个日语单词。

早在2015年就有手语识别研究

人工智能技术的出现和逐渐成熟,不仅有利于产业升级,事实上很早开始,就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。

2015年9月沙特设计师就专门研发了一款无线智能手套,内置传感器,聋哑人戴上交流的时候,传感器可以根据手指的运动追踪手势,再通过语言软件转换成声音和文字,在初期,这款无线智能手套只会讲法语、英语和阿拉伯语,该研究团队表示,后续会支持更多种语言。

在中国也很早就有相关的研究,2016年有媒体报道,东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统,这是一种结合人体生物及姿态信息的便携手语发声器,聋哑人可以通过手语使该机器发声翻译。

2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统,由智能传感手环、前端APP及云端服务组成,智能传感手环可以将听障人士的手语动作捕捉识别,并在云端转换为文字及语音呈现在APP端,传递给非手语使用者,同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。

百度、腾讯等互联网巨头企业也进行了相关研究,2019年百度在AI开发者大会上提出“Everyone can AI”的理想,意思是让每个人都能有平等接收AI的能力,百度以百度飞桨开源内容为基础建立训练模型,通过采集手势得到数据,借助手机转化成文字信息,听障人士可以使用翻译器,在咖啡馆、餐厅如同正常人一样点餐、交流。

优图AI手语翻译机界面

同是在2019年,腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机,以普通摄像头作为手语采集装置,用户正对摄像头完成手语表达,翻译机就能通过后台运算将手语快速翻译成文字。据介绍,优图AI手语翻译机数据集覆盖近千句日常表达,包括900个常用词汇,同时还对数据进行了分析和归纳,是当前最大的中文手语识别数据集。

手语识别技术存在很大挑战

相比于其他AI视觉识别技术,手语识别研发存在更大困难。在2018年东北大学的研究中,就透露出手语识别研究存在的现实问题,即每位听障人士的手语规划不同,同一个词打出的手势有差异,因此智能识别可能就没那么准确。

不过好在2018年中央颁发了国家通用手语标准方案,这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异,百度此前就表示,手语复杂、多样、以及地域性差异给研究带来不少困难。

百度还谈到另外一大困难,即可用于训练模型的数据量小,在上述日本的项目中,一位参与开发的软银工程师也表示,要建立一个将符号准确翻译成日文的模型,需要大量的手语数据。因此他们通过网站等方式,呼吁更多人发送手语图像数据。

小结

AI技术在服务产业升级的同时,也可以极大的帮助聋哑人群更好的实现沟通,这是这个时代的福音。据第二次全国残疾人抽样调查结果显示,我国有2780万听障人士,如果能够利用AI技术实现将手语实时翻译成文字和语音,这将是一项极其有意义的事。

日本聋人联合会认为,要使人工智能成为聋哑人群的有效工具,还需要很长的时间来实现。不过很明显从2015年到现在,手语识别在逐渐取得进步,也有相当多的研究人员和企业投入其中,对于未来逐步突破困难取得更大进步还是值得期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42211

    浏览量

    303213
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度Create 2026发布“百度胜算”

    ;新尺子"取代沿用至今的Token消耗量指标,重新丈量AI时代的真实价值。与此同时,百度智能云同步发布企业数据智能平台 **"百度胜算"** ,剑指Agent在严肃业务场景中"不敢用、用不好"的核心痛点。
    的头像 发表于 05-17 09:47 1531次阅读

    起大早,赶晚集?2026年百度智驾啥新技术

    Apollo,积累了超过1.5亿公里的L4级自动驾驶测试里程,打造了全球规模最大的Robotaxi车队之一。 然而在主流媒体中,百度的名字更多出现在AI大模型和搜索业务上,它在自动驾驶底层技术上的积累反而没有太多的声音。一个在全
    的头像 发表于 05-17 09:18 1016次阅读
    起大早,赶晚集?2026年<b class='flag-5'>百度</b>智驾<b class='flag-5'>有</b>啥新<b class='flag-5'>技术</b>?

    格灵深瞳亮相Create 2026百度AI开发者大会

    5月13日-14日,Create 2026 百度 AI 开发者大会在北京国家会议中心二期举行。作为百度的生态伙伴,格灵深瞳在专题论坛和公开课上分享了最新的 AI 原生视觉智能产品:视觉
    的头像 发表于 05-16 10:58 540次阅读

    百度发布DAA新度量衡与四大智能体产品

    近日,百度Create AI开发者大会在北京开幕。百度创始人李彦宏在开幕式上抛出一个重磅概念—— **DAA(日活智能体数,Daily Active Agents)** ,将其定义为AI
    的头像 发表于 05-15 10:50 752次阅读

    百度智能云正式发布Hogee

    5月13日,在Create2026百度AI开发者大会上,百度智能云正式发布了一款全新的企业一站式AI营销应用——Hogee。这款产品的亮相,标志着
    的头像 发表于 05-15 09:18 846次阅读

    利尔达作为“数据通道与硬件方案”核心伙伴亮相2026百度AI开发者大会

    5月13日,以“自我进化”为主题的Create2026百度AI开发者大会在北京国家会议中心二期盛大开幕。百度创始人李彦宏在开幕式上首次提出AI时代的“度量衡”——日活智能体数(DAA)
    的头像 发表于 05-14 17:36 328次阅读
    利尔达作为“数据通道与硬件方案”核心伙伴亮相2026<b class='flag-5'>百度</b><b class='flag-5'>AI</b>开发者大会

    格灵深瞳与您相约Create 2026百度AI开发者大会

    5月13日-14日,Create 2026 百度 AI 开发者大会将在北京国家会议中心二期举行。大会以“万物一体”为主题,探讨 Agent 时代下 AI 从基础设施建设到产业应用的全
    的头像 发表于 05-12 17:05 944次阅读

    黑马-Java+AI新版V16零基础就业班百度云网盘下载+Java+AI全栈开发工程师

    ,要么主动 AI 能力深度融入 Java 技术体系,成为具备“传统架构 + 智能增强”双重竞争力的融合型工程师。Java+AI 融合开发并非简单的 SDK 调用,而是一套从架构模式、
    发表于 05-01 11:29

    通天璇MaaS平台入选2025年AI产品

    近日,DBC德本咨询发布“2025年AI产品”,通动力旗下的通天璇MaaS平台凭借其在企业级A
    的头像 发表于 01-29 13:45 488次阅读
    <b class='flag-5'>软</b>通天璇MaaS平台入选2025年<b class='flag-5'>度</b><b class='flag-5'>百</b>大<b class='flag-5'>AI</b>产品

    百度世界大会亮点 五年五芯 百度宣布打造最硬AI

    年,持续为行业搭建起交流前沿技术、碰撞创新思维、洞察未来趋势的重要平台。 今日(11月13日)Baidu World 2025在北京举办。在这里,可以体验AI应用的价值涌现,见证AI
    的头像 发表于 11-13 15:47 2073次阅读

    百度世界2025进行中 百度昆仑芯超节点亮相 性能巨幅提升

    思维、洞察未来趋势的重要平台。 今日(11月13日)Baidu World 2025在北京举办。在这里,可以体验AI应用的价值涌现,见证AI能力的创新爆发。 今年的百度世界2025以“
    的头像 发表于 11-13 11:51 1578次阅读

    百度智能云发布全球首批AI数字员工

    没错,在今天的百度AI Day开放日现场,这么溜的同事们正式上岗!
    的头像 发表于 08-12 09:47 1986次阅读

    百度智能云亮相第二十二届ChinaJoy

    百度智能云亮相第二十二届ChinaJoy 8月1日,第二十二届中国国际数码互动娱乐展览会(ChinaJoy)在上海开幕。大会期间,百度全景展示了百度智能云千帆大模型平台等行业领先的技术
    的头像 发表于 08-05 09:47 1003次阅读

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI百度
    发表于 07-09 18:30

    怎么用labview实现语音转文字

    请问怎么用labview实现语音转文字
    发表于 07-01 16:27