0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI手语识别技术存在的挑战

lPCU_elecfans 来源:电子发烧友网 作者:李弯弯 2021-11-17 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据外媒报道,日本电气大学与软银公司联合,通过人工智能AI技术,能将手语直接翻译成日语,这将使聋哑人士的沟通更顺畅。

目前该系统只能用于柜台设备上,聋哑人士能在摄像头前通过手语沟通,然后系统用图像识别技术,分析手指和手臂等身体几个部位的骨骼运动,将手势翻译成日文,显示在工作人员的电脑屏幕上,随后口头回复以文本的形式出现在听障人士面前的屏幕上,使交流更加顺畅。

该系统的核心技术由ABEJA提供,谷歌2018年投资了它,ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中,ABEJA通过让AI学习了5万个手语视频,使其捕捉到手语特征和变化,目前该系统能准确将手势翻译成大约1500个日语单词。

早在2015年就有手语识别研究

人工智能技术的出现和逐渐成熟,不仅有利于产业升级,事实上很早开始,就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。

2015年9月沙特设计师就专门研发了一款无线智能手套,内置传感器,聋哑人戴上交流的时候,传感器可以根据手指的运动追踪手势,再通过语言软件转换成声音和文字,在初期,这款无线智能手套只会讲法语、英语和阿拉伯语,该研究团队表示,后续会支持更多种语言。

在中国也很早就有相关的研究,2016年有媒体报道,东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统,这是一种结合人体生物及姿态信息的便携手语发声器,聋哑人可以通过手语使该机器发声翻译。

2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统,由智能传感手环、前端APP及云端服务组成,智能传感手环可以将听障人士的手语动作捕捉识别,并在云端转换为文字及语音呈现在APP端,传递给非手语使用者,同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。

百度、腾讯等互联网巨头企业也进行了相关研究,2019年百度在AI开发者大会上提出“Everyone can AI”的理想,意思是让每个人都能有平等接收AI的能力,百度以百度飞桨开源内容为基础建立训练模型,通过采集手势得到数据,借助手机转化成文字信息,听障人士可以使用翻译器,在咖啡馆、餐厅如同正常人一样点餐、交流。

优图AI手语翻译机界面

同是在2019年,腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机,以普通摄像头作为手语采集装置,用户正对摄像头完成手语表达,翻译机就能通过后台运算将手语快速翻译成文字。据介绍,优图AI手语翻译机数据集覆盖近千句日常表达,包括900个常用词汇,同时还对数据进行了分析和归纳,是当前最大的中文手语识别数据集。

手语识别技术存在很大挑战

相比于其他AI视觉识别技术,手语识别研发存在更大困难。在2018年东北大学的研究中,就透露出手语识别研究存在的现实问题,即每位听障人士的手语规划不同,同一个词打出的手势有差异,因此智能识别可能就没那么准确。

不过好在2018年中央颁发了国家通用手语标准方案,这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异,百度此前就表示,手语复杂、多样、以及地域性差异给研究带来不少困难。

百度还谈到另外一大困难,即可用于训练模型的数据量小,在上述日本的项目中,一位参与开发的软银工程师也表示,要建立一个将符号准确翻译成日文的模型,需要大量的手语数据。因此他们通过网站等方式,呼吁更多人发送手语图像数据。

小结

AI技术在服务产业升级的同时,也可以极大的帮助聋哑人群更好的实现沟通,这是这个时代的福音。据第二次全国残疾人抽样调查结果显示,我国有2780万听障人士,如果能够利用AI技术实现将手语实时翻译成文字和语音,这将是一项极其有意义的事。

日本聋人联合会认为,要使人工智能成为聋哑人群的有效工具,还需要很长的时间来实现。不过很明显从2015年到现在,手语识别在逐渐取得进步,也有相当多的研究人员和企业投入其中,对于未来逐步突破困难取得更大进步还是值得期待。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42161

    浏览量

    303160
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267900

原文标题:腾讯、百度、软银都在研究,利用AI技术将手语转文字有多重要?

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【瑞萨AI挑战赛】家庭AI相框

    、语义识别、视觉化反馈和交互控制,形成一个具备完整应用闭环的家庭 AI 终端。 1. 项目定位与设计目标 家庭相框类产品的核心价值,不在于“能把图片显示出来”,而在于它是否能理解当前展示内容、降低用户
    发表于 03-13 21:44

    使用NORDIC AI的好处

    运动/手势识别、可穿戴健康监测、预测性维护、楼宇与工业传感网络本地分析、声音/关键词/图像识别等,都有官方明确提到的典型用例。[Unlock Edge AI 博客; Nordic Edge
    发表于 01-31 23:16

    “芯”年来袭 | 瑞萨边缘AI线上技术月暨挑战

    自1月7日起,瑞萨边缘AI技术月活动将每周开启一场在线技术交流,涵盖MCU/MPU产品、应用案例及开发实践,并同步开启瑞萨AI评测挑战赛,借
    的头像 发表于 12-25 10:21 2585次阅读
    “芯”年来袭 | 瑞萨边缘<b class='flag-5'>AI</b>线上<b class='flag-5'>技术</b>月暨<b class='flag-5'>挑战</b>赛

    影像仪AI自动寻边技术精准捕捉边界测量,检测效率翻倍!

    【智能制造测量】影像测量仪的AI自动寻边技术是通过深度学习模型,实现对工件特征的自主识别与边缘精准提取。能解决质检环节中多重边界提偏、刀纹干扰、对比度低等测量痛点。
    发表于 11-18 10:16

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    【飞凌OK-MX9596-C开发板试用】②体验WIFI、蓝牙、音频、视频,为AI应用打下基础 - 飞凌嵌入式 - 电子技术论坛 - 广受欢迎的专业电子论坛! 在上一帖子中,我们测试了摄像头拍照
    发表于 11-01 22:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和量子计算的两项新兴的技术,将在生产假说方面发挥重要作用,从而改变科学发现的范式。 生成式AI: 2、穷举搜索 3、分析排错与组合优化 分析排错是生成假说的重要手段。强化学习也在优化假说组合、寻找科学发现
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+半导体芯片产业的前沿技术

    闪存。 现在应用于逻辑芯片,还在起步阶段。 2)3D堆叠技术面临的挑战 3D堆叠技术面临最大挑战是散热问题。 3)3D堆叠技术
    发表于 09-15 14:50

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 从2017年开始生成式AI
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法和思路。第四章是全面介绍半导体芯产业的前沿技术
    发表于 09-05 15:10

    RK3576助力智慧安防:8路高清采集与AI识别

    在智慧城市和数字化园区的建设过程中,安防监控系统正从“被动记录”走向“主动识别与分析”。随着AI算法的成熟和高清视频处理能力的提升,市场对多路视频采集、实时拼接、智能识别的需求日益增强。 米尔电子
    发表于 08-22 17:41

    无人机AI识别巡检系统解决方案

           无人机AI识别巡检系统解决方案        随着基础设施规模的持续扩大和数字化转型的深入推进,传统人工巡检模式正面临效率、安全与成本的多重挑战。以电力、光伏、交通、建筑等领域为例
    的头像 发表于 07-18 14:02 1019次阅读

    无人机AI视觉行为识别系统

    的需求。同时,人工监控存在效率低下、易疲劳、反应滞后等问题,无法应对日益复杂的安全管理挑战。 在这一背景下,陕西广合通结合无人机机动性与人工智能分析能力的视觉行为识别系统为基础研发了无人机AI
    的头像 发表于 07-04 16:53 1306次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    富士通创新生物识别身份验证技术介绍

    在数字化浪潮席卷全球的当下,身份认证技术的安全性与便捷性,已然成为全社会关注的焦点。传统的身份认证方案,诸如密码、指纹识别、人脸识别等,尽管应用广泛,却也面临着诸多严峻挑战,如密码易遭
    的头像 发表于 07-03 09:31 1257次阅读

    AI 时代来袭,手机芯片面临哪些新挑战

    边缘AI、生成式AI(GenAI)以及下一代通信技术正为本已面临高性能与低功耗压力的手机带来更多计算负载。领先的智能手机厂商正努力应对本地化生成式AI、常规手机功能以及与云之间日益增长
    的头像 发表于 06-10 08:34 1447次阅读
    <b class='flag-5'>AI</b> 时代来袭,手机芯片面临哪些新<b class='flag-5'>挑战</b>?