AI手语识别技术存在的挑战-电子发烧友网

据外媒报道，日本电气大学与软银公司联合，通过人工智能 AI技术，能将手语直接翻译成日语，这将使聋哑人士的沟通更顺畅。

目前该系统只能用于柜台设备上，聋哑人士能在摄像头前通过手语沟通，然后系统用图像识别技术，分析手指和手臂等身体几个部位的骨骼运动，将手势翻译成日文，显示在工作人员的电脑屏幕上，随后口头回复以文本的形式出现在听障人士面前的屏幕上，使交流更加顺畅。

该系统的核心技术由ABEJA提供，谷歌2018年投资了它，ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中，ABEJA通过让AI学习了5万个手语视频，使其捕捉到手语特征和变化，目前该系统能准确将手势翻译成大约1500个日语单词。

早在2015年就有手语识别研究

人工智能技术的出现和逐渐成熟，不仅有利于产业升级，事实上很早开始，就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。

2015年9月沙特设计师就专门研发了一款无线智能手套，内置传感器，聋哑人戴上交流的时候，传感器可以根据手指的运动追踪手势，再通过语言软件转换成声音和文字，在初期，这款无线智能手套只会讲法语、英语和阿拉伯语，该研究团队表示，后续会支持更多种语言。

在中国也很早就有相关的研究，2016年有媒体报道，东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统，这是一种结合人体生物及姿态信息的便携手语发声器，聋哑人可以通过手语使该机器发声翻译。

2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统，由智能传感手环、前端APP及云端服务组成，智能传感手环可以将听障人士的手语动作捕捉识别，并在云端转换为文字及语音呈现在APP端，传递给非手语使用者，同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。

百度、腾讯等互联网巨头企业也进行了相关研究，2019年百度在AI开发者大会上提出“Everyone can AI”的理想，意思是让每个人都能有平等接收AI的能力，百度以百度飞桨开源内容为基础建立训练模型，通过采集手势得到数据，借助手机转化成文字信息，听障人士可以使用翻译器，在咖啡馆、餐厅如同正常人一样点餐、交流。

优图AI手语翻译机界面

同是在2019年，腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机，以普通摄像头作为手语采集装置，用户正对摄像头完成手语表达，翻译机就能通过后台运算将手语快速翻译成文字。据介绍，优图AI手语翻译机数据集覆盖近千句日常表达，包括900个常用词汇，同时还对数据进行了分析和归纳，是当前最大的中文手语识别数据集。

手语识别技术存在很大挑战

相比于其他AI视觉识别技术，手语识别研发存在更大困难。在2018年东北大学的研究中，就透露出手语识别研究存在的现实问题，即每位听障人士的手语规划不同，同一个词打出的手势有差异，因此智能识别可能就没那么准确。

不过好在2018年中央颁发了国家通用手语标准方案，这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异，百度此前就表示，手语复杂、多样、以及地域性差异给研究带来不少困难。

百度还谈到另外一大困难，即可用于训练模型的数据量小，在上述日本的项目中，一位参与开发的软银工程师也表示，要建立一个将符号准确翻译成日文的模型，需要大量的手语数据。因此他们通过网站等方式，呼吁更多人发送手语图像数据。

小结

AI技术在服务产业升级的同时，也可以极大的帮助聋哑人群更好的实现沟通，这是这个时代的福音。据第二次全国残疾人抽样调查结果显示，我国有2780万听障人士，如果能够利用AI技术实现将手语实时翻译成文字和语音，这将是一项极其有意义的事。

日本聋人联合会认为，要使人工智能成为聋哑人群的有效工具，还需要很长的时间来实现。不过很明显从2015年到现在，手语识别在逐渐取得进步，也有相当多的研究人员和企业投入其中，对于未来逐步突破困难取得更大进步还是值得期待。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26573

浏览量
264237
人工智能

人工智能

+关注

关注
1777

文章
44033

浏览量
231003

原文标题：腾讯、百度、软银都在研究，利用AI技术将手语转文字有多重要？

文章出处：【微信号：elecfans，微信公众号：电子发烧友网】欢迎添加关注！文章转载请注明出处。

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony AI子系统，展示Openharmony系统的AI能力，并为

发表于 04-11 16:14

情感语音识别技术的挑战与未来发展

情感语音识别技术作为人工智能领域的重要分支，已经取得了显著的进展。然而，在实际应用中，情感语音识别技术仍面临许多挑战。本文将探讨情感语音

发表于 11-16 16:48 •225次阅读

语音识别技术在医疗健康领域的应用与挑战

随着医疗健康领域的发展和人工智能技术的进步，语音识别技术在医疗健康领域的应用越来越广泛。本文将探讨语音识别技术在医疗健康领域的应用以及面临的

发表于 11-01 17:21 •415次阅读

语音识别技术在安全领域的应用与挑战

随着社会对安全需求的不断增加，语音识别技术在安全领域的应用越来越广泛。本文将探讨语音识别技术在安全领域的应用以及面临的挑战。

发表于 10-26 14:48 •317次阅读

语音识别技术：端到端的挑战与解决方案

将探讨端到端语音识别技术的挑战与解决方案。二、端到端语音识别技术的挑战 1.噪声干扰和口音差异

发表于 10-18 17:06 •417次阅读

语音识别技术的挑战与机遇再探讨

一、引言随着科技的不断发展，语音识别技术得到了广泛应用。然而，语音识别技术在发展过程中面临着许多挑战，同时也带来了许多机遇。本文将再探讨语

发表于 10-18 16:56 •444次阅读

语音识别技术的挑战与机遇

一、引言语音识别技术是一种将人类语言转化为计算机可理解数据的技术。随着科技的不断发展，语音识别技术面临着诸多

发表于 10-10 17:10 •594次阅读

【KV260视觉入门套件试用体验】六、VITis AI车牌检测&车牌识别

视觉技术实现的自动识别车辆牌照号码的过程。该技术通过图像采集、车牌检测、字符分割和字符识别等步骤，实现对车牌号码的自动获取与识别。车牌

发表于 09-26 16:28

语音识别技术的进步与挑战

一、引言在当今数字化时代，语音识别技术已经成为人机交互的重要方式之一。本文将探讨语音识别技术的历史发展、现有的进步以及面临的挑战。二、语

发表于 09-22 18:29 •463次阅读

语音识别技术的挑战与机遇

一、引言随着科技的快速发展，语音识别技术成为了人机交互的重要方式。然而，尽管语音识别技术在某些领域已经取得了显著的进步，但在实际应用中仍然存在

发表于 09-20 16:17 •336次阅读

面部表情识别技术的挑战与解决方案

面部表情识别是一项复杂的技术，面临着许多挑战，如表情的多样性和变化性、面部肌肉运动、光照条件等。本文将探讨面部表情识别技术的

发表于 08-10 18:09 •385次阅读

人脸识别技术的挑战和未来发展

人脸识别技术在实现过程中面临着一些挑战和问题。首先，人脸识别技术需要具备高准确率和识别速度，以

发表于 06-28 18:07 •520次阅读

人脸识别图像技术的发展与挑战

人脸识别图像技术在过去几十年中得到了迅速发展和广泛应用，然而，该技术仍然面临着一些挑战和问题。首先，人脸识别图像

发表于 06-02 17:11 •341次阅读

手语数据集介绍

手语数据集是一个包含了手语识别相关数据的集合。这个数据集包含了大量的手语数据，包括手语的文本、手语

发表于 05-19 18:20 •821次阅读

手语识别技术的应用和前景

手语识别技术是一种通过分析人类手部动作来识别其所表达意义的技术。随着人口老龄化趋势的加剧和多元文化的融合，

发表于 05-19 17:59 •1969次阅读

搜索历史

AI手语识别技术存在的挑战

评论

开发者手机 AI - 目标识别 demo

情感语音识别技术的挑战与未来发展

语音识别技术在医疗健康领域的应用与挑战

语音识别技术在安全领域的应用与挑战

语音识别技术：端到端的挑战与解决方案

语音识别技术的挑战与机遇再探讨

语音识别技术的挑战与机遇

【KV260视觉入门套件试用体验】六、VITis AI车牌检测&车牌识别

语音识别技术的进步与挑战

语音识别技术的挑战与机遇

面部表情识别技术的挑战与解决方案

人脸识别技术的挑战和未来发展

人脸识别图像技术的发展与挑战

手语数据集介绍

手语识别技术的应用和前景