据外媒报道,日本电气大学与软银公司联合,通过人工智能AI技术,能将手语直接翻译成日语,这将使聋哑人士的沟通更顺畅。
目前该系统只能用于柜台设备上,聋哑人士能在摄像头前通过手语沟通,然后系统用图像识别技术,分析手指和手臂等身体几个部位的骨骼运动,将手势翻译成日文,显示在工作人员的电脑屏幕上,随后口头回复以文本的形式出现在听障人士面前的屏幕上,使交流更加顺畅。
该系统的核心技术由ABEJA提供,谷歌2018年投资了它,ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中,ABEJA通过让AI学习了5万个手语视频,使其捕捉到手语特征和变化,目前该系统能准确将手势翻译成大约1500个日语单词。
早在2015年就有手语识别研究
人工智能技术的出现和逐渐成熟,不仅有利于产业升级,事实上很早开始,就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。
2015年9月沙特设计师就专门研发了一款无线智能手套,内置传感器,聋哑人戴上交流的时候,传感器可以根据手指的运动追踪手势,再通过语言软件转换成声音和文字,在初期,这款无线智能手套只会讲法语、英语和阿拉伯语,该研究团队表示,后续会支持更多种语言。
在中国也很早就有相关的研究,2016年有媒体报道,东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统,这是一种结合人体生物及姿态信息的便携手语发声器,聋哑人可以通过手语使该机器发声翻译。
2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统,由智能传感手环、前端APP及云端服务组成,智能传感手环可以将听障人士的手语动作捕捉识别,并在云端转换为文字及语音呈现在APP端,传递给非手语使用者,同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。
百度、腾讯等互联网巨头企业也进行了相关研究,2019年百度在AI开发者大会上提出“Everyone can AI”的理想,意思是让每个人都能有平等接收AI的能力,百度以百度飞桨开源内容为基础建立训练模型,通过采集手势得到数据,借助手机转化成文字信息,听障人士可以使用翻译器,在咖啡馆、餐厅如同正常人一样点餐、交流。
优图AI手语翻译机界面
同是在2019年,腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机,以普通摄像头作为手语采集装置,用户正对摄像头完成手语表达,翻译机就能通过后台运算将手语快速翻译成文字。据介绍,优图AI手语翻译机数据集覆盖近千句日常表达,包括900个常用词汇,同时还对数据进行了分析和归纳,是当前最大的中文手语识别数据集。
手语识别技术存在很大挑战
相比于其他AI视觉识别技术,手语识别研发存在更大困难。在2018年东北大学的研究中,就透露出手语识别研究存在的现实问题,即每位听障人士的手语规划不同,同一个词打出的手势有差异,因此智能识别可能就没那么准确。
不过好在2018年中央颁发了国家通用手语标准方案,这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异,百度此前就表示,手语复杂、多样、以及地域性差异给研究带来不少困难。
百度还谈到另外一大困难,即可用于训练模型的数据量小,在上述日本的项目中,一位参与开发的软银工程师也表示,要建立一个将符号准确翻译成日文的模型,需要大量的手语数据。因此他们通过网站等方式,呼吁更多人发送手语图像数据。
小结
AI技术在服务产业升级的同时,也可以极大的帮助聋哑人群更好的实现沟通,这是这个时代的福音。据第二次全国残疾人抽样调查结果显示,我国有2780万听障人士,如果能够利用AI技术实现将手语实时翻译成文字和语音,这将是一项极其有意义的事。
日本聋人联合会认为,要使人工智能成为聋哑人群的有效工具,还需要很长的时间来实现。不过很明显从2015年到现在,手语识别在逐渐取得进步,也有相当多的研究人员和企业投入其中,对于未来逐步突破困难取得更大进步还是值得期待。
责任编辑:haq
原文标题:腾讯、百度、软银都在研究,利用AI技术将手语转文字有多重要?
文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
城实验室正在努力研制“鹏城云脑Ⅲ”
商汤科技获得全球首个个人隐私保护标准的认证
基于人工智能技术的火车轨道状况应用
派CT最新Dubhewer软件满足医生诊疗需求
四足机器人真正的走进千家万户还需要多久
AI发展的“奇点” 从AI数羊到“相牛” 人工智能应用如何低门槛化?
大数据及人工智能厂商博睿数据发布2021年报
思岚方舱内机器人多机协作提升运营效率
如何使用STM32G4 32位MCU系列
深兰神秘新品重磅发布 三款AI清扫机器人齐亮相
爱立信全球公用事业创新中心正式投入使用
地平线AI开发平台高效助力智能驾驶软件差异化开发与应用
华为联合全产业开发者共同打造行业昇腾AI解决方案
英特尔On产业创新峰会精彩抢先看
量子技术成国防工业新风口,中国已走在世界前列
星环科技Sophon AutoCV助力视觉AI工业化生产
使用NVIDIA RTX分支优化光线追踪图形
四维图新依托大数据及地理信息领域相关技术 全面助力疫情指挥工作开展
NVIDIA TensorRT支持矩阵中的流控制结构层部分
RK3399开发板AI人工智能深度学习之TensorFlow 测试

TensorRT的功能与应用分析
何为算力
人工智能数据资源服务商海天瑞声发布2021年报
基于NVIDIA DGX A100 80GB的生物计算引擎
渊亭科技宣布完成亿元人民币B轮融资
利用NVIDIA Triton推理服务器加速语音识别的速度
对话式AI的概念、工作原理及应用领域
深蓝科技响应号召,复工复产的同时积极开拓海外市场
星环科技推企业级AI能力运营平台Sophon MLOps 助推AI模型落地
商汤用AI构筑智慧底座 为一座座城市筑起科技防线
IBM重磅发布拓展实用量子计算的最新路线图
考拉悠然科技与华为签署合作协议共建昇腾AI生态
将AI嵌入到整个系统设计工作流的步骤及应用
了解一下Endpoint AI(端点人工智能)的优势
基于RA系列32位MCU的VUI解决方案
类脑计算是什么,人工智能下神经科学启发的类脑计算
如何用人工智能来解决摄影中照片出现人像模糊不清的问题

如何设计智能型水杯
隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器

【工信部人才培养工程第一期】资深行业分析师解读AI领域动向与就业机会

评论