创作

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

AI手语识别技术存在的挑战

elecfans 来源:电子发烧友网 作者:李弯弯 2021-11-17 09:16 次阅读

据外媒报道,日本电气大学与软银公司联合,通过人工智能AI技术,能将手语直接翻译成日语,这将使聋哑人士的沟通更顺畅。

目前该系统只能用于柜台设备上,聋哑人士能在摄像头前通过手语沟通,然后系统用图像识别技术,分析手指和手臂等身体几个部位的骨骼运动,将手势翻译成日文,显示在工作人员的电脑屏幕上,随后口头回复以文本的形式出现在听障人士面前的屏幕上,使交流更加顺畅。

该系统的核心技术由ABEJA提供,谷歌2018年投资了它,ABEJA的核心产品是使用机器学习帮助公司从他们的数据堆中开展商业分析。在这个项目中,ABEJA通过让AI学习了5万个手语视频,使其捕捉到手语特征和变化,目前该系统能准确将手势翻译成大约1500个日语单词。

早在2015年就有手语识别研究

人工智能技术的出现和逐渐成熟,不仅有利于产业升级,事实上很早开始,就有研究人员尝试利用AI技术帮助聋哑人士更加顺畅的交流。

2015年9月沙特设计师就专门研发了一款无线智能手套,内置传感器,聋哑人戴上交流的时候,传感器可以根据手指的运动追踪手势,再通过语言软件转换成声音和文字,在初期,这款无线智能手套只会讲法语、英语和阿拉伯语,该研究团队表示,后续会支持更多种语言。

在中国也很早就有相关的研究,2016年有媒体报道,东大自动化专业李师宁等同学研发出了一种最新型的手语识别发声系统,这是一种结合人体生物及姿态信息的便携手语发声器,聋哑人可以通过手语使该机器发声翻译。

2018年东北大学也研制出一款帮助听障人士沟通交流的智能系统,由智能传感手环、前端APP及云端服务组成,智能传感手环可以将听障人士的手语动作捕捉识别,并在云端转换为文字及语音呈现在APP端,传递给非手语使用者,同时又可以将非手语使用者的语音在APP端转换为文字加手语动图的“双语形式”。

百度、腾讯等互联网巨头企业也进行了相关研究,2019年百度在AI开发者大会上提出“Everyone can AI”的理想,意思是让每个人都能有平等接收AI的能力,百度以百度飞桨开源内容为基础建立训练模型,通过采集手势得到数据,借助手机转化成文字信息,听障人士可以使用翻译器,在咖啡馆、餐厅如同正常人一样点餐、交流。

优图AI手语翻译机界面

同是在2019年,腾讯优图实验室也推出了一款基于自研算法的优图AI手语翻译机,以普通摄像头作为手语采集装置,用户正对摄像头完成手语表达,翻译机就能通过后台运算将手语快速翻译成文字。据介绍,优图AI手语翻译机数据集覆盖近千句日常表达,包括900个常用词汇,同时还对数据进行了分析和归纳,是当前最大的中文手语识别数据集。

手语识别技术存在很大挑战

相比于其他AI视觉识别技术,手语识别研发存在更大困难。在2018年东北大学的研究中,就透露出手语识别研究存在的现实问题,即每位听障人士的手语规划不同,同一个词打出的手势有差异,因此智能识别可能就没那么准确。

不过好在2018年中央颁发了国家通用手语标准方案,这很大程度有利于后续手语转文字或语音方面的研究。即使如此可能还是会存在细微差异,百度此前就表示,手语复杂、多样、以及地域性差异给研究带来不少困难。

百度还谈到另外一大困难,即可用于训练模型的数据量小,在上述日本的项目中,一位参与开发的软银工程师也表示,要建立一个将符号准确翻译成日文的模型,需要大量的手语数据。因此他们通过网站等方式,呼吁更多人发送手语图像数据。

小结

AI技术在服务产业升级的同时,也可以极大的帮助聋哑人群更好的实现沟通,这是这个时代的福音。据第二次全国残疾人抽样调查结果显示,我国有2780万听障人士,如果能够利用AI技术实现将手语实时翻译成文字和语音,这将是一项极其有意义的事。

日本聋人联合会认为,要使人工智能成为聋哑人群的有效工具,还需要很长的时间来实现。不过很明显从2015年到现在,手语识别在逐渐取得进步,也有相当多的研究人员和企业投入其中,对于未来逐步突破困难取得更大进步还是值得期待。

责任编辑:haq

原文标题:腾讯、百度、软银都在研究,利用AI技术将手语转文字有多重要?

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    端侧AI增长空间巨大,更易用的芯片平台、移植工具链是加速落地的关键!

    电子发烧友网报道(文/李弯弯)随着端侧AI芯片逐渐成熟,视觉AI应用正在加速向千行百业渗透,包括智能....
    的头像 Carol Li 发表于 05-17 00:04 313次 阅读
    端侧AI增长空间巨大,更易用的芯片平台、移植工具链是加速落地的关键!

    城实验室正在努力研制“鹏城云脑Ⅲ”

    近日 “鹏城云脑Ⅱ”重大科技基础设施项目——“AI集群软硬件系统”的技术验收与成果评价会在深圳举行。....
    的头像 华为计算 发表于 05-16 18:00 237次 阅读

    商汤科技获得全球首个个人隐私保护标准的认证

    近日,人工智能软件公司商汤科技经英国标准协会审核后,获得了个人信息管理体系-BS10012:2017....
    的头像 汽车玩家 发表于 05-16 16:46 229次 阅读

    基于人工智能技术的火车轨道状况应用

      与工业自动化、预测性维护和更智能的工作环境相关的智能行业计划正在创造机会,将人工智能用作智能传感....
    的头像 星星科技指导员 发表于 05-16 15:06 257次 阅读

    商汤科技获BS10012:2017个人信息管理体系资质证书

    近日,商汤科技在个人信息与隐私保护方面再获权威审核机构的认可。  
    的头像 科技绿洲 发表于 05-16 14:58 163次 阅读

    贸泽开售用于健身跟踪的Bosch BHI260AP自学习AI智能传感器

    2022年5月16日 – 专注于推动行业创新的知名新品引入 (NPI) 分销商™贸泽电子 (Mous....
    的头像 21克888 发表于 05-16 14:11 360次 阅读
    贸泽开售用于健身跟踪的Bosch BHI260AP自学习AI智能传感器

    派CT最新Dubhewer软件满足医生诊疗需求

    派CT自上线以来,得到行业的广泛关注和赞赏,其搭载的多项全球首创技术备受瞩目,配套的Dubhewer....
    的头像 科技绿洲 发表于 05-16 11:34 203次 阅读

    商汤科技在个人信息与隐私保护方面再获权威审核机构的认可

    近日,商汤科技在个人信息与隐私保护方面再获权威审核机构的认可。
    的头像 商汤科技SenseTime 发表于 05-16 11:24 139次 阅读

    KubeDL基于Kubernetes的AI工作负载管理框架

    ./oschina_soft/kubedl.zip
    发表于 05-16 10:16 3次 阅读
    KubeDL基于Kubernetes的AI工作负载管理框架

    使用Transformers的企业数据挑战解决方案

      NeMo 是用于培训 对话人工智能 模型的框架。在 NeMo 存储库内的 released co....
    的头像 星星科技指导员 发表于 05-16 09:29 91次 阅读
    使用Transformers的企业数据挑战解决方案

    使用NVIDIA A30 GPU加速AI推理工作负载

      A30 旨在通过提供四个视频解码器、一个 JPEG 解码器和一个光流解码器来加速智能视频分析( ....
    的头像 星星科技指导员 发表于 05-16 09:25 126次 阅读
    使用NVIDIA A30 GPU加速AI推理工作负载

    四足机器人真正的走进千家万户还需要多久

    距今已有2600余年的庞贝古城也开始用机器狗巡逻了。这些兢兢业业的四足机器人要穿过碎石瓦砾,或爬进摇....
    的头像 四足机器人 发表于 05-16 09:14 13次 阅读

    AI发展的“奇点” 从AI数羊到“相牛” 人工智能应用如何低门槛化?

    近日,热搜上AI数羊的新闻吸引了一大波网友的关注与讨论。新闻中甘肃牧民运用AI技术来数羊,让人倍感惊....
    的头像 脑极体 发表于 05-16 09:13 248次 阅读

    大数据及人工智能厂商博睿数据发布2021年报

    大数据及人工智能厂商博睿数据北京博睿宏远数据科技股份有限公司发布2021年报告,具体内容如下。 近三....
    的头像 汽车玩家 发表于 05-16 09:02 186次 阅读

    思岚方舱内机器人多机协作提升运营效率

    智能机器人由于“无接触”式服务,不惧怕传染,可24h在线运营等特点,正在成为科技抗疫中不可或缺的重要....
    的头像 科技绿洲 发表于 05-15 17:29 339次 阅读

    如何使用STM32G4 32位MCU系列

      能够使用相同的 MCU 驱动电机并为预测性维护系统运行 AI,同时更具成本效益、鲁棒性和紧凑性。....
    的头像 星星科技指导员 发表于 05-15 17:23 312次 阅读

    深兰神秘新品重磅发布 三款AI清扫机器人齐亮相

    今后,深兰将继续秉承“人工智能,服务民生”发展理念,与全球更多优秀的合作伙伴携手,积极探索优势资源共....
    的头像 科技绿洲 发表于 05-15 14:34 376次 阅读

    爱立信全球公用事业创新中心正式投入使用

    爱立信合作伙伴还可以在这个环境中进行共同创造,而公用事业公司可以复制他们的端到端用例。全球公用事业创....
    的头像 科技绿洲 发表于 05-15 11:26 367次 阅读

    地平线AI开发平台高效助力智能驾驶软件差异化开发与应用

    2022年5月13日,地平线获得一汽红旗全新车型项目应用。一汽红旗将采用多颗征程5芯片打造智能驾驶域....
    的头像 科技绿洲 发表于 05-15 11:23 613次 阅读

    华为联合全产业开发者共同打造行业昇腾AI解决方案

    本届大赛,由全国各昇腾生态创新中心与华为联合AITISA联盟、启智社区共同举办,并提供超1000万的....
    的头像 科技绿洲 发表于 05-15 10:51 391次 阅读

    英特尔On产业创新峰会精彩抢先看

    阿贡国家实验室、Blue White Robotics、博世、戴尔、Federated Wirele....
    的头像 英特尔中国 发表于 05-14 12:54 456次 阅读

    量子技术成国防工业新风口,中国已走在世界前列

    据美国媒体《防务新闻》周刊网站报道,日前法国军方宣布启动一个国家级混合量子计算平台,马克龙政府决定在....
    发表于 05-13 17:31 35次 阅读

    星环科技Sophon AutoCV助力视觉AI工业化生产

    针对传统CV应用业务痛点,星环科技推出一站式模型生产应用平台——Sophon AutoCV。Soph....
    的头像 科技绿洲 发表于 05-13 17:24 303次 阅读

    使用NVIDIA RTX分支优化光线追踪图形

      RTXGI 提供了可扩展的解决方案来计算无限多跳照明和软阴影遮挡,而无需烘焙时间、光泄漏或昂贵的....
    的头像 星星科技指导员 发表于 05-13 17:17 271次 阅读

    四维图新依托大数据及地理信息领域相关技术 全面助力疫情指挥工作开展

    “疫情时空分析平台”是世纪高通基于自身MineData位置大数据平台和疫情业务开发经验,全力打造的疫....
    的头像 科技绿洲 发表于 05-13 17:04 332次 阅读

    NVIDIA TensorRT支持矩阵中的流控制结构层部分

      NVIDIA TensorRT 支持循环结构,这对于循环网络很有用。 TensorRT 循环支持....
    的头像 星星科技指导员 发表于 05-13 16:57 189次 阅读

    RK3399开发板AI人工智能深度学习之TensorFlow 测试

    硬件平台:迅为-RK3399开发板 系统:ubuntu项目:TensorFlow 测试 配套资料在网盘资料的“iTOP-3399 开发资料汇总(不含...
    发表于 05-13 15:41 1067次 阅读
    RK3399开发板AI人工智能深度学习之TensorFlow 测试

    TensorRT的功能与应用分析

      Polygraphy 是一个工具包,旨在帮助在 TensorRT 和其他框架中运行和调试深度学习....
    的头像 星星科技指导员 发表于 05-13 15:37 91次 阅读

    何为算力

    由基于CPU芯片的服务器所提供的算力,主要用于基础通用计算。日常提到的云计算、边缘计算等都属于基础算....
    的头像 Imagination Tech 发表于 05-13 14:36 128次 阅读

    智能家居的万亿市场,智慧门的发展前景可期

    智能家居市场持续发展,传统门升级需求+全屋智能需求融入,智慧门的生长空间巨大。用一个形象的比喻,如果....
    的头像 科技数码 发表于 05-13 13:41 658次 阅读
    智能家居的万亿市场,智慧门的发展前景可期

    人工智能数据资源服务商海天瑞声发布2021年报

    人工智能数据资源服务商北京海天瑞声科技股份有限公司发布2021年报,具体内容如下。 近三年主要会计数....
    的头像 汽车玩家 发表于 05-13 11:26 192次 阅读

    基于NVIDIA DGX A100 80GB的生物计算引擎

    百图生科(BioMap)是一家生物计算驱动的生命科学平台公司,致力于将先进 AI 技术与前沿生物技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 11:17 169次 阅读

    渊亭科技宣布完成亿元人民币B轮融资

    近日,认知决策智能先行者与领导者渊亭科技完成了亿元人民币B轮融资,由达晨财智独家投资。本轮资金将主要....
    的头像 科技绿洲 发表于 05-13 10:48 194次 阅读

    利用NVIDIA Triton推理服务器加速语音识别的速度

    网易互娱 AI Lab 的研发人员,基于 Wenet 语音识别工具进行优化和创新,利用 NVIDIA....
    的头像 NVIDIA英伟达 发表于 05-13 10:40 130次 阅读

    对话式AI的概念、工作原理及应用领域

    对话式 AI 是一种综合运用多种技术的复杂的人工智能形式,能够使人机间实现类似于真人的交互。复杂系统....
    的头像 NVIDIA英伟达 发表于 05-13 10:31 99次 阅读

    深蓝科技响应号召,复工复产的同时积极开拓海外市场

    作为长三角中心城市,上海正在做好防疫的前提下有序恢复生产,近日,上海经信委发布《上海市工业企业复工复....
    的头像 海阔天空的专栏 发表于 05-12 17:40 337次 阅读

    星环科技推企业级AI能力运营平台Sophon MLOps 助推AI模型落地

    为解决AI落地难的问题,星环科技的AI团队从用户需求端出发,倾力研发了一款基于云原生架构的企业级AI....
    的头像 科技绿洲 发表于 05-12 17:17 268次 阅读

    商汤用AI构筑智慧底座 为一座座城市筑起科技防线

    为更好地服务疫情防控,提升方舱运营和综合管理工作效率,优化病患服务体验。商汤用AI构筑智慧底座,7天....
    的头像 科技绿洲 发表于 05-12 17:01 886次 阅读

    IBM重磅发布拓展实用量子计算的最新路线图

    IBM在波士顿举行一年一度的Think大会,汇聚全球客户和IBM生态系统合作伙伴,共同探讨技术如何推....
    的头像 科技绿洲 发表于 05-12 16:43 347次 阅读

    考拉悠然科技与华为签署合作协议共建昇腾AI生态

    2022年5月10日,成都考拉悠然科技有限公司与华为在成都签署合作协议,加入昇腾万里合作伙伴计划,并....
    的头像 科技绿洲 发表于 05-12 15:59 653次 阅读

    将AI嵌入到整个系统设计工作流的步骤及应用

    随着各类数据日益丰富可得,并且有越来越多的工具支持从数据处理到部署的整个工作流,AI 模型的重要性已....
    的头像 MATLAB 发表于 05-12 11:25 128次 阅读

    了解一下Endpoint AI(端点人工智能)的优势

    物联网(IOT)通过将虚拟和现实融为一体,将世界变得更智能、更具响应性。在过去的几年里,物联网在广泛....
    的头像 瑞萨电子 发表于 05-12 10:55 171次 阅读

    基于RA系列32位MCU的VUI解决方案

    随着AI技术的发展,语音因为便利性使得对话式AI逐渐成为解放双手和提高生产力关键的技术方向。语音控制....
    的头像 瑞萨电子 发表于 05-12 10:51 148次 阅读

    召唤AI的无限可能 玩了一场剧本杀 同车队友“不是人”

    谋略过人的剧本杀队友,居然不是人类?可以理解文本、制定策略、与人类进行多轮对话,还能在短时间内完成开....
    的头像 脑极体 发表于 05-11 20:16 704次 阅读
    召唤AI的无限可能 玩了一场剧本杀 同车队友“不是人”

    类脑计算是什么,人工智能下神经科学启发的类脑计算

    随着近几年深度学习、神经科学、数字孪生和量子计算的迅速发展,人工智能成为了无论学术界还是互联网领域的....
    发表于 05-11 17:51 41次 阅读

    如何用人工智能来解决摄影中照片出现人像模糊不清的问题

          每个人毕竟都不是专业摄影师,因为一些取景以及构图或者外在环境的因素,一些人像照片总会产生不很清...
    发表于 05-01 13:18 3420次 阅读
    如何用人工智能来解决摄影中照片出现人像模糊不清的问题

    Sipeed M2DOCK:全志V831 开源 人工智能 神经网络 视觉 AI Python开发板

    作者@Sipeed 原文链接:
    发表于 04-29 15:06 1949次 阅读

    如何设计智能型水杯

    使用单片机、ESP8266、PWM驱动器、以及半导体加热片制作一个水温控制系统。 使用钢制器皿作为容器,最少容量100ml。 通过...
    发表于 04-27 22:11 696次 阅读

    当AI遇上机器人,数字孪生了解一下?(文末领取资料)

    发表于 04-06 14:11 10252次 阅读
    当AI遇上机器人,数字孪生了解一下?(文末领取资料)

    隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器

    隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器 Copy 东京理工大学的研究人员开发了一种名为“ Hiddenite”的新型...
    发表于 03-17 19:15 4071次 阅读
    隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器

    【工信部人才培养工程第一期】资深行业分析师解读AI领域动向与就业机会

    AI教育行业现状是怎样的? 2017年国务院印发《新一代人工智能发展规划》,其中明确指出应在中小学阶段设置人工智能相关课程,...
    发表于 03-15 10:54 3526次 阅读
    【工信部人才培养工程第一期】资深行业分析师解读AI领域动向与就业机会

    BPI-D2产品特性有哪些?

    BPI-D2产品特性有哪些?
    发表于 03-10 07:40 1187次 阅读

    如何在RK3288上安装Opencv?

    如何在RK3288上安装Opencv?
    发表于 03-10 06:49 1222次 阅读

    RV1109优势和特点是什么?有哪些应用?

    RV1109优势和特点是什么?有哪些应用?
    发表于 03-10 06:45 1089次 阅读