0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度AI手语数字人助力听障人士“听见”声音

百度 来源:百度 2025-02-21 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

明静不想去医院了。

她不想每次走进医院时,都被护士或是分诊台导医劝说,回家带上父母再来。

“我只是嗓子不舒服,爸妈都65岁了,我不想这点事都让他们陪。”

明静是一名听障人士。去医院看病、接外卖电话、打一辆网约车或是办一张银行卡,每一件日常小事,对她这样的听障人士而言,都是困难重重。

“执教的这几年,我做得最常见的工作,是陪学生去医院看病。”明静的老师——天津理工大学聋人工学院副院长袁甜甜感慨。

这所专门面向听障人士的高等工科特殊教育学院,人称“聋人小清华”,这里,容纳着500多名像明静这样的学生。

2018年,聋人工学院的老师和学生们共同启动了智能手语翻译项目,并孵化出成果公司“鲸言科技”。

近几年,百度先后与天津理工大学、鲸言科技合作,共同研发出百度智能云曦灵AI手语平台与双向手语翻译机,让手语的“声音”,被更多人听见。

//缺失的“基础设施”

理解AI手语,先要了解听障人群面临的问题。第二次全国残疾人抽样调查数据显示,我国大约有2004万的听力残疾人,是世界上听力残疾人数最多的国家。

然而,无论线下线上,都鲜有能真正帮助听障人群的服务设施。据调查,我国全职从事手语翻译职业的人员不足千人,约97%的聋人因为手语翻译的缺失面临就诊困难的问题。

手语是大多数听力残疾人的第一语言。但是,作为视觉语言,手语与健全人使用的有声语言有着天然的不同,这种不同造就了听障人群特有的思维逻辑,也构成了他们对有声语言的理解困难。

袁甜甜从语言学的角度举例,如果听障人士说“灭火”,最先打出的手语是“火”,因为在视觉语言里最先出现的是所要阐述的重点人事物,听障人士习惯于先表达人事物,再表达处理方式或多者之间的关系。

在她的课堂上也是如此,即使有实时翻译语音的字幕,袁甜甜还是会用手语配合口语,方便同学们理解。

//会打手语的数字人

张帆在《无声的绽放》中写道,对于听障问题,重要的是消除社会歧视,而非消除“不正常”;重要的是公正,而非药物与慈善。

为帮助听障人群解决“从手语到口语”的交流问题,2022年,百度推出了AI手语平台,研发了针对线上场景的AI手语数字人和针对线下场景的双向手语翻译机,实现了“手语-汉语”的智能互译。

在手语动作的专业性方面,百度智能云曦灵数字人产品团队联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等,制定了面向人工智能应用的自然手语标注规范,建设了大规模自然手语翻译语料库,使模型能够生成符合听障人群习惯的自然手语。

通过百度数字人4D扫描技术训练的AI手语数字人,不仅能呈现出真实生动的面部表情,还能借助动作融合算法,如真人般流畅表达11000多个《国家通用手语词典》所涵盖的手语动作,为听障群体打造更具情感表现力的沟通体验。

目前,百度的AI手语数字人已经能够识别语音、打出手语,在实时直播中用数字人形象进行手语同步翻译,在央视NBA直播、冬奥会开幕式上,都出现过百度的AI手语数字人主播。

//从输出到理解,让AI“听懂手语”

随着AI技术爆发与数字人的广泛应用,大模型的对话也变得更加生动。

AI手语数字人在“打出手语”的基础上,也开始尝试“理解”听障人士的手语表达。与只能单向输出信息的模式相比,理解了手语的数字人能够更好地完成双向沟通的闭环。

从2024年开始,百度正式投入双向手语翻译机的研发及生产,这是多模态AI模型的典型应用,也是百度各项AI技术的集成。

当听障人士打出手语之后,翻译机需要先通过视觉识别及自然语言处理技术,将手语翻译为汉语;健全人理解后,将要回复的内容通过语音识别驱动数字人翻译,最终以手语和文字的形式,再呈现给听障人士。其中,无论是视觉识别还是自然语言处理,都是AI模型的核心能力。

不过,只有模型能力远远不够。

实际使用场景中,面临着更多的技术考验,比如:

◎听障人士快速打出的手语时,会导致手部轮廓细节模糊,增加模型理解成本;

◎混杂的画面背景会分散模型对手部区域的注意力,造成识别错误;

◎数据采集时出现的手语孤立词会增加模型识别错误概率;

◎手语-汉语在语义等层面是多对多的关系,和具体使用场景有很强的相关性,任何不考虑语言学规律的“蛮力”翻译都可能会造成天差地别的错误,影响聋健沟通的质量。

解决这些技术问题之后,模型还需要更多的训练数据,而数据的标注要求工作者具备手语能力。因此,手语翻译模型训练及测试数据的生产、处理、分析基本都需要由手语使用者来完成。

近几年,百度、天津理工大学、鲸言科技在全社会范围内收集了近千万自然手语(含视频、文本、标注等)作为多模态模型训练数据,终于在2024年完成了“双向手语翻译机”的研发。

//听见手语的声音

明静也接触了手语数据的采集工作。对产品进行交互性测试之后,她非常开心,“终于有人开始做这件事了”。

她是一个很乐观的女孩,微信个性签名是,“我还会选择这滚烫的人生啊”。她希望自己的人生充满可能性,而不是恐惧。她说,愿意拾起破碎的自己,愿意释怀,愿意活在当下,愿意相信未来会更好。

2025年1月,中国残联等9部门联合印发了《关于推进科技助残的指导意见》,其中明确提到了“推动智能手语翻译”的助残措施。

越来越多的听障人士,会在充满声音的世界中找到自己的位置;也会有越来越多的普通人,听到手语翻飞的声音。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41295

    浏览量

    302670
  • 百度
    +关注

    关注

    9

    文章

    2389

    浏览量

    95232
  • 模型
    +关注

    关注

    1

    文章

    3831

    浏览量

    52282
  • 数字人
    +关注

    关注

    0

    文章

    160

    浏览量

    2592

原文标题:想用AI,帮助这2000万人

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度地图分享在AI汽车领域的最新战略思考与量产进展

    在汽车智能化由“单点功能”向“系统智能”跨越的关键节点,地图的角色正在经历深刻重塑。4月12日,在2026年中国电动汽车百人会论坛上,百度地图事业部副总经理刘增刚,系统分享了其在AI汽车领域的最新战略思考与量产进展。
    的头像 发表于 04-14 10:45 275次阅读

    百度地图LD解决方案助力无人配送行业规模化落地

    在今日举办的智能网联汽车发展论坛无人配送生态大会主论坛上,百度地图无人车解决方案产品负责人发表了题为《百度LD无人配送规模化落地元年》的主题演讲——百度地图依托AI大模型实现数据生产新
    的头像 发表于 03-31 13:54 476次阅读

    百度文心大模型5.0正式版上线

    今天,在百度文心Moment大会现场,文心大模型5.0正式版上线。
    的头像 发表于 01-23 16:48 1517次阅读

    百度地图开放平台与400万开发者共赴智能时空新未来

    二十年星辰大海,十五载开放引航。2025年,百度地图迎来服务用户的二十周年,其开放平台亦走过了与开发者并肩同行的十五个春秋。在近期举行的“2025百度地图开发者盛典”上,百度地图开放平台回顾了从提供基础地图API,演进为以
    的头像 发表于 01-23 09:03 956次阅读
    <b class='flag-5'>百度</b>地图开放平台与400万开发者共赴智能时空新未来

    格灵深瞳精彩亮相百度世界2025大会

    11月13日,百度世界2025大会在北京国家会议中心二期举办。活动期间,格灵深瞳与百度进行深入交流,并围绕VLM、AI Infra、应用场景等话题展开全面分享。
    的头像 发表于 11-19 17:09 913次阅读

    2025百度世界大会精彩回顾

    百度创始李彦宏在演讲时表示,“我们更关心如何让AI跟我们要做的每一项任务,都能够进行有机的结合,让AI成为企业发展和个人成长的原生推动力。”
    的头像 发表于 11-17 15:01 860次阅读

    百度世界大会亮点 五年五芯 百度宣布打造最硬AI

    年,持续为行业搭建起交流前沿技术、碰撞创新思维、洞察未来趋势的重要平台。 今日(11月13日)Baidu World 2025在北京举办。在这里,可以体验AI应用的价值涌现,见证AI能力的创新爆发。 今年的百度世界2025以“效
    的头像 发表于 11-13 15:47 1946次阅读

    百度世界2025进行中 百度昆仑芯超节点亮相 性能巨幅提升

    思维、洞察未来趋势的重要平台。 今日(11月13日)Baidu World 2025在北京举办。在这里,可以体验AI应用的价值涌现,见证AI能力的创新爆发。 今年的百度世界2025以“效果涌现|
    的头像 发表于 11-13 11:51 1492次阅读

    百度智能云全面升级舸5.0和千帆4.0

    大会上,百度智能云全面升级AI计算平台5.0、千帆企业级AI开发平台4.0两大AI基础设施,帮助企业以更低成本、更高效率部署和开发
    的头像 发表于 08-30 09:18 2002次阅读

    视频产业的创意活力,被百度蒸汽机这颗“动力心脏”激活了

    百度蒸汽机2.0,开启AI视频低成本量产的“工业革命”
    的头像 发表于 08-25 18:13 3522次阅读
    视频产业的创意活力,被<b class='flag-5'>百度</b>蒸汽机这颗“动力心脏”激活了

    百度智能云发布全球首批AI数字员工

    没错,在今天的百度AI Day开放日现场,这么溜的同事们正式上岗!
    的头像 发表于 08-12 09:47 1899次阅读

    百度智能云亮相第二十二届ChinaJoy

    百度智能云亮相第二十二届ChinaJoy 8月1日,第二十二届中国国际数码互动娱乐展览会(ChinaJoy)在上海开幕。大会期间,百度全景展示了百度智能云千帆大模型平台等行业领先的技术服务在A
    的头像 发表于 08-05 09:47 940次阅读

    欧洲央行行长一行到访百度Apollo Park

    近日,拉加德一行到访位于北京亦庄(经济技术开发区)的百度Apollo Park,与百度Jackson等人交流自动驾驶、AI发展等话题,并在亦庄东环南路、宏达南路等公开道路上,试乘了萝卜快跑第六代无人驾驶汽车。
    的头像 发表于 06-18 15:44 977次阅读

    65%央企大模型落地首选百度智能云

    今天,很荣幸地分享一个好消息,百度智能云已牵手65%的央企,共同推进大模型产业落地。得益于全栈的AI能力,百度联合众多央国企伙伴,针对各类不同业务场景,打造了一大批可推广、可复制的标杆案例。
    的头像 发表于 06-11 15:44 1034次阅读

    百度地图重磅发布地图AI开放平台

    近日,在WGDC25全球时空智能大会上,百度地图重磅发布地图AI开放平台。百度地图深耕20年的数据能力、引擎能力与AI技术全面开放,向开发者深度开放四大核心能力和五大场景解决方案。
    的头像 发表于 05-26 11:26 2037次阅读