0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

传音AI技术部在ASRU 2023 MADASR低资源语音识别比赛斩获多项佳绩

传音控股 来源:传音控股 2023-12-21 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国际顶级语音会议ASRU 2023(IEEE Workshop on Automatic Speech Recognition and Understanding,简称ASRU)于12月16日-20日顺利举办。传音AI技术部在ASRU 2023 MADASR(Model ADaptation for ASR in low-resource Indian languages,简称MADASR)关于孟加拉语和博杰普尔语的低资源语音识别比赛中斩获多项佳绩,在受限和非受限的4个赛道、2个语种与WER、CER 2个评价指标共16个细分子赛道上获得2个第一名、6个第二名和5个第三名。

ASRU研讨会是语音与语言处理学术圈的顶级会议,由IEEE语音和语言处理技术委员会主办,每两年举行一次,历史悠久,影响广泛。此次MADASR比赛是ASRU 2023的重要赛事,由IBM、布尔诺理工大学、微软研究院、爱丁堡大学和印度科学研究所举办,旨在以孟加拉语和博杰普尔语为例,探索低资源语言的语音识别难题。比赛吸引了中科院自动化所、爱沙尼亚塔林理工大学、印度坎普尔理工学院、印度科学研究所-马德拉斯语音实验室、印度科学研究所-孟买数字音频处理实验室、印度浦那高级计算发展中心等多家国内外知名高校和研究机构参赛。

自动语音识别(Automatic Speech Recognition,简称ASR)主要用于将人类语音转换为计算机可读的文本或命令,实现人机交互和自然语言处理。近年来,得益于基于自监督学习的声学模型(如 wav2vec2)和大规模多语言训练(如 Whisper),自动语音识别性能大幅提高,然而低资源语言由于音频和文本数据有限,仍面临巨大的挑战。

在ASRU 2023 MADASR比赛中,传音AI技术部开发的语音识别系统,在算法层面使用了两种方案,一种是基于U2(Unified-2 pass)框架的编码器和解码器结构,使用短时连接分类(Connectionist Temporal Classification)和注意力重打分(Attention Rescore);另一种是基于Whisper的改进和微调的结构。该系统显著提升了低资源语言语音识别的准确性和效率,克服了语音数据的稀缺难题,其解决方案将为其他低资源语言提供参考。

b69609e2-9faf-11ee-8b88-92fbcf53809c.jpg

b6ad96a2-9faf-11ee-8b88-92fbcf53809c.jpg

据Ethnologue网站统计,世界上有7000多种语言,其中90%的语种使用人数少于10万人,不同语种尤其是小语种之间的沟通交流仍面临极大挑战。传音长期深耕新兴市场,面对新兴市场智能语音技术空白,不断加强多语种数据建设,开发小语种语音识别、语义理解、知识图谱、语音合成等算法模型,除了提供多语种语音转写的服务能力,未来还将提供大语言模型生成式交互和跨语种翻译能力,使不同语种之间的交流更顺畅,让更多的小语种使用群体受益。

传音始终以新兴市场的消费者为中心,重视新兴市场用户的需求。未来,传音将继续结合行业技术发展趋势和本地消费者洞察,在AI技术研究和智能终端应用领域发力,通过技术为用户、为社会创造更多价值,让尽可能多的人尽早享受科技和创新带来的美好生活。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115553
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25598
  • 传音
    +关注

    关注

    0

    文章

    86

    浏览量

    6550

原文标题:传音AI技术部在ASRU 2023 MADASR低资源语音识别比赛斩获多项佳绩

文章出处:【微信号:TranssionHoldings,微信公众号:传音控股】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从超薄曲面屏到全场景AI手机推动前沿科技落地新兴市场

    非洲之王到全球技术创新者,正通过高端技术的深度本地化,让前沿科技从炫技的“尝鲜”工具,转变为新兴市场用户日常生活中的“实用”伴侣。从超薄手机到场景
    的头像 发表于 09-18 11:46 1171次阅读
    从超薄曲面屏到全场景<b class='flag-5'>AI</b>,<b class='flag-5'>传</b><b class='flag-5'>音</b>手机推动前沿科技落地新兴市场

    携手Google Cloud打造下一代AI智能生态

    近日,备受瞩目的谷歌开发者大会上,TEX AI总经理史团委受邀发表主题演讲,深入分享了
    的头像 发表于 09-02 10:47 826次阅读

    斩获WMT 2025国际机器翻译大赛四项冠军

    近日,由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,资源印度
    的头像 发表于 08-06 18:21 1051次阅读

    影像黑科技:让不同肤色的你看见真实的自己!

    Canalys(现并入Omdia)的最新数据显示,2025年第一季度,全球可穿戴腕带设备市场同比增长13%,出货量达4660万台。其中,非洲TWS、可穿戴腕带设备的市场份额持续第一。而这只是
    的头像 发表于 06-27 09:26 823次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b>影像黑科技:让不同肤色的你看见真实的自己!

    “破壁者”:以中国AI技术赋能非洲数字化转型

    当前,人工智能技术非洲国家加快运用,而中国科技出海企业控股在这其中扮演着关键角色。作为占据非洲智能手机市场超过40%份额的“非洲之王”,
    的头像 发表于 04-29 16:30 923次阅读
    “破壁者”<b class='flag-5'>传</b><b class='flag-5'>音</b>:以中国<b class='flag-5'>AI</b><b class='flag-5'>技术</b>赋能非洲数字化转型

    接入 DeepSeek、联合阿里云,AI战略玩出新高度!

    近日,全球移动通信大会(MWC)上,控股旗下手机品牌TECNO以“CreatetheAIFuture”为主题,展示了智能眼镜、三折叠屏手机、太阳能充电、AI变色屏等多项黑科技,引发
    的头像 发表于 03-19 15:20 1006次阅读
    接入 DeepSeek、联合阿里云,<b class='flag-5'>传</b><b class='flag-5'>音</b><b class='flag-5'>AI</b>战略玩出新高度!

    天马供折叠屏!TECNO三折概念机PHANTOM ULTIMATE 2亮相MWC

    顶尖的极简超轻薄设计,搭载了多项三折领域突破性的创新技术,彰显了致力于探索和创新最先进的新技术、革新用户体验的承诺。作为一款面向未来的三
    发表于 03-07 09:39

    语音识别技术通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对
    的头像 发表于 02-21 17:12 1058次阅读

    详解语音识别技术通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对
    的头像 发表于 02-21 17:05 1031次阅读
    详解<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b><b class='flag-5'>在</b>通信领域中的应用

    东风Honda汽车质量再次斩获佳绩

    东风Honda 旗下多款车型凭借出众品质、可靠性能,2024年度中国汽车质量排行榜中斩获佳绩
    的头像 发表于 02-11 14:08 589次阅读

    南芯科技荣获控股“技术创新奖”

    2022年以来,南芯科技已经连续获得控股颁发的多项殊荣,包括“鼎力支持奖”和“精诚合作奖”。此次荣获“技术创新奖”,更是对南芯科技尖端
    的头像 发表于 01-24 15:09 940次阅读

    南芯科技荣膺控股2024年度技术创新奖

    近日,南芯科技(证券代码:688484)荣膺控股颁发的“技术创新奖”,是南芯继 2022 年“鼎力支持奖”和 2023 年“精诚合作奖”之后再次获得来自传
    的头像 发表于 01-24 14:40 981次阅读

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    (Text-To-Speech,文本转语音技术将文本转换为语音进行播报。 当然除了基本的文本输入和播报功能外,我们还增加了语音识别的功能,
    发表于 01-06 15:33

    云知声近期斩获多项年度大奖

    科技迅猛发展的当下,人工智能(AI)已成为推动各行业革新的核心动力。云知声,以其卓越的技术实力和敏锐的市场洞察,AI领域中脱颖而出,成为
    的头像 发表于 12-24 10:26 802次阅读

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智
    的头像 发表于 12-20 10:35 894次阅读