0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

传音AI技术部在ASRU 2023 MADASR低资源语音识别比赛斩获多项佳绩

传音控股 来源:传音控股 2023-12-21 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国际顶级语音会议ASRU 2023(IEEE Workshop on Automatic Speech Recognition and Understanding,简称ASRU)于12月16日-20日顺利举办。传音AI技术部在ASRU 2023 MADASR(Model ADaptation for ASR in low-resource Indian languages,简称MADASR)关于孟加拉语和博杰普尔语的低资源语音识别比赛中斩获多项佳绩,在受限和非受限的4个赛道、2个语种与WER、CER 2个评价指标共16个细分子赛道上获得2个第一名、6个第二名和5个第三名。

ASRU研讨会是语音与语言处理学术圈的顶级会议,由IEEE语音和语言处理技术委员会主办,每两年举行一次,历史悠久,影响广泛。此次MADASR比赛是ASRU 2023的重要赛事,由IBM、布尔诺理工大学、微软研究院、爱丁堡大学和印度科学研究所举办,旨在以孟加拉语和博杰普尔语为例,探索低资源语言的语音识别难题。比赛吸引了中科院自动化所、爱沙尼亚塔林理工大学、印度坎普尔理工学院、印度科学研究所-马德拉斯语音实验室、印度科学研究所-孟买数字音频处理实验室、印度浦那高级计算发展中心等多家国内外知名高校和研究机构参赛。

自动语音识别(Automatic Speech Recognition,简称ASR)主要用于将人类语音转换为计算机可读的文本或命令,实现人机交互和自然语言处理。近年来,得益于基于自监督学习的声学模型(如 wav2vec2)和大规模多语言训练(如 Whisper),自动语音识别性能大幅提高,然而低资源语言由于音频和文本数据有限,仍面临巨大的挑战。

在ASRU 2023 MADASR比赛中,传音AI技术部开发的语音识别系统,在算法层面使用了两种方案,一种是基于U2(Unified-2 pass)框架的编码器和解码器结构,使用短时连接分类(Connectionist Temporal Classification)和注意力重打分(Attention Rescore);另一种是基于Whisper的改进和微调的结构。该系统显著提升了低资源语言语音识别的准确性和效率,克服了语音数据的稀缺难题,其解决方案将为其他低资源语言提供参考。

b69609e2-9faf-11ee-8b88-92fbcf53809c.jpg

b6ad96a2-9faf-11ee-8b88-92fbcf53809c.jpg

据Ethnologue网站统计,世界上有7000多种语言,其中90%的语种使用人数少于10万人,不同语种尤其是小语种之间的沟通交流仍面临极大挑战。传音长期深耕新兴市场,面对新兴市场智能语音技术空白,不断加强多语种数据建设,开发小语种语音识别、语义理解、知识图谱、语音合成等算法模型,除了提供多语种语音转写的服务能力,未来还将提供大语言模型生成式交互和跨语种翻译能力,使不同语种之间的交流更顺畅,让更多的小语种使用群体受益。

传音始终以新兴市场的消费者为中心,重视新兴市场用户的需求。未来,传音将继续结合行业技术发展趋势和本地消费者洞察,在AI技术研究和智能终端应用领域发力,通过技术为用户、为社会创造更多价值,让尽可能多的人尽早享受科技和创新带来的美好生活。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1820

    浏览量

    116233
  • ai技术
    +关注

    关注

    1

    文章

    1315

    浏览量

    25802
  • 传音
    +关注

    关注

    0

    文章

    88

    浏览量

    6604

原文标题:传音AI技术部在ASRU 2023 MADASR低资源语音识别比赛斩获多项佳绩

文章出处:【微信号:TranssionHoldings,微信公众号:传音控股】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    485AI语音识别模块:多路语音控制,实现安防设备语音联动

    485AI语音识别模块凭借工业级的RS485总线通信与离线/在线AI语音识别能力,应用场景非常广
    的头像 发表于 04-22 15:17 54次阅读

    相关研究成果入选计算机视觉顶会CVPR 2026

    持续深化AI领域的产学研协同,积极推动与国内外知名高校的深度合作,围绕AI视觉、语音、语言与大模型等方向推进协同创新。日前,
    的头像 发表于 04-03 17:45 2908次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b>相关研究成果入选计算机视觉顶会CVPR 2026

    国际语音与人工智能领域权威专家俞栋博士加入控股

    日前,国际语音与人工智能领域权威专家俞栋博士加入控股,担任首席科学顾问,全面引领
    的头像 发表于 03-23 10:47 495次阅读

    控股联合IDC发布AI全场景降噪技术白皮书

    2026年世界移动通信大会(MWC 2026)期间,联合全球知名市场研究机构IDC发布《面向新兴市场的AI全场景降噪技术
    的头像 发表于 03-13 16:40 290次阅读

    芯导科技荣获控股2025年度鼎立支持奖

    近日,“千里 声声不息”控股2025年度供应商颁奖典礼深圳隆重举行。作为长期战略合作伙伴,芯导科技(股票代码:688230.SH)
    的头像 发表于 01-27 17:52 1241次阅读

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。
    的头像 发表于 01-14 15:22 386次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    控股荣获CES 2026微软AI创新奖

    近日, CES 2026 国际消费类电子产品展览会期间,微软大中华区举办了以“驾驭前沿,共赢全球”为主题的专场活动,聚焦中国企业的创新实践与技术应用成果。作为深耕全球新兴市场的科技企业,
    的头像 发表于 01-12 10:38 489次阅读

    TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军

    近日,国际计算机视觉大会(ICCV 2025)举办了第七届大型视频目标分割挑战赛(LSVOS Challenge),TEX AI团队凭借自主研发的创新技术方案,
    的头像 发表于 10-31 09:42 715次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b>TEX <b class='flag-5'>AI</b>团队<b class='flag-5'>斩获</b>ICCV 2025大型视频目标分割挑战赛双料亚军

    从超薄曲面屏到全场景AI手机推动前沿科技落地新兴市场

    非洲之王到全球技术创新者,正通过高端技术的深度本地化,让前沿科技从炫技的“尝鲜”工具,转变为新兴市场用户日常生活中的“实用”伴侣。从超薄手机到场景
    的头像 发表于 09-18 11:46 1714次阅读
    从超薄曲面屏到全场景<b class='flag-5'>AI</b>,<b class='flag-5'>传</b><b class='flag-5'>音</b>手机推动前沿科技落地新兴市场

    携手Google Cloud打造下一代AI智能生态

    近日,备受瞩目的谷歌开发者大会上,TEX AI总经理史团委受邀发表主题演讲,深入分享了
    的头像 发表于 09-02 10:47 1322次阅读

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,
    发表于 08-09 10:54

    斩获WMT 2025国际机器翻译大赛四项冠军

    近日,由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,资源印度
    的头像 发表于 08-06 18:21 1331次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK
    发表于 07-04 11:14

    影像黑科技:让不同肤色的你看见真实的自己!

    Canalys(现并入Omdia)的最新数据显示,2025年第一季度,全球可穿戴腕带设备市场同比增长13%,出货量达4660万台。其中,非洲TWS、可穿戴腕带设备的市场份额持续第一。而这只是
    的头像 发表于 06-27 09:26 1209次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b>影像黑科技:让不同肤色的你看见真实的自己!

    “破壁者”:以中国AI技术赋能非洲数字化转型

    当前,人工智能技术非洲国家加快运用,而中国科技出海企业控股在这其中扮演着关键角色。作为占据非洲智能手机市场超过40%份额的“非洲之王”,
    的头像 发表于 04-29 16:30 1333次阅读
    “破壁者”<b class='flag-5'>传</b><b class='flag-5'>音</b>:以中国<b class='flag-5'>AI</b><b class='flag-5'>技术</b>赋能非洲数字化转型