0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于机器翻译增加的跨语言机器阅读理解算法

OSC开源社区 来源:OSCHINA 社区 2023-12-12 10:28 次阅读

作者:阿里云云栖号

链接:https://my.oschina.net/yunqi/blog/10319964

近日,阿里云人工智能平台 PAI 与华南理工大学朱金辉教授团队、达摩院自然语言处理团队合作在自然语言处理顶级会议 EMNLP2023 上发表基于机器翻译增加的跨语言机器阅读理解算法 X-STA。通过利用一个注意力机制的教师来将源语言的答案转移到目标语言的答案输出空间,从而进行深度级别的辅助以增强跨语言传输能力。同时,提出了一种改进的交叉注意力块,称为梯度解缠知识共享技术。此外,通过多个层次学习语义对齐,并利用教师指导来校准模型输出,增强跨语言传输性能。实验结果显示,我们的方法在三个多语言 MRC 数据集上表现出色,优于现有的最先进方法。

背景

大规模预训练语言模型的广泛应用,促进了 NLP 各个下游任务准确度大幅提升,然而,传统的自然语言理解任务通常需要大量的标注数据来微调预训练语言模型。但低资源语言缺乏标注数据集,难以获取。大部分现有的 MRC 数据集都是英文的,这对于其他语言来说是一个困难。其次,不同语言之间存在语言和文化的差异,表现为不同的句子结构、词序和形态特征。例如,日语、中文、印地语和阿拉伯语等语言具有不同的文字系统和更复杂的语法系统,这使得 MRC 模型难以理解这些语言的文本。

为了解决这些挑战,现有文献中通常采用基于机器翻译的数据增强方法,将源语言的数据集翻译成目标语言进行模型训练。然而,在 MRC 任务中,由于翻译导致的答案跨度偏移,无法直接使用源语言的输出分布来教导目标语言。

e745a39a-9816-11ee-8b88-92fbcf53809c.jpg

因此,本文提出了一种名为 X-STA 的跨语言 MRC 方法,遵循三个原则:共享、教导和对齐。共享方面,提出了梯度分解的知识共享技术,通过使用平行语言对作为模型输入,从源语言中提取知识,增强对目标语言的理解,同时避免源语言表示的退化。教导方面,本方法利用注意机制,在目标语言的上下文中寻找与源语言输出答案语义相似的答案跨度,用于校准输出答案。对齐方面,多层次的对齐被利用来进一步增强 MRC 模型的跨语言传递能力。通过知识共享、教导和多层次对齐,本方法可以增强模型对不同语言的语言理解能力。

算法概述

X-STA 模型框架图如下所示:

e749d762-9816-11ee-8b88-92fbcf53809c.jpg

e75a1514-9816-11ee-8b88-92fbcf53809c.jpg

具体流程如下:

先将源语言的目标数据翻译到各个目标语言,目标语言的测试数据也翻译回源语言。

每项数据包含问题 Q 和上下文段落 C。

构建并行语言对 ={源语言训练数据,目标语言训练数据} 送入模型并使用反向传播进行模型训练。

将并行语言对 ={源语言测试数据,目标语言测试数据} 送入模型获取答案的预测。

算法精度评测

为了验证 X-STA 算法的有效性,我们在三个跨语言 MRC 数据集上进行了测试,效果证明 X-STA 对精度提升明显:

e76a67de-9816-11ee-8b88-92fbcf53809c.jpg

我们也对算法的模块进行了详细有效性分析,我们可以发现各模块均对模型有一定贡献。

e76de5c6-9816-11ee-8b88-92fbcf53809c.jpg

为了更好地服务开源社区,这一算法的源代码即将贡献在自然语言处理算法框架 EasyNLP 中,欢迎 NLP 从业人员和研究者使用。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4455

    浏览量

    90756
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230605
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24352
  • 阿里云
    +关注

    关注

    3

    文章

    883

    浏览量

    42615
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13101

原文标题:基于知识迁移的跨语言机器阅读理解算法

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器翻译三大核心技术原理 | AI知识科普

    、鸡同鸭讲,这一点机器翻译还是可以做到的!01机器翻译和巴别塔的传说《圣经》中记载了这样一个故事:人类曾经联合起来兴建能通往天堂的高塔——巴别塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类
    发表于 07-06 10:30

    机器翻译三大核心技术原理 | AI知识科普 2

    了额外的机制——注意力机制,来帮助我们进行调序。下面我们用一张示意图来看一下,基于RNN的神经机器翻译的流程:首先我们通过分词得到输入源语言词序列,接下来每个词都用一个词向量进行表示,得到相应的词向量序列
    发表于 07-06 10:46

    神经机器翻译的方法有哪些?

    目前,神经机器翻译(NMT)已经成为在学术界和工业界最先进的机器翻译方法。最初的这种基于编码器-解码器架构的机器翻译系统都针对单个语言对进行翻译
    发表于 11-23 12:14

    阿里巴巴机器翻译在跨境电商场景下的应用和实践

    摘要:  本文将与大家分享机器翻译相关背景知识,再深入介绍机器翻译在阿里生态中的具体应用实践,介绍基于机器翻译技术搭建的一套完善的电商多语言解决方案,最后将会从技术角度介绍阿里
    发表于 07-31 17:22 225次阅读
    阿里巴巴<b class='flag-5'>机器翻译</b>在跨境电商场景下的应用和实践

    从冷战到深度学习,机器翻译历史不简单!

    深度学习机器翻译 实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译
    发表于 09-17 09:23 311次阅读

    换个角度来聊机器翻译

    同时期国内科技企业在机器翻译上的进展也非常迅速,以语音和语义理解见长的科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名,在2015年又在由美国国家
    的头像 发表于 04-24 13:55 3224次阅读
    换个角度来聊<b class='flag-5'>机器翻译</b>

    科大讯飞机器翻译首次达到专业译员水平 机器阅读超越人类平均水平

    机器翻译首次达到专业译员水平。去年11月,科大讯飞机器翻译系统参加CATTI全国翻译专业资格(水平)科研测试,达到英语二级《口译实务(交替传译类)》和三级《口译实务》合格标准,二级是专业译员水平
    的头像 发表于 05-24 08:41 7961次阅读

    机器翻译走红的背后是什么

    未来需要新的算法和语义层面的综合性突破,促进机器翻译产品的迭代和产业全面升级。
    发表于 07-14 10:02 928次阅读

    MIT和谷歌开发失传语言机器翻译系统

    注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。
    发表于 07-17 10:56 541次阅读

    人工智能翻译mRASP:可翻译32种语言

    利用计算机把一种自然语言转变成另一种自然语言的过程就是机器翻译机器翻译对于信息时代下海量信息的捕获无疑具有重要作用,事实上,人们对于机器翻译
    的头像 发表于 12-01 14:03 2824次阅读
    人工智能<b class='flag-5'>翻译</b>mRASP:可<b class='flag-5'>翻译</b>32种<b class='flag-5'>语言</b>

    未来机器翻译会取代人工翻译

    所谓机器翻译,就是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言
    的头像 发表于 12-29 10:12 4654次阅读

    语言翻译新范式的工作:机器翻译界的BERT

    思想就是打造“机器翻译界的BERT”,通过预训练技术再在具体语种上微调即可达到领先的翻译效果,其在32个语种上预训练出的统一模型在47个翻译测试集上取得了全面显著的提升。 目录 机器翻译
    的头像 发表于 03-31 17:24 2642次阅读
    多<b class='flag-5'>语言</b><b class='flag-5'>翻译</b>新范式的工作:<b class='flag-5'>机器翻译</b>界的BERT

    基于DNN与规则学习的机器翻译算法综述

    基于DNN与规则学习的机器翻译算法综述
    发表于 06-29 15:44 33次下载

    语言模型的多语言机器翻译能力分析

    以ChatGPT为代表的大语言模型(Large Language Models, LLM)在机器翻译(Machine Translation, MT)任务上展现出了惊人的潜力。
    的头像 发表于 05-17 09:56 1014次阅读
    大<b class='flag-5'>语言</b>模型的多<b class='flag-5'>语言</b><b class='flag-5'>机器翻译</b>能力分析

    机器翻译研究进展

    机器翻译使用计算机将一种语言翻译成另一种语言,具有低成本、高效率和高翻译质量等优势,在语音翻译
    的头像 发表于 07-06 11:19 417次阅读
    <b class='flag-5'>机器翻译</b>研究进展