0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在风格迁移中如何进行数据增强

深度学习自然语言处理 来源:深度学习自然语言处理 作者:丁磊 2021-01-13 09:41 次阅读

这是一篇关于风格迁移中如何进行数据增强的论文。在introduction部分,informal-->formal 的风格迁移问题,最大的障碍是训练数据的不足。为了解决此问题,本篇论文提出三种数据增强的方法来获得有用的语句对,分别为

back translation (BT)

我们使用原始语料库训练一个seq2seq模型。其中将formal语句作为模型的输入,让seq2seq模型有能力输出对应的informal句子。则 模型输入的formal语句和输出的informal语句就构成了一个新的语句对。

formality discrimination (F-Dis)

F-Dis方法使用机器翻译模型,将一个informal句子重写为formal句子。首先使用Google翻译API 将这些informal语句翻译成 其他语种(比如法语),然后又翻译回英语。如下图所示:

831f1182-549c-11eb-8b86-12bb97331649.jpg

其中,informal语句可以从网上论坛上收集得到。

表示收集到的第i条句子(informal), 是最后翻译回的句子(formal), 二者构成了一个新的语句对。

本方法同时使用CNN构建了一个“格式判别器”:用来给一个句子的“正规”程度 打分。就是上图中右边括号内的小数。最终选出的新数据集要求如下:

837b0564-549c-11eb-8b86-12bb97331649.png

其中表示句子的“正规”程度, 是阈值

multi-task transfer (M-Task)

我们观察到,formal语句通常语法正确,而informal语句的语法经常出错。

前人研究表明,对FST的输出再使用一个语法错误纠正模型( grammatical error correction model,GEC)可以提高模型效果。受此启发,本论文直接使用GEC的训练数据作为增强的新数据集。如下图

83e7497c-549c-11eb-8b86-12bb97331649.png

模型训练

上面提到的seq2seq模型为Transformer (base)。

本论文首先使用增强的新数据用于 预训练,然后使用原始语料数据做微调,将这称为pre-training & finetuning (PT&FT)方法。下面结果证明了PT&FT的效果优于ST方法。ST是把增强数据和原数据一起训练。

843ca7b4-549c-11eb-8b86-12bb97331649.jpg

下图展现了三种数据增强方法的效果:

84b0048e-549c-11eb-8b86-12bb97331649.jpg

下图展现了我们的方法与前人模型的比较结果:

84cef614-549c-11eb-8b86-12bb97331649.jpg

责任编辑:xj

原文标题:【ACL2020】关于正式风格迁移的数据增强方法

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6512

    浏览量

    87601
  • 机器学习
    +关注

    关注

    66

    文章

    8126

    浏览量

    130570
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13103

原文标题:【ACL2020】关于正式风格迁移的数据增强方法

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    stm32f105自动生成的USB主机, 如何进行数据的接收?

    stm32f105自动生成的USB 主机, 如何进行数据的接收? /** * @briefThe function informs user that data have been sent
    发表于 03-26 07:29

    隧道没信号怎么进行数据采集

    隧道没信号怎么进行数据采集
    的头像 发表于 12-06 13:27 320次阅读

    企业数据台如何进行数据的清洗和处理?#数据台 #光点科技

    数据
    光点科技
    发布于 :2023年11月30日 09:28:53

    基于OpenCV的DNN图像风格迁移

    /deep-photo-styletransfer 项目,需要安装 CUDA、pytorch、cudnn等等,配置能花一天的时间。 不过最近我发现一个非常好的开源应用项目,那就是基于OpenCV的DNN图像风格迁移。你只需要安装OpenCV就可以使用。 它也有局限性,我们
    的头像 发表于 10-30 10:03 248次阅读

    基于PyQT5与ONNXRUNTIME实现风格迁移应用

    2023年一月份跟二月份创建了一个PyQT5人工智能软件开发系列的文章系列,过去的两个月都没怎么更新,心里一直想有时间继续更新下去,今天又更新了一篇,基于PyQT5实现多线程、界面化、风格迁移模型的实时推理。
    的头像 发表于 10-25 10:35 271次阅读
    基于PyQT5与ONNXRUNTIME实现<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>应用

    数据台如何进行数据清洗和数据质量管理?#数据台 #光点科技

    数据
    光点科技
    发布于 :2023年09月19日 14:09:37

    rtthreadstudio何进行汇编的单步前进?

    keil调试时鼠标点击反汇编窗口可以实现汇编语句的单步前进。 rtthreadstudio中点击反汇编窗口进行单步前进依然是按c语句的单句进行
    发表于 08-20 17:29

    数据台如何进行数据分析和挖掘?#数据分析 #光点科技

    数据
    光点科技
    发布于 :2023年07月17日 18:15:15

    何进行数据台的集成和应用?#数据台 #光点科技

    数据
    光点科技
    发布于 :2023年07月05日 17:44:40

    何进行数据台的规划和设计?#数据台 #光点科技

    数据
    光点科技
    发布于 :2023年07月05日 09:35:55

    何进行数据台建设?#数据台 #光点科技

    数据
    光点科技
    发布于 :2023年06月21日 14:08:24

    PyTorch教程-14.12. 神经风格迁移

    14.12. 神经风格迁移¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的头像 发表于 06-05 15:44 429次阅读
    PyTorch教程-14.12. 神经<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>

    PyTorch教程14.12之神经风格迁移

    电子发烧友网站提供《PyTorch教程14.12之神经风格迁移.pdf》资料免费下载
    发表于 06-05 11:21 0次下载
    PyTorch教程14.12之神经<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>

    DMA进行数据传输和CPU进行数据传输的疑问

    原先的总线矩阵+仲裁器结构数据总线进行数据传输的? 接上一个问题,如果是的话,那么当进行DMA数据传输时,必定是需要占用
    发表于 05-25 17:18