0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三种LM任务形式:单向LM,双向LM,序列到序列LM

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-01-03 09:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天分享一个论文UniLM[1],核心点是掌握三种LM任务形式:单向LM,双向LM,序列到序列LM;

1. 生成任务

NLP任务大致可以分为NLU和NLG两种;Bert在NLU任务上效果很好,但是天生不适合处理生成任务。

原因在于Bert的预训练过程是使用的MLM,和生成任务的目标并不一致。

生成任务目标是每次蹦出来一个词,只能看到当前位置之前的词汇。

而Bert采用的是双向的语言模型,除了mask的单词,两个方向的词汇都可以被看到。

所以对Bert的一个改进思路就是让它在具有NLU能力的时候,同时兼备NLG能力。

2. 三种LM任务

UniLM做的就是这样一个事情。

具体的实现方式是设计了一系列的完形填空任务,这些完形填空任务的不同之处在于对上下文的定义。

从左到右的LM:使用mask单词的左侧单词来预测被遮掩的单词

从右到左的LM:和上面第一个相比就是方向的变化,使用mask单词的右侧单词来预测遮掩的单词

双向LM:就是当前mask的左右词汇都可以看到

sequence-to-sequence LM:这个就是UniLM能够具有生成能力的关键。我们的输入是source句子和target句子,mask单词在target上,那么当前mask的上下文就是source句子的所有单词和target句子中mask单词左侧的词汇可以被看到

我们把从左到右LM和从右到左LM我们归为一种任务叫单向LM;

有个点需要注意,三个任务是一起优化的,具体来讲是这样做的:

在训练的时候,1/3的时候使用双向LM,1/3的时候使用序列到序列 LM,1/6的时候使用从左到右的LM,1/6的时间使用从右到做的LM。

我们是使用不同的Mask矩阵来对应不同任务输入数据形式。

文中使用的是这样一张图来展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他细枝末节

Gelu 激励函数

24层TRM,最大长度512,1024Hidden Size,16Heads,340M参数量

初始化使用Bert Large

15%被mask,其中80%真正替换mask,10%随机替换,10%不动。替换的时候,80% 的时候替换单个token,20%的时候替换bigram 或者 trigram

第四个步骤类似中文实体词的mask,也算是一点改进。

有个细节点需要注意的是,作者强调,不同的segment embedding用来区分不同LM任务。

Bert的时候,区分上下句子,我们使用0和1,在这里,我们使用这个segment embedding用来区分任务:

比如说,双向对应0和1;单向left-right对应2;单向right-left对应3;序列对应4和5;

4. 总结

掌握以下几个细节点就可以:

联合训练三种任务:单向LM,双向LM,序列LM

使用不同的attention矩阵控制三种任务形式的参与

segment embedding可以区分不同的任务形式

mask的时候15% 的有被替换的概率,其中80% 被真正替换。在这80%真正替换的里面有80%单个token被替换,20%的二元或者三元tokens被替换

参考资料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

责任编辑:xj

原文标题:如何让BERT具有文本生成能力

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13923
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23192

原文标题:如何让BERT具有文本生成能力

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    德州仪器LM63460/LM64460评估模块技术解析与应用指南

    Texas Instruments LM63460EVM-2MHZ/LM64460EVM-2MHZ转换器评估模块 (EVM) 设计用于演示LM63460-Q1或LM64460-Q1高性
    的头像 发表于 09-17 10:37 546次阅读
    德州仪器<b class='flag-5'>LM</b>63460/<b class='flag-5'>LM</b>64460评估模块技术解析与应用指南

    LM3410/LM3410-Q1 LED驱动器数据手册总结

    LM3410 和 LM3410-Q1 恒流 LED 驱动器是一款单片、高频、 PWM DC-DC转换器,采用6引脚WSON、8引脚MSOP-PowerPad™和5引脚SOT-23封装。至少 外部元件
    的头像 发表于 09-04 13:39 766次阅读
    <b class='flag-5'>LM</b>3410/<b class='flag-5'>LM</b>3410-Q1 LED驱动器数据手册总结

    德州仪器LMx39x/LM2901x系列比较器技术解析

    Texas Instruments LMx39/LM2901/LM2901-Q1四通道差分比较器包含四个独立的电压比较器,设计用于在宽电压范围内由单电源供电运行。LM339B/LM
    的头像 发表于 08-29 11:02 642次阅读
    德州仪器LMx39x/<b class='flag-5'>LM</b>2901x系列比较器技术解析

    LM358数据手册

    电子发烧友网站提供《LM358数据手册.pdf》资料免费下载
    发表于 08-25 15:40 0次下载

    LM3881系列 3轨简单功率定序器技术手册

    LM3881 简单电源定序器提供了控制上电和电源的最简单方法 多个电源(开关或线性稳压器)的关闭。通过错开启动 序列,可以避免可能影响 系统的可靠性。
    的头像 发表于 08-19 13:49 729次阅读
    <b class='flag-5'>LM</b>3881系列 3轨简单功率定序器技术手册

    LM185/LM285/LM385-2.5-N系列微功耗电压基准芯片技术文档总结

    ‌ 1. 产品概述 ‌ ‌ 型号系列 ‌:LM185-2.5-N、LM285-2.5-N、LM385-2.5-N,均为2端带隙电压基准芯片。 ‌ 关键特性 ‌: ‌ 高精度 ‌:A级初始容差
    的头像 发表于 08-18 09:07 1031次阅读
    ‌<b class='flag-5'>LM</b>185/<b class='flag-5'>LM</b>285/<b class='flag-5'>LM</b>385-2.5-N系列微功耗电压基准芯片技术文档总结

    LM136A-2.5QML/LM136A-2.5QML-SP 技术文档摘要

    LM136A-2.5QML集成电路是一款精密的2.5V并联稳压二极管。该单片IC基准电压源作为低温度系数的2.5V齐纳管工作,动态阻抗为0.2Ω。LM136A-2.5QML 上的第个端子可以轻松
    的头像 发表于 08-15 09:55 781次阅读
    ‌<b class='flag-5'>LM</b>136A-2.5QML/<b class='flag-5'>LM</b>136A-2.5QML-SP 技术文档摘要

    Texas Instruments LM5171双通道双向控制器数据手册

    Texas Instruments LM5171双通道双向控制器支持多相并行运行,每个相位均具有平衡的电流共享。 该控制器还支持独立通道双向操作,因此可在多相降压/升压或独立降压/升压模式下运行。
    的头像 发表于 07-28 15:20 549次阅读
    Texas Instruments <b class='flag-5'>LM</b>5171双通道<b class='flag-5'>双向</b>控制器数据手册

    Texas Instruments LM4041/LM4041xQ精密电压基准数据手册

    Texas Instruments LM4041/LM4041xQ精密电压基准功能多样,使用方便,应用广泛。该器件无需外部电容器即可工作,搭配所有容性负载均可稳定工作。
    的头像 发表于 07-11 15:01 533次阅读
    Texas Instruments <b class='flag-5'>LM</b>4041/<b class='flag-5'>LM</b>4041xQ精密电压基准数据手册

    LM5068 -10V至 -80V热插拔控制器数据手册

    的背板中的电源瞬变 卡。LM5068 控制外部 N 沟道 MOSFET 以提供可编程负载电流 使用单个外部电流检测电阻器的限流和断路器功能。The LM5068 在成功开机序列结束时发出电源正常 (PWRGD) 信号。输入 过压
    的头像 发表于 05-14 15:49 586次阅读
    <b class='flag-5'>LM</b>5068 -10V至 -80V热插拔控制器数据手册

    LM3017系列 具有真正关断功能的高效低侧控制器数据手册

    SEPIC 设计。这 5V 至 18V 的输入电压范围可容纳两节或节锂离子电池或 12V 轨。使能引脚接受单个输入来驱动三种不同的作模式:升压、 pass-through 或 shutdown 模式。LM3017 在关断模式
    的头像 发表于 03-26 10:32 730次阅读
    <b class='flag-5'>LM</b>3017系列 具有真正关断功能的高效低侧控制器数据手册

    LM5171 80V 双通道双向降压-升压控制器数据手册

    LM5171 控制器提供双通道双向转换器的高电压和精密元件。示例包括双电池系统。LM5171 支持多相并联运行,每相均流平衡。LM5171 还支持独立通道
    的头像 发表于 03-19 15:38 872次阅读
    <b class='flag-5'>LM</b>5171 80V 双通道<b class='flag-5'>双向</b>降压-升压控制器数据手册

    运算放大器LM358的常见电路

    本文主要学习LM358的几种外围电路设计,希望能帮助大家更进一步的了解和使用LM358。
    的头像 发表于 03-17 14:48 7485次阅读

    LM2621工作电流大如何解决?

    LM2621的输入为两节干电池3.0V,输出3.3V,负载电流10.5mA,测试LM2621工作电流12mA左右,LM2621的电路采用的使用手册中的推荐电路,如下图。工作电流大应该怎么解决?
    发表于 02-27 08:27

    LM73605/LM73606 EVM用户指南

    电子发烧友网站提供《LM73605/LM73606 EVM用户指南.pdf》资料免费下载
    发表于 01-03 15:33 0次下载
    <b class='flag-5'>LM</b>73605/<b class='flag-5'>LM</b>73606 EVM用户指南