0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式摘要的经典模型

深度学习自然语言处理 来源:AI算法小喵 作者:AI算法小喵 2022-07-08 17:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在前面

在一文详解生成式文本摘要经典论文Pointer-Generator中我们介绍了生成式摘要的经典模型,今天我们来分享一篇带风格的标题生成的经典工作。

dc93a2f0-fe9b-11ec-ba43-dac502259ad0.png

以往的标题模型产生的都是平实性标题,即简单语言描述的事实性标题。但是,实际上我们可能更需要有记忆点的爆款标题来增加点击量/曝光率。因此,衍生出了一个新任务——带有风格的标题生成,即Stylistic Headline Generation,简称SHG。

本篇文章将介绍TitleStylist模型,该模型是针对SHG任务提出的,它可以生成相关、通顺且具有风格的标题,其中风格主要包括三种:幽默、浪漫、标题党。

论文名称:《Hooks in the Headline: Learning to Generate Headlines with Controlled Styles》

论文链接:https://arxiv.org/abs/2004.01980v1

代码地址:https://github.com/jind11/TitleStylist

1. 问题定义

首先假设我们有两类数据和:是由文章-标题对组成的数据;是由具有某种特定风格的句子组成的数据。

我们用来表示数据,其中表示文章,表示标题。此外,我们用来表示数据。需要注意的是,中的句子可以是书本中的句子,不一定是标题。

假设我们有、、。那么,SHG任务目的是从中学习,也就是从分布、中学习出条件分布。

2. 核心思想

TitleStylist模型整体上是一个Transformer结构,分为Encoder(编码器)和Decoder(解码器)。TitleStylist利用多任务学习,同时进行两个任务:

标题生成:有监督任务;在数据S上,根据文章原文生成相应标题。

带有风格的文本重构:无监督或自监督;在数据上,输入为扰乱后的句子,生成原句。

标题生成与带有风格的文本重构两个任务的数据集和模型都是独立的。为了生成带有风格的标题,TitleStylist通过参数共享将二者融合。

3. 模型细节

3.1 序列到序列模型架构(Seq2Seq Model Architecture)

dcaf5414-fe9b-11ec-ba43-dac502259ad0.png

如上图,TitleStylist采用了Transformer架构的seq2seq模型,它包含编码器和解码器。为了提高生成的标题的质量,TitleStylist使用MASS模型来初始化模型参数。

3.2 多任务学习

dce4d4c2-fe9b-11ec-ba43-dac502259ad0.png

为了分离文本的风格和内容,模型引入多任务学习框架。在这里主要包含两个任务:标题生成及DAE(Denoising Autoencoder)。根据论文描述,我们在这里将DAE称为带风格的文本重构。

有监督的标题生成

在标题生成任务中,首先我们输入文章原文,然后经过编码器获得向量表征;接着,再利用解码器生成标题。

换句话说,在标题生成任务中,我们是利用编码器和解码器学习条件分布。我们设是编码器的待优化参数,是解码器的待优化参数,那么标题生成任务的损失函数如下:

其中是单向语言模型,即:

这里代表句子的长度。

无监督/自监督的风格文本重构

在文本重构任务中,对于句子,我们通过随机删除或者遮盖某些词,或者改变文本中词的顺序可以获得破坏版本的句子。将作为模型输入,经过编码器获得中间表征,再经过解码器进行还原获得。这个任务的目的是在还原句子时使模型学到风格化句子的能力。

同样我们设是编码器的待优化参数,是解码器的待优化参数,那么文本重构任务的损失函数如下:

联合学习

最终,多任务学习会最小化将两部分的损失函数之和:

3.3 如何生存带有特定风格的相关标题

到目前为止,大家可能会有所疑问:两个任务除了损失函数是一同优化外再没有看到其他任何关联, 那么TitleStylist怎么可能学到问题部分定义的终极目标,毕竟我们只有来自分布、的数据,并没有来自分布的数据。

实际上,TitleStylist通过设计参数共享策略,让两个任务的编码器及解码器存在某种关联,最终以此来建模。那么如何进行参数共享呢?

最简单的,可以直接共享所有参数(与共享,与共享)。这样模型等于同时学了标题生成与带风格的文本重构两个任务。其中标题生成的任务让模型学到了如何生成与文章内容相关的标题;带风格的文本重构则让模型学到了如何在还原文本时保留文本具有的风格。在两个任务的相互加持下,模型就可以生成和文章相关的又具有特定风格的标题。

好了,我们就想到这里。接下来看看TitleStylist究竟是怎么做的。

3.4 参数共享

刚才我们所说的直接共享所有参数的方式存在一个问题,就是模型并没有真正地显式地区分开文本内容与文本风格,那么模型就是又学了中的事实性风格,又学了中的特定风格(比如幽默、浪漫或标题党)。

TitleStylist为了更好地区分开文本内容与文本风格,显式地学习数据中所包含的风格,选择让编码器共享所有参数,解码器共享部分参数。个人认为编码器端之所以完全共享参数,是想在编码时尽可能保留原文信息。

dcaf5414-fe9b-11ec-ba43-dac502259ad0.png

如上图所示,解码器端的参数主要被分成两部分:黄色部分表示不依赖风格的参数,是共享的;剩余依赖风格的参数,不共享。

具体地,存在于Layer Normalization及Decoder Attention,即层归一化及解码器注意力两部分:

(1) 带风格的层归一化(Style Layer Normalization)

带风格的层归一化这个部分是借鉴图像风格迁移的思想。其中分别是的的均值和标准方差,是模型需要学习的与风格相关的参数。

(2) 带风格的解码器注意力(Style-Guided Encoder Attention)

TitleStylist认为两个任务的解码器端在逐个生成下一个词时的注意力机制应该有所不同。在这里,TitleStylist主要是设置了不同的,以此生成不同的从而形成不同的注意力模式。

这里代表风格,对标题生成而言其实可以算作事实性风格;对文本重构而言,可能是幽默、浪漫或标题党风格。

TitleStylist结合完全共享参数的编码器与部分参数共享的解码器来实现其目标模型,最终可以生成带有特定风格的又与原文内容相关的标题。

总结

好了,带风格的标题生成论文《Hooks in the Headline: Learning to Generate Headlines with Controlled Styles》的内容就到这里了。在本篇文章中,我们就论文思想与论文所提出的模型的结构设计进行了介绍。论文实验部分小喵没有细看,大家感兴趣的话可以下载原文并结合源码进行学习。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1225

    浏览量

    43769
  • 编码器
    +关注

    关注

    45

    文章

    4011

    浏览量

    143352

原文标题:文本生成 | 一篇带风格的标题生成的经典工作

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    东风太极大模型通过国家生成人工智能服务备案

    日前,从国家互联网信息办公室网站获悉,东风汽车自主研发的“东风太极大模型”体系正式通过国家互联网信息办公室生成人工智能服务备案。
    的头像 发表于 03-18 15:59 253次阅读

    大晓机器人开源实时生成世界模型Kairos 3.0-4B

    近日,大晓机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作为业内首个实现 “多模态理解 — 生成 — 预测” 一体化的开源具身原生世界模型,该
    的头像 发表于 03-14 16:54 2002次阅读
    大晓机器人开源实时<b class='flag-5'>生成</b>世界<b class='flag-5'>模型</b>Kairos 3.0-4B

    行业特定的生成 AI 能力如何形成:面向中国企业的场景化解决方案模型

    随着生成 AI 在国内加速落地,越来越多企业意识到:单靠通用大模型,并不能覆盖行业中的复杂流程与专业需求。金融、制造、能源、零售、医疗等行业各自拥有不同的业务逻辑、监管要求与数据结构,而企业真正
    的头像 发表于 12-02 09:33 559次阅读

    openDACS 2025 开源EDA与芯片赛项 赛题七:基于大模型生成原理图设计

    领域,对促进产业高质量发展具有重要意义。本赛项包含7道赛题,下面是赛题七 基于大模型生成原理图设计的介绍。 2. 命题单位及赛题Chair 2.1 命题单位 openDACS工作委员会、复旦大学
    发表于 11-13 11:49

    不只有AI协作编程(Vibe Coding):生成系统级芯片(GenSoC)将如何把生成设计推向硬件层面

    但是否能将这种生成的、目标驱动的方法从软件层向下延伸呢?这一理念是否可以直接应用于硬件本身呢?通过GenSoC,开发者可用自然语言或高级模型描述系统行为,XMOS的工具链将自动生成
    的头像 发表于 11-07 14:04 660次阅读

    探索无限可能:生成推荐的演进、前沿与挑战

    TL;DR 过去一年间,生成推荐取得了长足的实质性进展,特别是在凭借大型语言模型强大的序列建模与推理能力提升整体推荐性能方面。基于LLM(Large Language Models, LLMs
    的头像 发表于 10-20 16:42 6965次阅读
    探索无限可能:<b class='flag-5'>生成</b><b class='flag-5'>式</b>推荐的演进、前沿与挑战

    如何让大模型生成你想要的测试用例?

    应用大模型生成测试用例,常见的知识库,测试大模型,微调,RAG等技术门槛都不低,甚至很难,因此对于应用者而言,最快的方式就是应用好提示词,调教属于个人风格的测试用例智能生成模块,让智能
    的头像 发表于 09-26 10:01 1129次阅读
    如何让大<b class='flag-5'>模型</b><b class='flag-5'>生成</b>你想要的测试用例?

    思必驰一鸣智能客服大模型通过生成人工智能服务备案

    近日,江苏网信发布新一批生成人工智能服务备案信息,其中,由思必驰控股子公司驰必准自主研发的一鸣智能客服大模型通过《生成人工智能服务管理暂
    的头像 发表于 09-16 18:08 1350次阅读

    中车斫轮大模型通过国家生成人工智能服务备案

    9月14日,国家互联网信息办公室发布最新公告,“中车斫轮”大模型通过“生成人工智能服务”备案,标志着其在数据安全治理、模型机制透明度、内容生成
    的头像 发表于 09-16 09:16 936次阅读

    华盛昌DeepSense深度感测大模型通过生成人工智能服务备案

    近日,深圳市华盛昌科技实业股份有限公司(以下简称“华盛昌”)的“DeepSense深度感测大模型”在历经属地网信办初审、中央网信办终审及六大部委意见征询后,通过广东省生成人工智能服务备案(备案号
    的头像 发表于 09-08 14:49 1978次阅读

    智能体化AI和生成AI的区别

    生成 AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic AI)的关键是 “自主决策”:它像一个有经验的助理,能感知环境、
    的头像 发表于 08-25 17:24 1898次阅读

    NVIDIA recsys-examples在生成推荐系统中的高效实践

    生成 AI 浪潮的推动下,推荐系统领域正经历深刻变革。传统的深度学习推荐模型 (DLRMs) 虽已展现出一定效果,但在捕捉用户兴趣偏好和动态行为序列变化时,常面临可扩展性挑战。生成
    的头像 发表于 07-04 14:43 1303次阅读
    NVIDIA recsys-examples在<b class='flag-5'>生成</b><b class='flag-5'>式</b>推荐系统中的高效实践

    谷歌新一代生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1308次阅读

    使用NVIDIA Earth-2生成AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)为这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成 AI 基础模型
    的头像 发表于 06-12 15:54 1454次阅读

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。
    的头像 发表于 05-14 16:53 1458次阅读