0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用算法开发了一种新的自然语言生成解码方式

深度学习自然语言处理 来源:夕小瑶的卖萌屋 作者:Yimin_饭煲 2022-08-02 14:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

相信大多数学习过人工智能课程的读者,当听到算法的时候,都会有一种既熟悉又陌生的感觉。说算法熟悉,是因为一听到这个算法,就想起那本厚厚的《人工智能——一种现代的方法》,想起这个算法似乎是人工智能课程考试的重点;说算法陌生,是因为大家现在在从事人工智能相关的研究和开发工作时,似乎又很少用到这个算法,大部分时间都花在了研究数据处理和处理实验设置上面。而在NAACL2022上,一群来自AI2的自然语言处理研究者们利用算法开发了一种新的自然语言生成解码方式,还被授予了NAACL2022 Best New Method paper。看起来已经过时的A*算法,居然能在深度学习时代有如此的妙用,看完这篇论文,笔者情不自禁地打开了《人工智能——一种现代的方法》,想看看还有什么经典算法可以深挖一下!

论文标题:
NEUROLOGIC A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

论文链接:
https://arxiv.org/pdf/2112.08726.pdf

问题背景

自然语言生成任务一般指给定一个输入序列,生成一个输出序列。目的是解出使得目标函数最大化的序列,其中, , 而衡量对约束条件的满足。传统的Beam Search不考虑全局的最优,而是最优化当前步骤添加的Token.

为了达到全局最优的效果,需要满足如下的优化目标

主要方法

前向启发算法

直接优化全局最优目标面临着搜索空间过大的问题。而A算法可以被用来解决这个搜索问题。A算法是一个最优优先的搜索算法,可以解决这样形式的搜索问题:

其中是迄今为止的分数,是对于未来分数的启发式估计。因此我们将优化目标修改为如下形式

同时,需要限制前向搜索的长度为,避免模型无限制地向前搜索

在前向生成的过程中有几种不同的方法。方法只生成一个序列,从开始,每次选择概率最大的Token。方法采用插值的思想,混合方法和随机选择一个Token的概率分布。方法从开始进行步的Beam Search,选择前个概率最大的序列, 而方法则是直接从按照概率进行采样。

无限制生成

在无限制生成的场景下,使用的优化函数为

其中控制的是对未来估计的重视程度,类似于加权算法

受限制生成

在受限制生成任务上,作者们基于之前的工作NeuroLogic进行改进。首先我们简要介绍一下NeuroLogic方法。首先,将对生成文本的限制表示为合取范式。其中每一个表示一个限制条件,。NeuroLogic的优化目标可以写为

其中远大于0,用来惩罚不满足的约束。在每一步搜索时,NeuroLogic利用如下的打分函数进行计算

其中是约束条件的前缀,这个优化函数的目标是奖励那些满足约束条件的样本。接下来,作者们加入了前向启发函数

这样的前向启发函数有两个好处,如果是满足多Token约束的一个Token,前向启发函数包含了全部约束的分数,如果不是约束的一部分,如果被选中,这一前向策略能考虑到未来约束的分数。

实验结果

无限制生成

0b4c6ef6-118e-11ed-ba43-dac502259ad0.png

作者们在故事生成任务上开展了实验,可以发现提出的方法不论是在流畅性,丰富性还是人工评估上都有着很好的表现。

受限制生成

在受限制生成方面,作者们在常识生成,机器翻译,表格到文本生成,问题生成等任务上开展了实验。在这里展示常识生成方面的结果。这一任务的主要内容是给定一系列概念,利用全部概念生成一个合理的句子.

0b65b0be-118e-11ed-ba43-dac502259ad0.png

可以发现,作者们提出的方法在多个指标上都明显超越了基线模型,取得了很好的效果。

0b779a5e-118e-11ed-ba43-dac502259ad0.png

从文章中给出的例子来看,作者们提出的方法确实有着更好的生成效果。

结语

本文的方法实现并不复杂,所用到的原理和思想也是非常经典的人工智能算法,但却取得了非常不错的性能,一举摘得了NAACL2022的最佳方法论文。看来,好的研究并不是追逐热点,调参魔改结构的增量式创新,而是打好数学基础,深入地思考研究问题,广泛接触各个领域的算法,才能在发现领域的关键待解决问题时取得成果~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4805

    浏览量

    98553
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266949
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124631

原文标题:NAACL最佳方法论文 | 课本上的A*搜索算法可以提升文本生成效果!

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vibe Coding AI全栈开发实战

    ”或“直觉编程”,它并非某种具体的编程语言或框架,而是一种融合了AI辅助开发、直觉化编程和高效迭代的实战思维方式。在这种模式下,开发者不再需
    发表于 04-15 16:02

    使用Catapult HLS流程实现G2 VP9解码器IP的示例

    WebM 项目定义了一种开放文件格式,用于在 Web 上分发压缩媒体内容。Google 是 WebM 项目的主要贡献者,最近着手设计和开发了个用于 WebM 的硬件解码器 IP,也
    的头像 发表于 02-09 10:25 400次阅读
    使用Catapult HLS流程实现G2 VP9<b class='flag-5'>解码</b>器IP的示例

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的个分支,它会教计算机如何理解口头和书面形式的人类语言自然语言处理将计算语言学与机器学习
    的头像 发表于 01-29 14:01 592次阅读
    <b class='flag-5'>自然语言</b>处理NLP的概念和工作原理

    8常用的CRC算法分享

    CRC 计算单元可按所选择的算法和参数配置来生成数据流的 CRC 码。有些应用中,可利用 CRC 技术来验证数据的传输和存储的完整性。 8 常用的 CRC
    发表于 11-13 07:25

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合
    的头像 发表于 11-10 17:30 903次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    不只有AI协作编程(Vibe Coding):生成式系统级芯片(GenSoC)将如何把生成式设计推向硬件层面

    但是否能将这种生成式的、目标驱动的方法从软件层向下延伸呢?这理念是否可以直接应用于硬件本身呢?通过GenSoC,开发者可用自然语言或高级模型描述系统行为,XMOS的工具链将自动
    的头像 发表于 11-07 14:04 660次阅读

    复杂的软件算法硬件IP核的实现

    源代码编译为 HDL 的过程共分为两步: (1)C to HASM (2)HASM to HDL 第步 C to HASM 是将 C 语言描述的算法编译为
    发表于 10-30 07:02

    HarmonyOSAI编程自然语言代码生成

    安装CodeGenie后,在下方对话框内,输入代码需求描述,将根据描述智能生成代码,生成内容可键复制或键插入至编辑区当前光标位置。 提问示例 使用ArkTs
    发表于 09-05 16:58

    HarmonyOSAI编程页面生成

    支持通过自然语言对话,生成应用/元服务可用的页面代码,生成结果支持实时预览,帮助开发者快速完成页面搭建。 点击页面右侧菜单栏CodeGenie图标,完成登录后在输入框输入\"/\&qu
    发表于 08-29 15:50

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    ifconfig、gpio write 1 1)。 工作流程 : MCP客户端发送自然语言指令到 HZ-T536 的 MCP 服务器; MCP 服务器利用DeepSeek的大语言模型能力,生成
    发表于 08-23 13:10

    HarmonyOSAI编程编辑区代码生成

    CodeGenie提供Inline Edit能力,支持在编辑窗口中通过自然语言进行问答,基于上下文智能生成代码片段,提升代码可读性。 当前有以下两方式唤醒Inline Edit对话框
    发表于 08-20 15:24

    HarmonyOS AI辅助编程工具(CodeGenie)页面生成

    支持通过自然语言对话,生成应用/元服务可用的页面代码,生成结果支持实时预览,帮助开发者快速完成页面搭建。该功能从DevEco Studio 6.0.0 Beta1版本开始支持。 点击页
    发表于 08-13 10:38

    高德与阿里云起,开启智慧出行新范式

    ,加速智能化场景落地。 技术融合:大模型赋能地图交互升级 基于阿里云通义千问系列大模型领先的自然语言处理与多模态交互能力,MCP Server实现从文本指令到可视化地图的精准转化。用户可通过自然语言生成个性化出行方案(如智能路径
    的头像 发表于 07-18 10:29 668次阅读

    RDK × 腿臂机器人:这只 “机械汪” 竟会说人话、走花路!

    ,基于RDKX3平台进行AI大模型算法开发,提出了一种融合AI大模型的创新性解决方案,提升腿臂机器人的综合性能。-项目首先强化了机器人的多模态感知能力,利用雷达、摄像
    的头像 发表于 07-01 20:27 1430次阅读
    RDK × 腿臂机器人:这只 “机械汪” 竟会说人话、走花路!

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任
    的头像 发表于 04-30 18:34 1449次阅读
    小白学大模型:从零实现 LLM<b class='flag-5'>语言</b>模型