0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算语言学的发展趋势、不足与挑战

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-08-18 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01

引言

NAACL 会议是 ACL 的北美分会,每年举办一次,也是 NLP 领域备受关注的顶会之一。NAACL 主要涉及对话、信息抽取、信息检索、语言生成、机器翻译、多模态、统计机器学习等多个方面。

本篇文章的作者Antoine SIMOULIN协助了NAACL 2022,他结合今年一些论文的情况,就大规模预训练语言模型的应用、表现、期望等做了概述,总结并思考了当今计算语言学的发展趋势、不足与挑战。

02

2.1大规模预训练语言模型数量增多

人们越来越乐观地看待大规模预训练语言模型的潜在应用,这使人们的注意力从它们为什么以及如何工作转移到如何确保它们在现实世界中可以更好地工作。

对话是语言模型的直接应用。Amazon Alexa AI高级首席科学家Dilek Hakkani-Tur表示,由于公共数据集、语言模型和产品的蓬勃发展,对话研究正处于激动人心的阶段。她还概述了剩余的挑战:基于知识的回复生成、开放域对话中产生的事实响应、知识摄取以及收集跨长文档或多源信息。

2.2 开放对话

通过给定恰当格式的输入文本并提供相关上下文,模型可以产生符合条件的输出。这种交互对话范式可以应用在很多任务上,如问答(Sanagavarapu et al. 2022 (opens new window), Qian et al. 2022 (opens new window), You et al. 2022 (opens new window))或摘要总结(Fang et al. 2022 (opens new window), Zhao et al. 2022 (opens new window), Asi et al. 2022 (opens new window))。此外,对话数据可用于学习高效的语言表示 (Zhou et al. 2022 (opens new window))。

2.3 结构融合和常识知识

我们期望大规模预训练语言模型能够准确回答事实问题,让模型拥有如“百科全书”一般的知识。知识图谱提供了可以与神经网络一起使用的硬结构信息。可以在命名实体及其关系之间进行显式通信(Ayoola et al. 2022 (opens new window)),或者将符号和显式知识提炼成模型参数的隐式编码知识 (Moiseev et al. 2022 (opens new window))。

我们还希望大规模预训练语言模型拥有我们所有人拥有的日常知识。例如,我们希望模型不会生成“狗正在从喷气式飞机上经过”这样的句子(Seo et al. 2022 (opens new window)),或牙刷在空间上应与浴室相关而不是与客厅相关(Henlein and Mehler 2022 (opens new window))。

最后,这些事实取决于时间。如果是在模型训练后发生的事件,例如新冠肺炎大流行,那么模型并不会将其考虑在内,否则会导致时间错位 (Luu et al. 2022 (opens new window))。

2.4 推理

我们希望模型可以校对事实并推断它们之间的关系。(Sun et al. 2022 (opens new window))提出了JointLK,这是一个在LM(语言模型)和KG(知识图谱)之间进行多步联合推理的模型,可以解决问答任务。多跳问答任务也涉及推理,因为它需要推断多个间接引用来连接询问(query)中提到的实体。(Kinet al. 2022 (opens new window))提出了一种方法:对这种特定类型的问答使用知识库。

2.5 超越语言本身

模型不仅仅需要精通语言,它们还需要捕捉语言背后的含义和意图,捕捉真实世界的一些直观表述,并对实体和现有的关系进行复杂的推断。要推动大规模预训练的语言模型向前发展,关键是:仅凭文本可以训练高效且有意义的模型吗?

2.6 多模态、多语言、对比学习

我们是否需要在训练过程中引入其他模态,例如音频信息或者图像信息?事实上,婴儿在学习时会受到多种类型信息的刺激。关于多模态学习,(Zhang et al.2022 (opens new window))使用文本和图像混合信息的对比框架来构建句子编码。(Wang et al. 2022 (opens new window))提出将文本和图像结合起来,以更好地确认命名实体识别。

2.7 语言学和符号结构的地位

计算语言学见证了大规模预训练语言模型的广泛使用,但大规模预训练语言模型对语言学和符号的假设很少。在激动人心的小组会议上,Chitta Baral、Dilek Hakkani-Tür、Emily Bender和Chris Manning研究了这一观察可能如何影响未来的研究方向。科研资金通常流向研究神经网络的工作,因此人们对利用语言学进行分析并不感兴趣。但神经网络是我们应该追逐的唯一趋势吗?

Chris Manning根据经验观察到,孩子们可以在没有任何语言学专业知识的情况下学习语言。我们或许可以从语言理论和概念中汲取灵感,如复合性、系统概括、符号的稳定意义和校对相关。但是,我们应该关注意义的直接表征,而不是语言本身,因为语言是一种间接表征。

Emily Bender认为如果没有语言学,包括结构语言学、形态学、语法学、语义学、语言语用学、儿童语言习得、语言类型学和社会语言学,那么NLP就不应该作为一个领域而存在。

2.8 文本内涵的定义

在SemEval研讨会上,Jacob Andreas讨论了语言模型在文本内涵表示方面的潜力,以及是否可以单独从文本中学习到文本的内涵。会议期间多次提到关于文本的内涵。文本内涵是指世界上的外部参考,人们脑海中的内部思想,还是用语言表达的观念?更广泛地说,我们可以期望一个模型在没有任何形式的社交互动或实际经验的情况下,只凭借文本训练就展示人类的行为吗?

2.9 巨大的能力带来巨大的责任

随着大规模预训练语言模型变得越来越可行和广泛采用,工程师们对他们的观念变得更加负责。

2.10 价值敏感设计

Batya Friedman就道德和技术想象力应该如何塑造技术发表了公开演讲。除了安全、可靠性、效率或成本等工程标准外,还应考虑其他标准,包括专注和身体完整性。为了使技术和社会结构和谐发展,我们应该衡量大规模语言模型带来的的影响,例如规模、时间、结构以及应用人类价值观作为评估系统性能的标准。

2.11 拓宽NLP

众所周知,自然语言处理是一个快速发展的领域,但这个领域的演变非常多样化,研究资源也非常集中。科技公司拥有巨大的行动力,使学者难以跟上步伐。此外,研究资源在地理上分布不均,例如Manuel Montes-y-Gómez展示了墨西哥西班牙语NLP社区研究现状,该研究不如美式英语先进。

2.12 NLP未来的一些挑战:组成性、基础或解释

尽管大规模预训练语言模型非常令人兴奋,并且我们对它们的可靠性和效率实现任务自动化的能力越来越乐观,但一些挑战仍然存在。

一个挑战是跟踪模型为什么产生一个给定的输出。(Tan 2022 (opens new window))区分了几种我们能从模型或人类所期望的概念解释和挑战。

根据许多研究,模型在系统推广和显式组成方面是失败的,因为它们依赖于虚假的相关性。在这方面,(Weißenhorn et al. 2022 (opens new window))使用复合语义解析器来解决COGS数据集上的成分概括。(Qui et al. 2022 (opens new window)) 提出了一种基于上下文无关语法主干的数据增强方法。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106809
  • 计算
    +关注

    关注

    2

    文章

    458

    浏览量

    39841
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11256

原文标题:结合NAACL2022对计算语言学趋势的思考与分析

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电磁环境模拟及侦察系统的作用、技术特点及未来发展趋势

    电磁环境模拟及侦察系统的作用、技术特点及未来发展趋势
    的头像 发表于 12-07 11:30 54次阅读
    电磁环境模拟及侦察系统的作用、技术特点及未来<b class='flag-5'>发展趋势</b>

    AI工艺优化与协同应用的未来发展趋势是什么?

    AI 工艺优化与协同应用在制造业、医疗、能源等众多领域已经展现出巨大潜力,未来,它将在技术融合、应用拓展、产业生态等多方面迎来新的发展趋势
    的头像 发表于 08-28 09:49 742次阅读
    AI工艺优化与协同应用的未来<b class='flag-5'>发展趋势</b>是什么?

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向
    的头像 发表于 07-16 15:01 1204次阅读

    工控机的现状、应用与发展趋势

    稳定可靠地运行,并执行实时控制、数据采集、过程监控等关键任务。本文将深入探讨工控机的现状、广阔应用以及未来的发展趋势,以期更好地理解其在工业领域的价值和潜力。工控机
    的头像 发表于 06-17 13:03 528次阅读
    工控机的现状、应用与<b class='flag-5'>发展趋势</b>

    物联网未来发展趋势如何?

    近年来,物联网行业以其惊人的增长速度和无限的潜力成为了全球科技界的焦点。它正在改变我们的生活方式、商业模式和社会运转方式。那么,物联网行业的未来发展趋势将会是怎样的呢?让我们一同探寻其中的奥秘
    发表于 06-09 15:25

    FPGA在数字化时代的主要发展趋势

    的创新,也对开发者提出了新的要求。这篇文章将带您深入探讨FPGA发展趋势,并剖析这些变化对开发者的影响与挑战,为在新时代的技术浪潮中把握机遇提供参考。
    的头像 发表于 04-02 09:49 1366次阅读
    FPGA在数字化时代的主要<b class='flag-5'>发展趋势</b>

    混合信号设计的概念、挑战发展趋势

    本文介绍了集成电路设计领域中混合信号设计的概念、挑战发展趋势
    的头像 发表于 04-01 10:30 1212次阅读

    工业电机行业现状及未来发展趋势分析

    过大数据分析的部分观点,可能对您的企业规划有一定的参考价值。点击附件查看全文*附件:工业电机行业现状及未来发展趋势分析.doc 本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 03-31 14:35

    数据采集在AI行业的应用、优势及未来发展趋势

    人工智能(AI)作为21世纪最具革命性的技术之一,正在深刻改变各行各业。AI的核心驱动力是数据,而数据采集则是AI发展的基石。无论是机器学习、深度学习,还是自然语言处理、计算机视觉等领域,高质量的数据采集都是模型训练和优化的关键
    的头像 发表于 03-07 14:12 1138次阅读
    数据采集在AI行业的应用、优势及未来<b class='flag-5'>发展趋势</b>

    驱动电机核心零部件的发展趋势和技术挑战

    通过电机高转速实现极致车速是总成的一个重要发展趋势;BYD 于 2024 年 批产应用最高工作转速超过 23000rpm,小米目标在 2025 年推出超过 27000rpm 的电机,按照这个趋势 2028 年电机最高工作转速将突破 30000rpm。
    的头像 发表于 03-01 14:27 1234次阅读
    驱动电机核心零部件的<b class='flag-5'>发展趋势</b>和技术<b class='flag-5'>挑战</b>

    PID发展趋势分析

    摘要:文档中简要回顾了 PID 控制器的发展历程,综述了 PID 控制的基础理论。对 PID 控制今后的发展进行了展望。重点介绍了比例、积分、微分基本控制规律,及其优、缺点。关键词:PID 控制器 PID 控制 控制 回顾 展望
    发表于 02-26 15:27

    浅析半导体激光器的发展趋势

    文章综述了现有高功率半导体激光器(包括单发射腔、巴条、水平阵列和垂直叠阵)的封装技术,并讨论了其发展趋势;分析了半导体激光器封装技术存在的问题和面临的挑战,并给出解决问题与迎接挑战的方法及策略。
    的头像 发表于 02-26 09:53 1700次阅读
    浅析半导体激光器的<b class='flag-5'>发展趋势</b>

    电力电子技术的应用与发展趋势

    本文探讨了电力电子技术在不同领域的应用情况,并对其未来发展趋势进行了分析,旨在为相关行业的发展提供参考。 关键词 :电力电子技术;应用;发展趋势 一、电力电子技术的应用 发电领域 直流励磁的改进
    的头像 发表于 01-17 10:18 2765次阅读

    大功率高压电源及开关电源的发展趋势

    。 总之,开关电源是电力电子发展的必然产物,符合时代的发展。它的出现带来了技术创新。目前,国内外都在发展开关电源,其前景十分广阔。开关电源在一定程度上取代传统电源是必然趋势。 三、开关
    发表于 01-09 13:54

    富士通预测2025年AI领域的发展趋势

    过去一年中,人工智能技术飞速发展,在各行各业都收获了巨大进展。面对即将到来的2025年,富士通技术研发团队的专家对AI领域的发展趋势进行了展望,让我们来看看未来一年,有哪些重要趋势值得关注。
    的头像 发表于 12-27 11:23 1398次阅读