0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算语言学的发展趋势、不足与挑战

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-08-18 11:03 次阅读

01

引言

NAACL 会议是 ACL 的北美分会,每年举办一次,也是 NLP 领域备受关注的顶会之一。NAACL 主要涉及对话、信息抽取、信息检索、语言生成、机器翻译、多模态、统计机器学习等多个方面。

本篇文章的作者Antoine SIMOULIN协助了NAACL 2022,他结合今年一些论文的情况,就大规模预训练语言模型的应用、表现、期望等做了概述,总结并思考了当今计算语言学的发展趋势、不足与挑战。

02

2.1大规模预训练语言模型数量增多

人们越来越乐观地看待大规模预训练语言模型的潜在应用,这使人们的注意力从它们为什么以及如何工作转移到如何确保它们在现实世界中可以更好地工作。

对话是语言模型的直接应用。Amazon Alexa AI高级首席科学家Dilek Hakkani-Tur表示,由于公共数据集、语言模型和产品的蓬勃发展,对话研究正处于激动人心的阶段。她还概述了剩余的挑战:基于知识的回复生成、开放域对话中产生的事实响应、知识摄取以及收集跨长文档或多源信息。

2.2 开放对话

通过给定恰当格式的输入文本并提供相关上下文,模型可以产生符合条件的输出。这种交互对话范式可以应用在很多任务上,如问答(Sanagavarapu et al. 2022 (opens new window), Qian et al. 2022 (opens new window), You et al. 2022 (opens new window))或摘要总结(Fang et al. 2022 (opens new window), Zhao et al. 2022 (opens new window), Asi et al. 2022 (opens new window))。此外,对话数据可用于学习高效的语言表示 (Zhou et al. 2022 (opens new window))。

2.3 结构融合和常识知识

我们期望大规模预训练语言模型能够准确回答事实问题,让模型拥有如“百科全书”一般的知识。知识图谱提供了可以与神经网络一起使用的硬结构信息。可以在命名实体及其关系之间进行显式通信(Ayoola et al. 2022 (opens new window)),或者将符号和显式知识提炼成模型参数的隐式编码知识 (Moiseev et al. 2022 (opens new window))。

我们还希望大规模预训练语言模型拥有我们所有人拥有的日常知识。例如,我们希望模型不会生成“狗正在从喷气式飞机上经过”这样的句子(Seo et al. 2022 (opens new window)),或牙刷在空间上应与浴室相关而不是与客厅相关(Henlein and Mehler 2022 (opens new window))。

最后,这些事实取决于时间。如果是在模型训练后发生的事件,例如新冠肺炎大流行,那么模型并不会将其考虑在内,否则会导致时间错位 (Luu et al. 2022 (opens new window))。

2.4 推理

我们希望模型可以校对事实并推断它们之间的关系。(Sun et al. 2022 (opens new window))提出了JointLK,这是一个在LM(语言模型)和KG(知识图谱)之间进行多步联合推理的模型,可以解决问答任务。多跳问答任务也涉及推理,因为它需要推断多个间接引用来连接询问(query)中提到的实体。(Kinet al. 2022 (opens new window))提出了一种方法:对这种特定类型的问答使用知识库。

2.5 超越语言本身

模型不仅仅需要精通语言,它们还需要捕捉语言背后的含义和意图,捕捉真实世界的一些直观表述,并对实体和现有的关系进行复杂的推断。要推动大规模预训练的语言模型向前发展,关键是:仅凭文本可以训练高效且有意义的模型吗?

2.6 多模态、多语言、对比学习

我们是否需要在训练过程中引入其他模态,例如音频信息或者图像信息?事实上,婴儿在学习时会受到多种类型信息的刺激。关于多模态学习,(Zhang et al.2022 (opens new window))使用文本和图像混合信息的对比框架来构建句子编码。(Wang et al. 2022 (opens new window))提出将文本和图像结合起来,以更好地确认命名实体识别。

2.7 语言学和符号结构的地位

计算语言学见证了大规模预训练语言模型的广泛使用,但大规模预训练语言模型对语言学和符号的假设很少。在激动人心的小组会议上,Chitta Baral、Dilek Hakkani-Tür、Emily Bender和Chris Manning研究了这一观察可能如何影响未来的研究方向。科研资金通常流向研究神经网络的工作,因此人们对利用语言学进行分析并不感兴趣。但神经网络是我们应该追逐的唯一趋势吗?

Chris Manning根据经验观察到,孩子们可以在没有任何语言学专业知识的情况下学习语言。我们或许可以从语言理论和概念中汲取灵感,如复合性、系统概括、符号的稳定意义和校对相关。但是,我们应该关注意义的直接表征,而不是语言本身,因为语言是一种间接表征。

Emily Bender认为如果没有语言学,包括结构语言学、形态学、语法学、语义学、语言语用学、儿童语言习得、语言类型学和社会语言学,那么NLP就不应该作为一个领域而存在。

2.8 文本内涵的定义

在SemEval研讨会上,Jacob Andreas讨论了语言模型在文本内涵表示方面的潜力,以及是否可以单独从文本中学习到文本的内涵。会议期间多次提到关于文本的内涵。文本内涵是指世界上的外部参考,人们脑海中的内部思想,还是用语言表达的观念?更广泛地说,我们可以期望一个模型在没有任何形式的社交互动或实际经验的情况下,只凭借文本训练就展示人类的行为吗?

2.9 巨大的能力带来巨大的责任

随着大规模预训练语言模型变得越来越可行和广泛采用,工程师们对他们的观念变得更加负责。

2.10 价值敏感设计

Batya Friedman就道德和技术想象力应该如何塑造技术发表了公开演讲。除了安全、可靠性、效率或成本等工程标准外,还应考虑其他标准,包括专注和身体完整性。为了使技术和社会结构和谐发展,我们应该衡量大规模语言模型带来的的影响,例如规模、时间、结构以及应用人类价值观作为评估系统性能的标准。

2.11 拓宽NLP

众所周知,自然语言处理是一个快速发展的领域,但这个领域的演变非常多样化,研究资源也非常集中。科技公司拥有巨大的行动力,使学者难以跟上步伐。此外,研究资源在地理上分布不均,例如Manuel Montes-y-Gómez展示了墨西哥西班牙语NLP社区研究现状,该研究不如美式英语先进。

2.12 NLP未来的一些挑战:组成性、基础或解释

尽管大规模预训练语言模型非常令人兴奋,并且我们对它们的可靠性和效率实现任务自动化的能力越来越乐观,但一些挑战仍然存在。

一个挑战是跟踪模型为什么产生一个给定的输出。(Tan 2022 (opens new window))区分了几种我们能从模型或人类所期望的概念解释和挑战。

根据许多研究,模型在系统推广和显式组成方面是失败的,因为它们依赖于虚假的相关性。在这方面,(Weißenhorn et al. 2022 (opens new window))使用复合语义解析器来解决COGS数据集上的成分概括。(Qui et al. 2022 (opens new window)) 提出了一种基于上下文无关语法主干的数据增强方法。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98719
  • 计算
    +关注

    关注

    2

    文章

    431

    浏览量

    38477
  • 语言模型
    +关注

    关注

    0

    文章

    434

    浏览量

    10043

原文标题:结合NAACL2022对计算语言学趋势的思考与分析

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DC电源模块的发展趋势和前景展望

    BOSHIDA  DC电源模块的发展趋势和前景展望 随着电子产品的普及和多样化,对电源模块的需求也越来越大。其中,DC电源模块作为一种重要的电源供应方式,在各个领域有着广泛的应用。在过去的几十年
    的头像 发表于 04-18 13:37 70次阅读
    DC电源模块的<b class='flag-5'>发展趋势</b>和前景展望

    中国网络交换芯片市场发展趋势

    中国网络交换芯片市场的发展趋势受多种因素影响,包括技术进步、政策推动、市场需求以及全球产业链的变化等。以下是对该市场发展趋势的一些分析。
    的头像 发表于 03-18 14:02 235次阅读

    制冷剂的发展历程与发展趋势

    低GWP、低ODP的标准下,提高制冷效率,或者说为了解决低GWP所做的变动应当同时提高制冷效率而不是反过来使净GHG(温室气体)排放量增加。 二、制冷剂的发展趋势 2007年9月在加拿大蒙特利尔召开
    发表于 03-02 17:52

    静压主轴的应用、优势及发展趋势?|深圳恒兴隆机电a

    静压主轴是用于机械加工中的一种设备,它通过静压平衡的原理,实现高速旋转并保持较高的精度和稳定性。本文将介绍静压主轴的应用、优势及发展趋势,并整理相关知识。接下来就跟着深圳恒兴隆机电小编一起来看下吧
    发表于 01-22 10:32

    配网故障定位装置:未来发展趋势挑战

    在电力系统中,恒峰智慧科技设计的配网故障定位装置是一个至关重要的设备,它可以帮助我们快速准确地找到故障发生的位置,从而进行有效的维修。随着科技的发展,这种设备也在不断地进步和改进。本文将探讨配网故障定位装置的未来发展趋势挑战
    的头像 发表于 01-18 10:24 109次阅读
    配网故障定位装置:未来<b class='flag-5'>发展趋势</b>与<b class='flag-5'>挑战</b>

    光器件的最新研究和发展趋势

    此次,我们将报道旨在实现光互连的光器件的最新研究和发展趋势
    的头像 发表于 11-29 09:41 490次阅读
    光器件的最新研究和<b class='flag-5'>发展趋势</b>

    C/C++语言学习大全套

    电子发烧友网站提供《C/C++语言学习大全套.rar》资料免费下载
    发表于 11-18 14:33 0次下载
    C/C++<b class='flag-5'>语言学</b>习大全套

    WLAN 的历史和发展趋势

    电子发烧友网站提供《WLAN 的历史和发展趋势.pdf》资料免费下载
    发表于 11-15 11:45 0次下载
    WLAN 的历史和<b class='flag-5'>发展趋势</b>

    电路板开发的发展趋势和流程

    计算机化的发展进程中,电路板开发的流程几乎没有重大的改变,但是开发的产品特性已经有很大的不同,电路板开发工程师必须要面对这些挑战,设计开发更优质的电路板。接下来我个大家介绍一下电路板开发的
    的头像 发表于 10-15 12:07 921次阅读

    物联网发展趋势和前景

    4个发展趋势: 物联网发展趋势 1 数据分析和智能化应用是发展的大趋势 标准化的物联网开发平台将是实现此类目标的重要载体,例如由中易云开发的易云系统是一个基于云
    的头像 发表于 08-16 11:12 3002次阅读

    混合键合的发展趋势挑战

    在本文中,我们将讨论混合键合的趋势、混合键合面临的挑战以及提供最佳解决方案的工具。
    的头像 发表于 07-15 16:28 1093次阅读
    混合键合的<b class='flag-5'>发展趋势</b>和<b class='flag-5'>挑战</b>

    一文解读AI未来发展趋势、影响和挑战

    人工智能(AI)是一项重要的技术领域,已经在许多领域中取得了显著的进展。AI的未来充满了无限的可能性和挑战,这篇文章将探讨AI的未来发展趋势、影响和挑战
    的头像 发表于 06-28 17:21 3140次阅读

    PLC的发展趋势

    PLC(可编程逻辑控制器)是现代工业自动化控制领域中不可或缺的设备,其发展趋势主要包括以下几个方面。
    的头像 发表于 06-20 11:08 5059次阅读

    什么是私有云?未来发展趋势如何?

    已成为政企构建云环境的核心组件。那么,什么是私有云?有哪些优势?市场竞争情况及未来发展趋势又是怎么样的? 什么是私有云? 私有云(Private Cloud)是为一个组织单独使用而构建的一种云计算服务形式。私有云可提供对数据
    的头像 发表于 06-08 11:07 877次阅读

    半导体工艺与制造装备技术发展趋势

    摘 要:针对半导体工艺与制造装备的发展趋势进行了综述和展望。首先从支撑电子信息技术发展的角度,分析半导体工艺与制造装备的总体发展趋势,重点介绍集成电路工艺设备、分立器件工艺设备等细分领域的技术
    发表于 05-23 15:23 1046次阅读
    半导体工艺与制造装备技术<b class='flag-5'>发展趋势</b>