0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从发展滞后到不断突破 NLP已成为AI又一燃爆点?

WpOh_rgznai100 来源:yxw 2019-07-11 14:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

自然语言处理:人工智能连接主义复兴浪潮中的下一个突破口

AI 行业应用是一片新的大陆,深度学习作为新大陆的基石,经历了一轮又一轮突破。过去十年,在计算机视觉语音识别、棋类 AI 等计算和感知智能技术上,深度学习率先取得成功。而最近深度学习在认知智能/自然语言处理上的进展,特别是 Transformer 衍生模型加上两阶段预训练语言模型范式的成功,正在将自然语言处理变成人工智能下一个最有可能的突破口。

计算机视觉与语音的成功是破茧成蝶,而非横空出世

2010 年到 2017 年,从 LeNet 到 AlexNet、Inception、VGGNet、ResNet 及其衍生结构,深度神经网络加上集成学习技术在计算机视觉研究中大放异彩,在 ImageNet 大规模深度视觉挑战(ILSVRC)图像分类任务上的错误率从 28.2% 一路降低到了 2% 左右。尽管这仍然是“实验室环境”下的结果,但当 AI 在某一个单点任务上的表现接近或者超越人类的时候,就会给行业带来巨大的商机。在视觉分类、检索、匹配、目标检测等各项任务上,随着相关算法越来越准确,业界也开始在大量商业场景中尝试这些技术。

人脸识别,作为计算机视觉技术取得突破的一个代表性应用,就是在这个大背景下从技术研究期进入成熟商业期,爆发成为一个千亿甚至万亿级别的市场。

但在计算机视觉技术商业化的历程中,其实也有一段不短的蛰伏期。在深度卷积神经网络兴起之前,微软亚洲研究院研究人脸识别的团队曾在内部长期遭受质疑:做了十多年,准确率总是只有 70% 到 80%,看上去挺好玩,但这个准确率能有什么实际的应用价值呢?然而 2010 年深度学习浪潮迅速扫清了质疑,长期研究这个方向的被质疑者们,成了这个新商业领域的领导者,从火种涅槃成为满天繁星。而连接主义学派的忠实信徒、蛰伏近三十年的深度学习三剑客 Geoff Hinton、Yann LeCun 和 Yoshua Bengio,也是因为在统计机器学习盛行的数十年间受尽冷眼的厚积,才有了 2010 年后因 GPU 算力和神经网络模型不断加深而产生的薄发,从而一举获得图灵奖。

为什么自然语言处理领域的发展要相对滞后?

深度学习在计算机视觉、语音识别等感知智能技术上率先取得成功并不是偶然。深度学习秉承连接主义学派的范式,相较传统统计机器学习技术的最大进化在于其利用了高于统计方法数个数量级的参数和极其复杂的函数组合,通过引入各种非线性和多层级感知能力,构成了远强于统计机器学习模型的拟合能力。ResNet-152 的参数量已经达到六千万的级别,GPT-2.0 的参数量达到了惊人的 15 亿。而其他上亿甚至数亿级别的网络更是数不胜数。如此复杂的模型对数据的拟合能力达到了前所未有的水平,但是同时也极大提高了过拟合的风险。这对数据提出了极高的要求。训练数据的数量、维度、采样均衡度、单条数据本身的稠密度(非0、不稀疏的程度),都需要达到极高的水平,才能将过拟合现象降低到可控范围。

视觉信息(图像、视频)恰好是这样一类自然连续信号:一张图片通常就有数百万甚至上千万像素,而且每个像素上通常都有颜色,数据量大、数据的表示稠密、冗余度也高。往往在丢失大量直接视觉信号的情况下,人还能迅速理解图片的语义信息,就是因为自然连续信号,如图像中的场景和物体往往具有视觉、结构和语义上的共性。一个 30MB 的位图图片能被压缩到 2MB 而让人眼基本无法感知区别;一个 30MB 的 wave 音频文件被压缩到 3MB 的 MP3 还能基本保持主要旋律和听感,都是因为这类自然连续信号中存在大量不易被人的感官所感知的冗余。

视觉信息这种的丰富和冗余度,让深度神经网络得以从监督信号中一层层提炼、一层层感知,最终学会部分判断逻辑。深度神经网络在感知智能阶段中在视觉任务和语音任务上的成功,离不开视觉、语音信号自身的这种数据特点。

今天,属于感知智能的视觉和语音应用已经全面开花,但属于认知智能的自然语言处理却发展滞后。这种发展状态与自然语言处理技术中的数据特征也有密不可分的关系。

相对于图片、语音给出的直接信号,文字是一种高阶抽象离散信号。较之图片中的一个像素,文本中一个单元信息密度更大、冗余度更低,往往组成句子的每一个单词、加上单词出现的顺序,才能正确表达出完整的意思。如何利用单个文本元素(字/词)的意思,以及如何利用语句中的顺序信息,是近年来自然语言处理和文本分析技术的主要探索脉络。

2013 年,词的分布式向量表示(Distributed Representation)出现之前,如何在计算机中高效表示单个字/词是难以逾越的第一个坎。在只能用One-hot向量来表示字/词的年代,两个近义词的表示之间的关系却完全独立,语义相似度无法计算;上表示一个字/词所需的上万维向量中只有一个维度为1,其他维度都为0,稀疏度极高。面对这类信号,深度神经网络这类复杂的模型所擅长的化繁为简的抽象、提炼、总结能力便束手无策,因为输入信号已经极简到了连最基础的自我表示都难以做到。

NLP 中的两大重要挑战:特征表示、结构/语义理解正取得关键进展

而分布式词向量将语言的特征表示向前推进了一大步。分布式词向量提出了一个合理的假设:两个词的相似度,可以由他们在多个句子中各自的上下文的相似度去度量,而上下文相似的两个词会在向量空间中由两个接近的向量来表示。这种做法部分赋予了词向量“语义”,因此我们不必再让机器去查百科全书告诉我们“苹果”的近义词是“梨子”,而是直接从大量的互联网语料中去学习,原来“苹果”的近义词也可以是“三星”、“华为”。因为人们常常会说“我购买了一个苹果手机”,也常说“我购买了一个三星手机”,模型会敏锐的学习到“苹果”和“三星”在大量语料中出现时其上下文高度相似,因而认为两个词相似。分布式词向量让无语义、极稀疏的 One-hot 向量寿终正寝,而为大家提供了嵌入语义信息、稠密的特征表示,这才使得深度神经网络在自然语言处理和文本分析上的应用真正变得可能。

捕捉语句中在独立的词集合基础之上、词序列构成的句子结构信息也是自然语言处理和文本分析中的一个主要方向。传统条件随机场(CRF)考虑了前后相邻元素和当前元素之间的依赖;长短时记忆网络模型(LSTM)以一种衰减形式考虑了当前元素之前的元素序列;seq2seq 通过注意力和编解码的机制使得解码时的当前元素不光能用上已经解码完毕的元素序列,还能用上编码前的序列的完整信息;近期各类基于 Transformer 结构,如 ELMo 、BERT、GPT-2.0、XLNet,则利用两阶段(基于自编码的预训练加基于任务的调优)模式,能够以自监督的方式更好地利用大规模的无标注语料训练不同句子结构中词语之间的关系,并且突破传统线性序列结构中存在的难以建立长距离、双向依赖关系的问题,学习到质量更高的中间语言模型,再通过调优就能在文本生成、阅读理解、文本分类、信息检索、序列标注等多个任务上取得当前最为领先的准确率。

以机器阅读理解任务为例,在 SQuAD1.0 数据集上,BERT 和 XLNet 都已大幅超越人类的 91.22(F1分),分别达到了 93.16 和 95.08;在更加复杂的 SQuAD2.0 数据集上,XLNet 也已经达到了 89.13。

又如在 2019 年 3 月举行的第十四届 NTCIR 上,短文本情感对话任务(STC3)提出的要求是:中文回答不仅需要内容合理,语句流畅,而且需要情感合宜。例如,如果用户说“我的猫昨天去世了”,如果机器人想表达悲伤的情感,那么最合适的回答可能是“这太悲伤了,很抱歉听到”,但如果想表达安慰的情感,则应该说 “坏事永远发生,我希望你会快乐”。对情感表达要求的增加,无疑增加了难度。

而在这个比赛中,一览群智和人民大学信息学院联合组成的团队获得了冠军,其使用的方法便是基于 Transformer 改进的网络模型,以情感识别、情感领域对话子模型、集成学习等方法相结合,击败了十几支强劲对手。类似的探索,让 AI 在特定任务下的认知能力,朝着人类水平一步步发展。

认知智能进入快车道

自然语言处理领域的发展虽然比计算机视觉和语音领域滞后几年,但是我们看到自然语言处理已经进入快车道。近两年来语言模型上的飞速进步,让我们感受到之前制约自然语言处理和文本分析发展的主要难点,正在被更好的模型结构、训练和使用方法、更大的算力逐渐克服。为自然语言任务加入“常识”,也是另一个新兴重要探索方向,这个方向则与知识图谱技术紧密结合。

我们正处于认知智能的黄金发展期,新技术的出现与逐步成熟,使得更多行业的应用场景变得可能。一览群智一直在探索认知智能的基础技术发展与前沿行业应用,围绕自然语言处理技术的变与不变,在这个过程中有着自己的思考和总结,并且通过智语这个核心技术产品,给出自己的答案。就像 BERT、GPT-2.0、XLNet 在两阶段范式上的殊途同归,我们也认为基础语言模型在不同任务上可以存在一些不变性,但在不同场景中一定要做特殊语料与任务下的调优与适配。出于对文本信号特性的理解和自然语言处理技术发展阶段的认识,我们构建认知智能核心产品智语平台的思路,也是围绕这种变与不变在展开。

“智语” 自然语言处理平台的智能流程

但认知智能在金融、公安、媒体等场景中的变化部分给 AI 厂商带来的挑战非常明显。一个算法往往在不同场景下要利用不同的标注语料去形成不同的模型,一个媒体场景的 10 类新闻分类模型,无法给另一个媒体的 12 类分类体系使用。

为了解决数据标注难、封闭环境下模型训练难、部署难等问题,一览群智的智语平台提供了标注管理、智能标注加速、自然语言处理、文本模型训练、一键部署等端到端功能,提升了团队在应对不同场景时的效率与效果。例如智能标注加速功能,利用主动学习的先进技术,将训练一个分类或者序列标注模型的标注量有效降低至原有的 30%-50%,同时保证模型性能基本不变;加上平台高效能的标注管理,总体效率提升可达数倍。而傻瓜式的训练和部署,使得初级团队成员通过短期培训也能有效形成 AI 的生产力。

“智语” 自然语言处理平台端到端流程方案

结语

回顾 AI 连接主义学派复兴的十年,就像一个螺旋梯,算法与算力应用相互促进、不断攀升。在见证 ImageNet 图像分类错误率从 30% 一路降低到 2%左右;见证 AlphaGo 击败樊辉、李世石、柯洁之后,我们开始见证基于 BERT/GPT-2.0/XLNet 在阅读理解任务超越人类。十年后再回顾,会发现今天之于自然语言处理,也许恰如 2014 年之于人脸识别。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40921

    浏览量

    302511
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47707
  • 深度学习
    +关注

    关注

    73

    文章

    5603

    浏览量

    124609

原文标题:从发展滞后到不断突破,NLP已成为AI又一燃爆点?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小红书API+AI:舆情监控新利器

    小红书API+AI已成为品牌舆情监控的核心方案,彻底解决传统人工监控效率低、漏检、滞后的痛,精准适配小红书高种草、强情绪、快传播的平台特性,实现舆情
    的头像 发表于 04-01 15:56 666次阅读

    物理连接到智能中枢:AI重塑Type-C接口价值与未来

    随着科技飞速发展,Type‑C 接口凭借正反盲插、高速传输、大功率供电、多功能合等优势,已成为智能手机、笔记本电脑、智能家居、车载设备等终端的标配接口。而 AI 智能技术的兴起,正为
    的头像 发表于 03-14 15:16 2421次阅读

    SMT工艺革新:高精度贴装与微型化组装的未来趋势

    已成为 SMT 工艺发展的核心驱动力。随着 5G、物联网和人工智能技术的普及,电子元件尺寸不断缩小,0201 封装(0.2mm×0.1mm)甚至 01005 封装(0.1mm×0.05mm)的元件
    发表于 03-06 14:55

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    1. 行业核心痛AI“存储墙”危机在大模型训练与推理场景中,算力演进速度远超存储带宽,计算与存储之间的性能鸿沟(存储墙)已成为限制系统能效的关键瓶颈。• Scale-up需求:单节点内需要极高
    发表于 01-29 17:32

    迈富时珍岛集团:专业GEO服务助力企业构建AI时代内容营销新规

    多重挑战。在这背景下,专业的GEO(生成引擎优化)服务成为企业突破困境的关键。 、GEO服务的市场价值与发展趋势 1.1行业背景分析 当
    的头像 发表于 01-16 08:48 450次阅读

    上海瑞金医院携手华为以AI技术重塑病理诊断未来

    病理被称为医学之根本,然而人才短缺、工作繁重等长期痛直影响着病理诊断的发展突破。在医疗数智化进程中,AI
    的头像 发表于 12-17 17:08 1266次阅读

    博泰车联网荣获2025年度全域AI智能座舱突破企业

    汽车产业电动化迈向智能化深度融合的背景下,智能座舱作为人车交互的核心载体,已成为车企差异化竞争的关键。11月20日,由《每日经济新闻》主办的第十七届“猎车榜”评选结果揭晓,博泰车联凭借在全域AI
    的头像 发表于 11-26 15:07 534次阅读

    AIDC如何成为AI发展的关键棒?

    AI
    脑极体
    发布于 :2025年09月21日 12:21:23

    AI 芯片浪潮下,职场晋升新契机?

    在科技飞速发展的当下,AI 芯片已然成为众多行业变革的核心驱动力。互联网巨头的数据中心,到我们日常使用的智能手机、智能家居设备,AI 芯片
    发表于 08-19 08:58

    负氧离子监测系统:原理到应用的全维度突破

    负氧离子监测系统:原理到应用的全维度突破 柏峰 【BF-FLZ】负氧离子作为衡量空气质量与生态环境的关键指标,其精准监测已成为环保、文旅、健康等领域的核心需求。负氧离子监测系统通过融合传感技术、物联网传输与数据处理算法,实现了
    的头像 发表于 08-15 14:25 1525次阅读
    负氧离子监测系统:<b class='flag-5'>从</b>原理到应用的全维度<b class='flag-5'>突破</b>

    华为星河AI融合SASE解决方案如何防御勒索攻击

    当前,AI技术蓬勃发展,智能化转型已成为企业发展的必由之路。各企业纷纷投身其中,在企业运营中不断创造出更多的数字资产。这些数字资产如同企业的
    的头像 发表于 08-11 10:44 1022次阅读
    华为星河<b class='flag-5'>AI</b>融合SASE解决方案如何防御勒索攻击

    AI智能体+AIoT:智能时代的关键联结,还是又一场幻觉与泡沫?

    大模型的爆发,到边缘计算的逐渐普及,智能语音助手走进家庭,到智能设备接入云端,AI智能体与AIoT的结合,正成为产业界的新热点。但在技术热潮的背后,我们必须提出
    的头像 发表于 07-11 14:57 1897次阅读
    <b class='flag-5'>AI</b>智能体+AIoT:智能时代的关键联结,还是<b class='flag-5'>又一</b>场幻觉与泡沫?

    AI技术助力可持续发展

    随着人工智能 (AI) 持续为行业和社会带来变革,如何平衡其快速增长与环境责任的紧迫性已成为关键考量。诚然 AI 会致使巨大的能源需求,但它也可以成为应对更广泛的可持续
    的头像 发表于 06-19 10:43 1409次阅读

    RAKsmart服务器如何助力企业破解AI转型的难题

    当今,企业AI转型已成为提升竞争力的核心战略。然而,算力不足、成本失控、部署复杂等问题却成为横亘在转型路上的“三座大山”。面对这挑战,RAKsmart服务器凭借其技术创新与全球化资源
    的头像 发表于 05-27 10:00 538次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的件大事,万物皆可大模型已成为趋势。作为大模型开发应用中重要组
    发表于 05-02 09:26