0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赋予机器自主设计模型“能力”,一文概览结构搜索的起源

倩倩 来源:雷锋网 2020-03-27 15:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

伴随着人工智能技术的飞速发展,语音识别、机器翻译等各项科技名词已不是传统意义上被企业家束之高阁的前景应用,更不是研究人员讳莫如深的复杂概念,它们已经伴随着大数据时代的来临走入了寻常人的身边。如今的生活中我们无处不在享受着人工智能技术带给我们的便利,从前在科幻电影《星际迷航》中使用的通用翻译器,已然成为了现在人们出行途中能够使用的小型翻译机。而拨开这些实际应用的面纱,它们背后所使用的技术往往是这些年来备受关注的神经网络模型。

通俗来讲,它是一种对外部输入信息进行学习的数学模型或计算模型。它能够通过对自身内部结构的调整来拟合输入数据,凭借着算法广泛的通用性,其在语音、图像、自然语言处理等众多领域得到了广泛的应用。

电影《星际迷航》里科克船长和老骨头所使用的实时翻译设备

而对于目前的基于神经网络技术的各项任务而言,主要的过程依旧是由研究人员手动地探索新的网络结构,比如我们常见的循环神经网络(Recurrent neural network; RNN)、卷积神经网络(Convolutional Neural Network; CNN)等。但这样做实际上是一个非常系统工程的方式,我们把研究人员束缚在岗位上不断地去“设计”所谓的更好的结构,而模型的好与坏则往往取决于人对任务的理解以及模型设计上的想象力,整个过程需要研究人员对相关领域有着充分的认知,间接提高了从业人员的入门门槛,与此同时通过人工不断地对模型结构进行改良也非常耗费时间。

随着近年来计算机设备的算力以及存储能力逐年递增,人们逐渐开始去思考是否我们可以让计算机像学网络参数一样学习神经网络模型的结构?希望能通过这种方式将研究人员从模型结构设计者的位置上“解救”出来,于是就有了这样一个机器学习领域的研究分支——网络结构搜索(Neural Architecture Search; NAS)。

实际上目前神经网络结构搜索技术已经在各个领域中崭露头角,如谷歌团队在Searching for Activation Functions【1】论文中通过对激活函数空间进行搜索发现了Swish函数,相对诸如Relu等传统人工设计的激活函数具有更快的收敛速度。而微软团队在WMT19机器翻译评测任务中同样也采用了其团队提出的NAO【2】方法来自动地对神经网络结构进行优化,在英语-芬兰语以及芬兰语-英语的任务上均取得了不俗的成绩。

可以看到网络结构搜索技术的使用已经为各项任务中模型结构的设计起到非常好的助力,那么其背后究竟使用了怎样的技术?如何能够让神经网络自动地对自身结构进行改良?虽然目前网络结构的搜索技术依旧方兴未艾,但已然存在很多来自工业界以及学术界的团队在不断努力探索更好的方法。

可以预计在不远的将来,随着科研人员的努力以及计算资源的进一步提升,网络结构搜索的技术将大幅降低模型结构的更迭所需要的时间周期,同时能够让研究人员有更多地精力去探索有趣的应用或讨论神经网络背后的可解释性。当然在这个过程中,我们需要审视这门技术的发展历史,同时对未来的发展趋势进行展望。

微软团队在WMT19机器翻译评测任务中英语-芬兰语任务的提交信息

从“人工”到“自动”的突围

人类对于自动化的追求从未停止,这一点从三次工业革命的目标即可看到端倪,它们无一不在为了将人们从繁复的工作中解放出来不懈努力。而对于机器学习任务而言,人们也依旧在不断地探索,希望能够让机器在无需人类过多干预的情况下,真正地替代人去完成更多的工作,而在这个过程中研究人员始终在不断尝试,努力做好这次从“人工”到“自动”的突围。

机器学习方法的演化与变迁

传统机器学习

如果我们将机器学习所处理的任务建模为一种从输入到输出的映射学习,那么在初代的机器学习算法中,我们不仅需要设计一种适用于当前任务的方法(如广泛使用的决策树、支持向量机等),同时还要为其提供人工设计的特征集合,在完成这些工作之后,才能使用数据对模型中的参数进行调优。

以情感分析为例,我们可以向模型中输入词性、词频及其情感属性等信息,然后通过支持向量机的模型来对情感分析任务进行建模,其中词性、词频以及情感属性即为我们从句子中提取出的人工设计的模型特征,支持向量机则是我们选择来解决当前问题的机器学习算法。

我们可以看到,不管是输入的特征还是模型自身,均为研究人员归纳总结而得,这个过程就很容易造成对有效特征的忽视以及模型设计上的不合理,因此基于这种传统机器学习算法的情感分析任务在IMDB Movie Reviews【3】集合上的准确率一般很难超过92%(如斯坦福大学的工作Baselines and Bigrams: Simple, Good Sentiment and Topic Classification【4】,通过使用朴素贝叶斯的方法在IMDB Movie Reviews数据集上也仅达到了91.22%的准确率)。可以看到在机器学习技术的初期,整个系统尚且处于对“人工”高度依赖的时代。

深度学习

随着深度学习技术的广泛普及,人们开始尝试将提取特征的过程交由模型来自动完成,通过数据驱动的方式减少传统方法中特征遗漏的问题。比如说对于图像处理任务而言,我们无需根据人工经验对图像中的局部特征进行设计,只需要直接将画面完整地送入模型中进行训练即可。

下图中为人脸识别任务中不同层的神经网络对图像信息的抽取,我们可以看到在学习过程中底层网络主要是对图像中局部纹理进行捕捉,而随着层数的递增,模型开始根据下层中收集到的纹理信息对人脸中的局部结构(如眼睛、耳朵等)进行建模,而顶层将综合上述局部特征对人脸在图像中的位置进行确定,最终达成人脸识别的目的。

人脸识别任务中不同层对图像信息的提取差异

此外,对于前文提到的情感分析任务而言,同样是可以使用深度学习的方式对语言进行建模。相对基于传统机器学习算法的模型而言,深度学习的方式直接接收文本的输入,将词汇以高维向量的方式建模为词嵌入(word embedding)。这种方法利用高维空间对词汇中语义信息进行捕获,从而为下一步的情感分析提供了非常充足的信息。

基于深度学习的情感分析模型在IMDB Movie Reviews数据集上远远超越了传统的机器学习方法,在卡内基梅隆大学与谷歌团队在NIPS 2019上合作发表的论文XLNet: Generalized Autoregressive Pretraining for Language Understanding【5】中,准确率达到了96.8%。

从上述例子中可以看到,深度学习技术在如今的机器学习领域已然达成诸多优异成绩,其中非常重要的一个贡献在于通过使用自动提取的方式对初始输入信息中的有效资讯进行捕获,大幅度降低了手动设计特征所带来的信息折损,为下游任务提供了更坚实的基础。

深度学习&网络结构搜索

深度学习技术的到来使得原本由人工进行的特征提取过程交由机器自动完成,允许模型根据自身需求从原始数据中进行特征的捕获,通过这种数据驱动的方式有效降低了人工抽取所带来的信息丢失风险。但当我们回顾整个深度学习系统,实际上其依旧并非我们期望的完全自动化的过程,在模型结构的设计上仍然非常依赖行业专家面向任务对模型结构进行设计。

以机器翻译任务为例,研究人员在模型结构上的探索脚步从未停止,从最初基于RNN【6】对文本序列进行表示发展到之后注意力机制【7】的引入,乃至更近一段时间的基于CNN【8】的翻译系统以及目前备受关注的Transformer【9】系统,科研人员始终在不断地针对任务进行模型结构的设计与改良。但有了深度学习初期的发展,研究人员也期望着有朝一日能够让模型结构设计的过程同样不再过分依赖人工设计,能够采用同特征选择类似的方式自动进行学习,因此在深度学习方法的基础上,人们开始尝试网络结构搜索的方式来自动得到模型结构。

实际上网络结构搜索的任务并非起源于近些年,早在上世纪80年代,斯坦福大学的Miller, Geoffrey F.等人在Designing Neural Networks using Genetic Algorithms【10】论文中就提出使用进化算法对神经网络结构进行学习的方式,在此之后也有很多研究人员沿着该思路进行了相关的探索(如Representation and evolution of neural networks【11】一文对进化算法的编码格式进行改良,J. R. Koza等人在Genetic generation of both the weights and architecture for a neural network【12】中提出要同时对网络中的结构和参数进行学习等)。

但受限于当时计算资源,针对神经网络的结构搜索的应用场景较少,因此这方面的工作并没有受到很多研究者的关注。而随着近些年来神经网络以及深度学习的技术的广泛应用,对于网络结构自学习的需求也越来越大,与此同时发展迅猛的半导体技术也使得设备的算力、存储能力大大提升,为网络结构搜索任务提供了必要的支持。

纵观整个机器学习算法的发展过程,网络结构搜索任务的出现可以看作是历史的必然。无论是数据资源的累积还是计算能力的提升,无一不在催生着数据驱动下的网络结构设计。虽然目前的网络结构搜索技术尚且处于比较初级的阶段,其高资源消耗、模型结构不稳定等问题始终困扰着研究人员,但是其发展势头迅猛,在图像、自然语言处理等领域均开始崭露头角。

可以预见的是,深度学习&网络结构搜索的组合将是把研究人员从模型工程的泥淖中救起的稻草,我们也相信网络结构搜索技术会终将为机器学习完成这场从“人工”到“自动”的终局突围。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108446
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15578
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14767
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    聚焦 AI 大模型驱动 具身智能人形机器人技术架构与前景

    能力不足等固有痛点,难以适配工业、特种作业等非结构化复杂场景的作业需求。 依托具身智能与AI大模型的深度融合,新代人形机器人构建起完整的
    的头像 发表于 05-23 15:18 104次阅读

    Elasticsearch7.x搜索实战

    7.x)作为业界领先的分布式搜索与分析引擎,结合大语言模型(简称大模型)的语义理解与生成能力,正在重新定义智能检索系统的边界。本文从适用角度出发,探讨这
    发表于 05-22 10:52

    2026年中国十大机器视觉公司的决胜逻辑:全栈能力与场景深耕

    近年来,随着“十五五”规划的启航,以及国家对人工智能、智能制造战略高度的不断提升,中国机器视觉产业链的国产化进程显著加快。从核心元器件的自主突破,到AI大模型与视觉技术的深度融合,本土企业正逐步打破
    发表于 05-15 09:16

    百度心大模型5.1正式发布

    代基础大模型心大模型 5.1正式发布!心 5.1采用“多维弹性预训练”技术,仅以业界同规模模型
    的头像 发表于 05-11 14:21 366次阅读
    百度<b class='flag-5'>文</b>心大<b class='flag-5'>模型</b>5.1正式发布

    具身智能工业机器人任务规划大模型GRID:重塑柔性制造的“核心大脑”

    当前制造业面临多品种、小批量需求与传统机器人刚性自动化之间的核心矛盾。具身智能工业机器人因其自主规划与执行能力成为破局关键,而任务规划正是其落地的核心瓶颈。富唯智能全球独创的GRID大
    的头像 发表于 05-09 18:05 1141次阅读

    九天菜菜大模型agent智能体开发实战2026月班

    复杂多变的现实场景。而大模型 Agent 则打破了这局限,它以大模型为核心大脑,具备感知环境、理解任务、制定规划、调用工具并完成目标的完整能力链,宛如
    发表于 04-15 16:04

    【「龙芯之光 自主可控处理器设计解析」阅读体验】--全书概览与概述

    金属-氧化物-半导体场效应管和个电容组成。这种结构的设计充分利用了电容能够存储电荷的特性,以及MOSFET作为开关控制电荷存储的能力。 定时器在计算机系统的运行与控制中发挥着至关重要的作用,其本质
    发表于 01-18 12:58

    多模态感知大模型驱动的密闭空间自主勘探系统的应用与未来发展

        多模态感知大模型驱动的密闭空间自主勘探系统    北京华盛恒辉多模态感知大模型驱动的密闭空间自主勘探系统,是融合多模态大模型
    的头像 发表于 12-29 11:27 560次阅读

    读懂!AI搜索既是趋势也是未来,定不可错过的GEO机遇

    AI对搜索来说不是替代,而是进化,是搜索体验的下个阶段。并已在众多你意想不到的场景中深入我们的生活,应用非常广泛,到处都有AI搜索的影子。
    的头像 发表于 12-12 17:38 2762次阅读

    百度心大模型5.0-Preview文本能力国内第

    11月8日凌晨,LMArena大模型竞技场最新排名显示,心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中国第
    的头像 发表于 11-11 17:15 1741次阅读

    安森美产品如何助力打造下自主移动机器

    类员工严格隔离的。不过,细心的小伙伴会发现,随着新自主移动机器人(AMR)的出现,机器人在人们心目中的刻板形象正在被打破,它们正在被赋予
    的头像 发表于 10-27 15:11 2004次阅读

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器赋予接近人类的推理能力
    的头像 发表于 09-30 09:52 3278次阅读
    NVIDIA 利用全新开源<b class='flag-5'>模型</b>与仿真库加速<b class='flag-5'>机器</b>人研发进程

    自主生产:制造业的未来

    。这些系统具有自适应能力、联网能力和学习能力,而不会成不变地执行任务。 人类的作用仍然是核心 尽管自动化程度不断提高,但人类的作用仍然不可替代。
    发表于 09-15 15:08

    龙芯中科与心系列模型开展深度技术合作

    ”解决方案。 强强联合!自主架构赋能大模型训练 心大模型 心4.5系列模型均使用飞桨深度学习
    的头像 发表于 07-02 16:53 1538次阅读

    听得见、想得通、做得到:移远通信携手逐际动力,发布Robrain AI机器人解决方案

    “Robrain AI机器人解决方案” 。该方案 采用创新的端云协同架构及 麦克风阵列拾音技术 ,深度融合端侧智能与云端大模型优势,赋予机器人接近人类的“思考”与“倾听”
    发表于 06-19 10:28 1735次阅读
    听得见、想得通、做得到:移远通信携手逐际动力,发布Robrain AI<b class='flag-5'>机器</b>人解决方案