0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

神经网络分析有助于提高人工智能系统的准确性

DPVg_AI_era 2017-12-12 16:52 次阅读

近期,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经通过新的解释技术,来分析神经网络做机器翻译和语音识别的训练过程。

神经网络通过分析大量的训练数据来学习并执行任务,这是近期人工智能领域最令人印象深刻的进展,包括语音识别和自动翻译系统。

然而,在训练过程中,神经网络以甚至其创造者都无法解释的方式来不断调整其内部设置。计算机科学最近的许多工作都聚焦于千方百计的弄清楚神经网络的工作原理

在最近的几篇论文,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经使用了新开发的解释技术,来分析神经网络做机器翻译和语音识别的训练过程,该新技术已被应用于其他领域。

他们对神经网络的工作原理有了基本认知。例如,这些系统似乎专注于较低级别的任务,如声音识别或部分语音识别,然后再转到更高级别的任务,如转录或语义解释。

但是研究人员也发现了翻译网络处理数据类型的一个惊人的遗漏,他们指出纠正这种遗漏会提高网络的性能。这种改进是适度的,但它指出了对神经网络的分析可能有助于提高人工智能系统的准确性。

“从历史角度看,在机器翻译里,有一个具有不同层次的金字塔,” CSAIL一位高级研究科学家说。这位科学家在是麻省理工学院电气工程和计算机科学的毕业生,曾参与Yonatan Belinkov项目。”在最低层有文字,表层形式,金字塔的顶层是一种语际表示,在做语法和语义时会达到不同的层次。这是一个非常抽象的概念,意思是你在金字塔中爬得越高,就越容易翻译成一种新的语言,然后你就再往下走。所以Yonata所做的部分工作是找出在神经网络中这种概念的会是什么样的编码。”

分层处理

神经网络之所以得名,是因为它们大致接近人脑的结构。通常,它们被分层,每个层由许多简单的处理单元节点组成,每个节点都连接到上面和下面的层中的几个节点。数据被送入最低层,其节点处理它并将其传递给下一层。层之间的连接具有不同的“权重”,它决定了任何一个节点的输出转化到到下一个节点的计算量是多少。

在训练过程中,节点之间的权重不断调整。在网络被训练后,它的创建者可以确定所有连接的权重,但有成千上万个甚至多个节点,甚至它们之间有更多的连接,推断出这些权重编码的算法几乎是不可能的。

麻省理工和卡塔尔计算研究所研究人员的技术包括训练一个神经网络和使用它的每一层的输出,通过个别的培训案例,培养其他的神经网络来执行特定的任务。这使他们能够确定每个层优化的任务是什么。

在语音识别网络的案例中,Belinkov和Glass使用的单个层输出训练系统识别“语音”,区别于口语的发音单元。例如,“T”的发音在“Tea”“Tree”和“But”,是不同的,但语音识别系统已经把他们都用字母“T”转录。事实上,Belinkov和Glass发现,低层次的网络比高层次网络语言识别能力更强。在那里,可能区别是不重要的。

同样的,Glass, Belinkov和他们卡塔尔计算研究所的同事于去年夏天在语言协会年度大会上发布的文章表明,机器翻译网络的低层善于识别词类和形态,比如时态、数字和共轭。

语义理解

但是在新的论文中,他们表明网络的更高层次在语义标注方面更好。Belinkov解释说,一部分语音标签,能认识到“herself”是一个代词,但这个代词的语义的意义,在句子“she bought the book herself”和“she herself bought the book”是不同的。语义标注会分配不同的标签,给这两句话中的“herself“,就像一个机器翻译系统可能在一个给定的目标语言为它们找到不同的翻译。

最好的机器翻译系统使用所谓的编码解码模式,和麻省理工和卡塔尔计算研究所研究人员的神经网络一样。在这样的系统中,源语言中的输入经过几个被称为编码器的网络层来产生一个向量,一组数字代表某种输入的语义内容。该向量通过多个网络层的解码器来产生目标语言中的译文。

虽然编码器和解码器在一起训练,但它们可以被认为是独立的网络。研究人员发现,奇怪的是,编码器的低层善于区分形态,但解码器的更高层不是。所以Belinkov和卡塔尔计算研究所研究人员在训练网络时,不仅仅根据翻译的准确性,也根据目标语言中的形态分析来判定性能。从本质上讲,他们迫使解码器更好地区分形态。

使用这种技术,他们培训网络将英语翻译成德语,发现其精度提高3%。这不是一个革命性的进步,但这表明,探寻神经网络的本质可能不仅仅是一项学术活动。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98716
  • 人工智能
    +关注

    关注

    1776

    文章

    43824

    浏览量

    230574

原文标题:人类将可能操控AI?神经网络语言处理工作原理被破解

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NanoEdge AI的技术原理、应用场景及优势

    是指将数据处理任务从云端迁移到离数据源更近的设备上,以实现更快的响应时间和更低的延迟。神经网络压缩技术则通过减少模型参数和计算量来降低设备的计算需求,使其能够在有限的资源下运行复杂的人工智能算法。低功耗
    发表于 03-12 08:09

    详解深度学习、神经网络与卷积神经网络的应用

    在如今的网络时代,错综复杂的大数据和网络环境,让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年,深度学习逐渐走进人们的视线,通过深度学习解决若干问题的案例越来越多。一
    的头像 发表于 01-11 10:51 711次阅读
    详解深度学习、<b class='flag-5'>神经网络</b>与卷积<b class='flag-5'>神经网络</b>的应用

    人工神经网络相关资料

    以冯·诺依曼型计算机为中心的信息处理技术的高速发展,使得计算机在当今的信息化社会中起着十分重要的作用。但是,当用它来解决某些人工智能问题时却遇到了很大的困难。 例如,一个人可以很容易地识别他人的脸孔
    发表于 09-27 06:13

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用
    发表于 09-18 10:02

    人工神经网络算法、PID算法、Python人工智能学习等资料包分享(附源代码)

    网络(Artificial Neural Network,即ANN) 可以概括的定义为:   由大量具有适应性的处理元素(神经元)组成的广泛并行互联网络,它的组织能够模拟生物神经系统
    的头像 发表于 09-15 15:36 760次阅读
    <b class='flag-5'>人工</b><b class='flag-5'>神经网络</b>算法、PID算法、Python<b class='flag-5'>人工智能</b>学习等资料包分享(附源代码)

    不可错过!人工神经网络算法、PID算法、Python人工智能学习等资料包分享(附源代码)

    ,是模拟人工智能的一条重要途径。人工神经网络与人脑相似主要表现在: ①神经网络获取的知识是从外界环境学习得来的; ②各
    发表于 09-13 16:41

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能(AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-AI 扩展包,该扩展
    发表于 09-07 06:15

    什么是卷积神经网络?卷积神经网络人工智能和机器学习的意义

    随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本文基于此解释了卷积神经网络(CNN)及其对人工智能和机器学习的意义。CNN是一种能够从复杂数据中提取特征的强大工具,例如识别音频信号或图
    发表于 09-05 10:23 530次阅读

    如何将人工智能应用到效能评估系统软件中去解决

    ,我们可以将其应用到效能评估系统中,进一步提高效能评估的准确性和实用。   华盛恒辉可以利用人工智能技术,通过对大量数据的
    发表于 08-30 12:58

    神经网络模型的工作原理和作用

    神经网络模型是一种计算模型,基于人类神经系统的处理和学习机制,模仿大脑神经元的工作方式,对输入数据进行分析处理,实现分类、识别和预测等任务。神经网络
    发表于 08-28 18:21 909次阅读

    人工神经网络和bp神经网络的区别

    人工神经网络和bp神经网络的区别  人工神经网络(Artificial Neural Network, ANN)是一种模仿人脑
    的头像 发表于 08-22 16:45 3427次阅读

    卷积神经网络的工作原理 卷积神经网络通俗解释

    卷积神经网络的工作原理 卷积神经网络通俗解释  卷积神经网络(Convolutional Neural Network, CNN)是一种众所周知的深度学习算法,是人工智能领域中最受欢迎
    的头像 发表于 08-21 16:49 2734次阅读

    什么是人工智能技术

    或间接地有助于提高数据精确性和准确性,以及优化人们的工作质量和生活方式。 人工智能技术的起源可以追溯到上个世纪50年代。但当时,计算机的能力还非常有限,无法实现真正的
    的头像 发表于 08-12 16:58 1686次阅读

    RBF神经网络(1)#人工智能

    神经网络人工智能
    未来加油dz
    发布于 :2023年07月27日 11:25:34