0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三种不同的神经网络结构训练

IEEE电气电子工程师 来源:IEEE电气电子工程师 作者:IEEE电气电子工程师 2022-10-11 11:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们身边的小工具不断地在充实着我们的生活 —— 智能手表可以检测我们的生命体征,跟踪我们的健康状况;家用扬声器通过听我们的对话来识别我们的声音;智能手机还能够扮演语法学家的角色,观察我们写了什么来自动修复我们的特殊打字错误。我们很感激这些便利,但我们与电子设备共享的信息并不总是在我们的所控范围内。

机器学习可能需要很重的硬件,所以像手机这样的“边缘”设备通常会向中央服务器发送原始数据,然后返回经过训练的算法。然而,有些人希望训练能够在本地进行。一种新的人工智能训练方法扩展了小型设备的训练能力,可能有助于保护隐私。

最强大的机器学习系统使用神经网络,复杂的函数充满可调参数。在训练期间,网络接收输入(如一组像素),生成输出(如标签“cat”),将其输出与正确答案进行比较,并调整其参数,以便下次做得更好。为了知道如何调整每个内部旋钮,网络需要记住每个旋钮的效果,但它们的数量通常为数百万甚至数十亿。这需要大量内存。训练一个神经网络可能需要数百倍的记忆,而仅仅使用一个(也称为“推理”)。在后一种情况下,一旦将信息传递到下一层,内存就可以忘记网络的每一层做了什么。

为了减少训练阶段的记忆需求,研究人员采用了一些技巧。其中一种称为分页或卸载,机器将这些激活信息从短期内存移动到较慢但更丰富的内存类型,如闪存或SD卡,然后在需要时将其恢复。在另一种称为重物质化的方法中,机器删除激活,然后稍后再次计算。加州大学伯克利分校的计算机科学家、描述了该创新的论文的主要作者Shishir Patil说,它们结合使用了“次优”的“启发式”,通常需要大量能量。Patil及其合作者报告的创新将分页和重新实体化方法结合了起来。

“将这两种技术很好地结合到这个优化问题中,然后解决它,这真的很好,”加州大学河滨分校的计算机科学家Jiasi Chen说,他从事边缘计算研究,但没有参与这项工作。

7月,Patil在巴尔的摩举行的机器学习国际会议上介绍了他的系统,称为POET(private optimal energy training)。他首先给出了POET设备的技术细节,以及他所希望训练的神经网络结构的信息。他指定了内存预算和时间预算。然后,他要求设备创建一个培训流程,将能源消耗降至最低。该进程可能决定对某些重新计算效率低下的激活进行分页,但对其他易于重做但需要大量内存存储的激活进行重新实体化。

突破性创新的关键之一在于将问题定义为混合整数线性规划(MILP)难题,即一组约束和变量之间的关系。对于每个设备和网络架构,POET将其变量插入Patil手工编制的MILP程序,然后找到最佳解决方案。Chen说:“一个主要的挑战实际上是以一种好的方式来阐述这个问题,这样你就可以把它输入到一个解决方案中。因此,您可以捕获所有真实的系统动态,如能量、延迟和内存。”

该团队在四个不同的处理器上测试了POET,其RAM范围从32KB到8GB。研究人员分别训练了三种不同的神经网络结构:两种在图像识别中流行的类型(VGG16和ResNet-18),以及一种流行的语言处理网络(BERT)。在许多测试中,该系统可以减少大约80%的内存使用量,而不会大幅增加能耗。可比较的方法不能同时做到这两个。据Patil称,研究表明,BERT现在可以在最小的设备上进行训练,这在以前是不可能的。

Patil说:“当我们开始的时候,POET基本上是一个很好的主意。”现在,几家公司已经开始使用它,并且有一家大公司已经在其智能扬声器中试用了它。Patil说,非常棒的一点是,POET不会通过“量化”或缩写激活来降低网络精度,从而节省内存。因此,设计网络的团队不必与实现网络的团队协调,就精度和内存之间的权衡进行谈判。

Patil指出,除了隐私问题外,使用POET还有其他原因。一些设备需要在本地训练网络,以解决互联网连接很差或没有连接的问题 —— 这些设备包括在农场、潜艇或太空中使用的设备。由于数据传输需要太多能量,其他设置可以从创新中受益。POET还可以使大型设备互联网服务器更节省内存和能源。但对于数据保密,Patil说,“我想这是非常及时的,对吧?”当大型设备——互联网服务器——训练大型网络时,也可能从POET中受益。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106819
  • 服务器
    +关注

    关注

    13

    文章

    10096

    浏览量

    90902
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:研究人员开发在小型设备上训练大型神经网络 保护隐私

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    , batch_size=512, epochs=20)总结 这个核心算法中的卷积神经网络结构训练过程,是用来对MNIST手写数字图像进行分类的。模型将图像作为输入,通过卷积和池化层提取图像的特征,然后通过全连接层进行分类预测。训练
    发表于 10-22 07:03

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的
    的头像 发表于 09-28 10:03 708次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与相相电压之间存在映射关系,因此构建了一个以相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练
    发表于 06-25 13:06

    BP神经网络网络结构设计原则

    BP(back propagation)神经网络是一按照误差逆向传播算法训练的多层前馈神经网络,其网络结构设计原则主要基于以下几个方面:
    的头像 发表于 02-12 16:41 1260次阅读

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一
    的头像 发表于 02-12 15:53 1324次阅读

    如何优化BP神经网络的学习率

    优化BP神经网络的学习率是提高模型训练效率和性能的关键步骤。以下是一些优化BP神经网络学习率的方法: 一、理解学习率的重要性 学习率决定了模型参数在每次迭代时更新的幅度。过大的学习率可能导致模型在
    的头像 发表于 02-12 15:51 1445次阅读

    BP神经网络的实现步骤详解

    BP神经网络的实现步骤主要包括以下几个阶段:网络初始化、前向传播、误差计算、反向传播和权重更新。以下是对这些步骤的详细解释: 一、网络初始化 确定网络结构 : 根据输入和输出数据的特性
    的头像 发表于 02-12 15:50 1135次阅读

    BP神经网络的优缺点分析

    BP神经网络(Back Propagation Neural Network)作为一常用的机器学习模型,具有显著的优点,同时也存在一些不容忽视的缺点。以下是对BP神经网络优缺点的分析: 优点
    的头像 发表于 02-12 15:36 1600次阅读

    什么是BP神经网络的反向传播算法

    BP神经网络的反向传播算法(Backpropagation Algorithm)是一用于训练神经网络的有效方法。以下是关于BP神经网络的反
    的头像 发表于 02-12 15:18 1291次阅读

    BP神经网络与深度学习的关系

    ),是一多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、一个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,
    的头像 发表于 02-12 15:15 1358次阅读

    BP神经网络的基本原理

    BP神经网络(Back Propagation Neural Network)的基本原理涉及前向传播和反向传播两个核心过程。以下是关于BP神经网络基本原理的介绍: 一、网络结构 BP神经网络
    的头像 发表于 02-12 15:13 1541次阅读

    BP神经网络在图像识别中的应用

    传播神经网络(Back Propagation Neural Network),是一多层前馈神经网络,主要通过反向传播算法进行学习。它通常包括输入层、一个或多个隐藏层和输出层。BP神经网络
    的头像 发表于 02-12 15:12 1193次阅读

    如何训练BP神经网络模型

    BP(Back Propagation)神经网络是一经典的人工神经网络模型,其训练过程主要分为两个阶段:前向传播和反向传播。以下是训练BP
    的头像 发表于 02-12 15:10 1470次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工神经网络   人工神经网络模型之所
    的头像 发表于 01-09 10:24 2266次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法