0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

神经架构搜索的算法,可以使被AI优化过的AI设计过程加速240多倍

jmiy_worldofai 来源:lp 2019-04-10 14:20 次阅读

自2017年以来,人工智能AI)研究人员一直用AI神经网络来设计更好、更快的AI神经网络。迄今为止,学界一直在追求用人工智能促进人工智更好地发展。这主要是因为,这种方法能达到数万小时的GPU时间。 如果真可以实现这一点,那么设计AI应用程序时,可能会更快、更简单。

今年5月,麻省理工学院的一个研究团队将展示一种名为“神经架构搜索”( “neural architecture search” )的算法,该算法可以使被AI优化过的AI设计过程加速240多倍。 这有利于人工智能更快、更准,并且在实际范围内广泛应用于图像识别算法和其他相关应用。

自2017年以来,人工智能(AI)研究人员一直用AI神经网络来设计更好、更快的AI神经网络。迄今为止,学界一直在追求用人工智能促进人工智更好地发展。这主要是因为,这种方法能达到数万小时的GPU时间。 如果真可以实现这一点,那么设计AI应用程序时,可能会更快、更简单。

麻省理工学院电子工程和计算机科学助理教授韩松说:“在模型大小、应用延迟、准确性和模型容量之间存在各种权衡。把所有的东西权衡起来就会产生一个巨大的设计空间。 以前人们设计的神经网络采用的是启发式算法。神经架构搜索的目的在于减轻算法的工作量,将基于人类启发式的探索转化为算法自主学习的,更符合AI的设计逻辑。 就像AI可以学习下围棋一样,去学习如何设计一个神经网络。”

就像人工智能曾战胜李世石与柯洁,甚至可以教这些围棋国手新的围棋路数, 通过AI来优化AI可以提供新的AI设计思路。

麻省理工用的AI算法类型是一种卷积神经网络(CNN)。(CNN通常是用于图像识别的首选神经网络。除此之外,它还被应用于自然语言处理和药物研发。)

韩松说,这种被AI优化过的CNN的图像分类速度将是其他AI的1.8倍。

他补充说团队能将CNN提速至此,主要缘于以下三点:

首先,他们减少了运行神经架构搜索的GPU内存负载。标准神经架构搜索可以同时检查网络中神经层之间所有可能的连接。而韩松团队的算法每次只在CPU的内存中保存一条路径。这个技巧可以只用十分之一的内存完成对所有参数空间的搜索,从而使搜索能够覆盖更多的网络配置而不会耗尽芯片上的空间。

第二,该团队通过删减掉冗余的神经网络来精简路径,这样明显加快了神经网络搜索进程。通常,神经架构搜索只丢弃单个“神经元”,因为它会修剪掉所有次优的神经网络连接。

第三,这个算法使神经网络搜索意识到AI系统在正在运行的硬件中可能的延迟时间 ,不管这个硬件是GPU或CPU。

韩松说,令人惊讶的是,通过新的算法,我们发现,传统AI中某些图像识别神经网络是错的。从某种意义上说,当前大家已经在用GPU运行算法了,但有些做AI的人的设计思维仍然处于CPU时代。

CNN在其图像识别算法中使用的是3×3、5×5或7×7像素的正方形网格滤波器,不过此前,大家很少使用7×7像素的滤波器,因为人们一直认为运行多层3×3像素的滤波器比单个7×7像素的滤波器更快。

然而,被AI优化的AI却使用了不少7×7像素的滤波器。韩松表示,当前用于人工智能计算的硬件中,GPU仍然占主导地位。他说:“GPU本身有很大的并行性,而且大型内核调用比调用几个小内核调用效率更高,因此7×7层的滤波器更适用于GPU。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4557

    浏览量

    98605
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4391

    浏览量

    126519
  • AI
    AI
    +关注

    关注

    87

    文章

    26298

    浏览量

    263903

原文标题:麻省理工团队能将被AI优化过的AI设计过程加速240倍!

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    Lite的API接口实现主要功能; Mindspore Lite为Openharmony AI推理框架,为上层应用提供统一的AI推理接口,可以完成在手机等端侧设备中的模型推理过程
    发表于 04-11 16:14

    STM32H750可以使用Cube.AI吗?

    STM32H750,可以使用Cube.AI
    发表于 03-19 06:14

    ai_reloc_network.h引入后,ai_datatypes_format.h和formats_list.h报错的原因?

    当准备使用神经网络的relocatable方式,将ai_reloc_network.h头文件加入程序编译后,ai_datatypes_format.h在cubeIDE和Keilc里分别报如下错误
    发表于 03-14 06:23

    NanoEdge AI的技术原理、应用场景及优势

    可以减少数据在传输过程中被窃取或篡改的风险,提高数据安全性。 - 低能耗:通过优化神经网络模型和硬件设计,NanoEdge AI
    发表于 03-12 08:09

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    FPGA架构优化。以下是我写的一个简化版的代码,用来展示FPGA如何加速AI计算中的某个简单操作(比如矩阵乘法)。 // Verilog代码,用于FPGA上的
    发表于 02-12 16:18

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    、低成本的 AI 解决方案。 Vitis AI 可以做什么? Vitis AI 可以做很多事情,例如:
    发表于 10-14 15:34

    AI智能呼叫中心

    对这些数据的深入分析,呼叫中心可以有效改进服务质量、优化流程并提升业绩,此外,AI智能呼叫中心还可以基于数据分析的结果,进行智能预测并制定更加科学的策略,为企业的未来决策提供有力支持。
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    的,比如cv的需要图片数据、asr的需要语音数据;为了适配数据类型的差异,AI引擎对外提供了对基本数据类型的编解码能力,将不同数据类型转换为AI引擎可以使用的通用数据类型。 编码后的数据类型定义
    发表于 09-19 18:54

    AI加速架构设计与实现》+第2章的阅读概括

    。感兴趣的话可以好好看看。 2.4和2.5小节分别介绍了卷积顺序的选择和池化模块的设计。这两节的介绍也很详细,图片也很多。 阅读感受 整本书里面,不仅有文字说明,还有大量图片的配合,有内容的深度,也有图片的直观具体。对于想了解AI加速
    发表于 09-17 16:39

    AI加速架构设计与实现》+学习和一些思考

    ,如有错误还望大佬们指出,我马上改正。 目录和进度 目前阅读到第一章,先更新到第一章的内容吧 卷积神经网络 运算子系统的设计 储存子系统的设计 架构优化技术 安全与防护 神经
    发表于 09-16 11:11

    AI和Xilinx如何加速暗物质搜索

    电子发烧友网站提供《AI和Xilinx如何加速暗物质搜索.pdf》资料免费下载
    发表于 09-15 14:19 1次下载
    <b class='flag-5'>AI</b>和Xilinx如何<b class='flag-5'>加速</b>暗物质<b class='flag-5'>搜索</b>

    AI加速架构设计与实现》+第一章卷积神经网络观后感

    AI加速架构设计与实现》+第一章卷积神经网络观感    在本书的引言中也提到“一图胜千言”,读完第一章节后,对其进行了一些归纳(如图1),第一章对常见的
    发表于 09-11 20:34

    ai算法和模型的区别

    非常重要。本文将详细探讨AI算法和模型的区别,并解释它们在AI应用中的作用。 AI算法 人工智能算法
    的头像 发表于 08-08 17:35 2669次阅读

    【书籍评测活动NO.18】 AI加速架构设计与实现

    的设计 摸清加速器设计中遇到的具体问题及其解决方法 了解NPU架构需要考虑的控制通路和数据通路 从算法角度看,神经网络分Training(训练)和Inference(推理)两个
    发表于 07-28 10:50

    国产工业级RK3568核心板-AI人脸识别产品方案

    ,自动对焦等功能的摄像头模组,以保证图像质量和拍摄效果。在图像采集的过程中,可以使用RK3568内置的ISP图像处理单元对图像进行优化,提高人脸识别的准确率和稳定性。 LCD显示屏:目前提供7寸MIPI屏
    发表于 05-06 14:30