神经架构搜索的算法，可以使被AI优化过的AI设计过程加速240多倍-电子发烧友网

自2017年以来，人工智能（AI）研究人员一直用AI神经网络来设计更好、更快的AI神经网络。迄今为止，学界一直在追求用人工智能促进人工智更好地发展。这主要是因为，这种方法能达到数万小时的GPU时间。如果真可以实现这一点，那么设计AI应用程序时，可能会更快、更简单。

今年5月，麻省理工学院的一个研究团队将展示一种名为“神经架构搜索”（ “neural architecture search” ）的算法，该算法可以使被AI优化过的AI设计过程加速240多倍。这有利于人工智能更快、更准，并且在实际范围内广泛应用于图像识别算法和其他相关应用。

麻省理工学院电子工程和计算机科学助理教授韩松说：“在模型大小、应用延迟、准确性和模型容量之间存在各种权衡。把所有的东西权衡起来就会产生一个巨大的设计空间。以前人们设计的神经网络采用的是启发式算法。神经架构搜索的目的在于减轻算法的工作量，将基于人类启发式的探索转化为算法自主学习的，更符合AI的设计逻辑。就像AI可以学习下围棋一样，去学习如何设计一个神经网络。”

就像人工智能曾战胜李世石与柯洁，甚至可以教这些围棋国手新的围棋路数，通过AI来优化AI可以提供新的AI设计思路。

麻省理工用的AI算法类型是一种卷积神经网络（CNN）。（CNN通常是用于图像识别的首选神经网络。除此之外，它还被应用于自然语言处理和药物研发。）

韩松说，这种被AI优化过的CNN的图像分类速度将是其他AI的1.8倍。

他补充说团队能将CNN提速至此，主要缘于以下三点：

首先，他们减少了运行神经架构搜索的GPU内存负载。标准神经架构搜索可以同时检查网络中神经层之间所有可能的连接。而韩松团队的算法每次只在CPU的内存中保存一条路径。这个技巧可以只用十分之一的内存完成对所有参数空间的搜索，从而使搜索能够覆盖更多的网络配置而不会耗尽芯片上的空间。

第二，该团队通过删减掉冗余的神经网络来精简路径，这样明显加快了神经网络搜索进程。通常，神经架构搜索只丢弃单个“神经元”，因为它会修剪掉所有次优的神经网络连接。

第三，这个算法使神经网络搜索意识到AI系统在正在运行的硬件中可能的延迟时间，不管这个硬件是GPU或CPU。

韩松说，令人惊讶的是，通过新的算法，我们发现，传统AI中某些图像识别神经网络是错的。从某种意义上说，当前大家已经在用GPU运行算法了，但有些做AI的人的设计思维仍然处于CPU时代。

CNN在其图像识别算法中使用的是3×3、5×5或7×7像素的正方形网格滤波器，不过此前，大家很少使用7×7像素的滤波器，因为人们一直认为运行多层3×3像素的滤波器比单个7×7像素的滤波器更快。

然而，被AI优化的AI却使用了不少7×7像素的滤波器。韩松表示，当前用于人工智能计算的硬件中，GPU仍然占主导地位。他说：“GPU本身有很大的并行性，而且大型内核调用比调用几个小内核调用效率更高，因此7×7层的滤波器更适用于GPU。”

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4557

浏览量
98605
gpu

gpu

+关注

关注
27

文章
4391

浏览量
126519
AI

AI

+关注

关注
87

文章
26298

浏览量
263903

原文标题：麻省理工团队能将被AI优化过的AI设计过程加速240倍！

文章出处：【微信号：worldofai，微信公众号：worldofai】欢迎添加关注！文章转载请注明出处。

开发者手机 AI - 目标识别 demo

Lite的API接口实现主要功能； Mindspore Lite为Openharmony AI推理框架，为上层应用提供统一的AI推理接口，可以完成在手机等端侧设备中的模型推理过程；

发表于 04-11 16:14

STM32H750可以使用Cube.AI吗？

STM32H750，可以使用Cube.AI吗

发表于 03-19 06:14

ai_reloc_network.h引入后，ai_datatypes_format.h和formats_list.h报错的原因？

当准备使用神经网络的relocatable方式，将ai_reloc_network.h头文件加入程序编译后，ai_datatypes_format.h在cubeIDE和Keilc里分别报如下错误

发表于 03-14 06:23

NanoEdge AI的技术原理、应用场景及优势

，可以减少数据在传输过程中被窃取或篡改的风险，提高数据安全性。 - 低能耗：通过优化神经网络模型和硬件设计，NanoEdge AI

发表于 03-12 08:09

【国产FPGA+OMAPL138开发板体验】（原创）5.FPGA的AI加速源代码

FPGA架构的优化。以下是我写的一个简化版的代码，用来展示FPGA如何加速AI计算中的某个简单操作（比如矩阵乘法）。 // Verilog代码，用于FPGA上的

发表于 02-12 16:18

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

、低成本的 AI 解决方案。 Vitis AI 可以做什么？ Vitis AI 可以做很多事情，例如：

发表于 10-14 15:34

AI智能呼叫中心

对这些数据的深入分析，呼叫中心可以有效改进服务质量、优化流程并提升业绩，此外，AI智能呼叫中心还可以基于数据分析的结果，进行智能预测并制定更加科学的策略，为企业的未来决策提供有力支持。

发表于 09-20 17:53

OpenHarmony AI框架开发指导

的，比如cv的需要图片数据、asr的需要语音数据；为了适配数据类型的差异，AI引擎对外提供了对基本数据类型的编解码能力，将不同数据类型转换为AI引擎可以使用的通用数据类型。编码后的数据类型定义

发表于 09-19 18:54

《 AI加速器架构设计与实现》+第2章的阅读概括

。感兴趣的话可以好好看看。 2.4和2.5小节分别介绍了卷积顺序的选择和池化模块的设计。这两节的介绍也很详细，图片也很多。阅读感受整本书里面，不仅有文字说明，还有大量图片的配合，有内容的深度，也有图片的直观具体。对于想了解AI加速

发表于 09-17 16:39

《 AI加速器架构设计与实现》+学习和一些思考

，如有错误还望大佬们指出，我马上改正。目录和进度目前阅读到第一章，先更新到第一章的内容吧卷积神经网络运算子系统的设计储存子系统的设计架构优化技术安全与防护神经

发表于 09-16 11:11

AI和Xilinx如何加速暗物质搜索

电子发烧友网站提供《AI和Xilinx如何加速暗物质搜索.pdf》资料免费下载

发表于 09-15 14:19 •1次下载

《 AI加速器架构设计与实现》+第一章卷积神经网络观后感

《 AI加速器架构设计与实现》+第一章卷积神经网络观感在本书的引言中也提到“一图胜千言”，读完第一章节后，对其进行了一些归纳（如图1），第一章对常见的

发表于 09-11 20:34

ai算法和模型的区别

非常重要。本文将详细探讨AI算法和模型的区别，并解释它们在AI应用中的作用。 AI算法人工智能算法

发表于 08-08 17:35 •2669次阅读

【书籍评测活动NO.18】 AI加速器架构设计与实现

的设计摸清加速器设计中遇到的具体问题及其解决方法了解NPU架构需要考虑的控制通路和数据通路从算法角度看，神经网络分Training（训练）和Inference（推理）两个

发表于 07-28 10:50

国产工业级RK3568核心板-AI人脸识别产品方案

，自动对焦等功能的摄像头模组，以保证图像质量和拍摄效果。在图像采集的过程中，可以使用RK3568内置的ISP图像处理单元对图像进行优化，提高人脸识别的准确率和稳定性。 LCD显示屏：目前提供7寸MIPI屏

发表于 05-06 14:30

搜索历史

神经架构搜索的算法，可以使被AI优化过的AI设计过程加速240多倍

评论

开发者手机 AI - 目标识别 demo

STM32H750可以使用Cube.AI吗？

ai_reloc_network.h引入后，ai_datatypes_format.h和formats_list.h报错的原因？

NanoEdge AI的技术原理、应用场景及优势

【国产FPGA+OMAPL138开发板体验】（原创）5.FPGA的AI加速源代码

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

AI智能呼叫中心

OpenHarmony AI框架开发指导

《 AI加速器架构设计与实现》+第2章的阅读概括

《 AI加速器架构设计与实现》+学习和一些思考

AI和Xilinx如何加速暗物质搜索

《 AI加速器架构设计与实现》+第一章卷积神经网络观后感

ai算法和模型的区别

【书籍评测活动NO.18】 AI加速器架构设计与实现

国产工业级RK3568核心板-AI人脸识别产品方案