增加诸如人脸识别这样基于人工智能的界面来进行机器的访问授权——这乍一看似乎是一个巨大的飞跃,但它并不像您想象得那么困难。有大量的网络平台可用,有很多训练选项,甚至还有开源应用程序,比如前面提到的人脸识别的例子。您可以用能在您的个人电脑上运行的原型程序来快速地进行测试。
限制因素
在您的嵌入式应用程序中放入一个经过训练的网络似乎是另一个巨大的困难。个人电脑(或云)训练的网络不会在存储容量或功耗方面优化太多。它们可能使用浮点或双字来进行网络计算,并且在处理图像上的滑动窗口时,它们将大幅依赖于片外存储器访问。这对高性能个人电脑上运行的原型来说不成问题,但您需要在终端应用程序中省着点用,以确保不影响性能。
优化要领
优化中的一个关键步骤叫做量化。将权重从浮点切换到定点,并减小定点的大小,例如从32位浮点减到8位整数,不仅影响权重的大小,而且影响中间计算值的大小。仅此一项就可以显著减少内存占用,并且在大多数情况下对识别质量的影响很小。
第二项操作是利用权重中的稀疏性,同时尽可能地减小对精确度的影响。这种做法将利用那些接近于零的权重,并将它们舍入到零,同时密切跟踪这对精确度的影响。权重用于乘以部分和,如果其中有因数为零,就将变成无用功,因此也就没有必要执行该操作了。
在实际的实现过程中,图像被增量处理,因此当计算窗口在图像上移动时,必须更新权重。这会带来大量的更新以及大量的数据流量。通过将大部分权重值强制设为零,就可以压缩权重数组,从而使数组的全部或大部分存储在片内SRAM中,以便按需解压缩。因此,最大限度地减少了对主存的需求,从而提高了性能并降低了功耗。在加载权重时,它还附带地减少了片内通信量。更少的流量占用则意味着更高的吞吐量。
此外还要考虑一个因素。像大多数复杂的应用一样,神经网络依赖于精密的数据库。您需要使用专为微控制器环境设计的数据库,和您所选择的平台的编译器。选择TensorFlow Lite等开源库便是一个不错的着手点,但是为了充分利用微控制器,还需要专门的定制解决方案。
当然,想要弄清自己必须要干什么并不容易。而您现在要做的,就是找到平台来简化这些操作并提供经过硬件优化的数据库。
我如何使这个流程变得简单易用?
您需要的是一个可以在特定平台(例如TensorFlow)上承载训练过的网络,并且将该网络直接编译到您的嵌入式解决方案中的流程。除了加入一些基本要求之外,无需额外干预。当然,您也希望能够进一步手动优化该选项,可以是在不同的平面上设置不同的量化级别,也可以是在权重阈值与片内存储器容量方面多加尝试。此外,您还希望根据硬件优化数据库,以及根据数据库优化硬件。
原文标题:掌握嵌入式人工智能:根据您的设备进行优化
文章出处:【微信公众号:CEVA】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
-
人工智能
+关注
关注
1820文章
50324浏览量
266898 -
人脸识别
+关注
关注
77文章
4131浏览量
88749
原文标题:掌握嵌入式人工智能:根据您的设备进行优化
文章出处:【微信号:CEVA-IP,微信公众号:CEVA】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
嵌入式人工智能课程(华清远见)
DEKRA德凯成为欧盟人工智能法案下首家获得认可实验室
开发智能体配置-内容合规
嵌入式系统中的人工智能
减少 2/3 人工:智能气密性检测设备的人机协作优化-岳信仪器
【产品介绍】Altair RapidMiner数据分析与人工智能平台
利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
关于人工智能处理器的11个误解
根据设备进行优化的人工智能
评论