0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI处理器拼的只是算力和功耗吗

lPCU_elecfans 来源:电子发烧友网 作者: 周凯扬 2021-11-02 11:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)AI应用如同燃起的野火一般,从消费级的手机端,出现在了工业级的超级游轮和航空级的空间站上。然而在边缘端,这些应用遇上了传统应用也挣扎了数年的需求:更高的性能、更大的容量和更低的功耗。

更糟糕的是,机器学习模型正在以指数级的速度增长,每3到5个月就会翻一番。要想应用这些模型的话,传统的计算芯片已经难以利用有限的内存资源和功率提供高性能,连数据中心都在AI工作负载上感到吃力了,更不用说在边缘侧运行的大型模型。为此,边缘AI处理器成了不少芯片大厂和初创企业的发力方向。然而在处理器的选取上,并不是仅仅看算力、功耗和成本而已。

边缘AI处理器的选择

首先,AI芯片公司不仅要有硬件开发实力,也要具备强大的AI软件栈和工具。比如英特尔英伟达之类的厂商,其CPUGPU设计早已为TensorFlow、Caffe或Pytorch等框架提供了支持,但初创企业自研架构的AI处理器往往需要打造自己的编译器来支持这些框架。

其次,是处理器支持的神经网络精度。多数边缘AI处理器精度并不高,这是因为将神经网络转换为低精度简化了硬件设计,同时也极大地降低了功耗。要想保持高精度的话,往往需要重新训练神经网络。

Nvidia - Jetson Xavier NX

英伟达于2019年公布了一款名为“Jetson Xavier NX”的AI处理器,专门用于边缘系统和嵌入式应用。Jetson Xavier NX只有70mm x 45mm的大小,却可以在15W的功耗下提供21 TOPS(INT8)的AI算力。

Jetson Xavier NX集成了6核CPU、384核GPU、48个Tensor核心、2个NVDLA深度学习加速器和7路VLIW视觉处理器加速器。其中CPU选用了英伟达Carmel Arm核心,GPU则是基于Volta架构。该处理器还配备了8GB 128位的LDDR4x内存,可提供59.7GB/s的带宽性能。

英伟达已经为用户提供了开发者套件,可以创建高性能的AI应用,并快速部署深度神经网络模型和常见的机器学习框架,比如Tensorflow和Pytorch等,除此之外也可以用到cuDNN、TensorRT和DeepStream等一系列软件库和加速工具。

Jetson Xavier NX最大的优势在于其Jetson产品线全部基于同一软件栈,所以可以直接套用更强大的Jetson AGX Xavier上的AI应用,只不过算力要稍低一截而已。凭借其21TOPS的AI算力,加上加速器提供的视频处理器性能,可以毫无压力地完成人体识别、自研语言处理、姿势检测和注视检测等AI应用,适用于自动光学检测和智能摄像头等一系列边缘IoT设备。

Hailo - Hailo-8

Hailo是一家来自于以色列的AI芯片公司,不少核心开发成员来自于以色列国防科技部门,主要负责为边缘设备开发高性能的AI处理器。早在2019年,Hailo就公布了其自研的边缘AI处理器Hailo-8,其算力可达26TOPS(INT8),但该处理器的典型功耗仅有2.5W。在完成了多轮融资后,Hailo也在今年开始了Hailo-8的量产。

55d3c90a-3b84-11ec-82a9-dac502259ad0.png

Hailo-8与Jetson产品的对比 / Hailo

与传统的CPU、GPU、DSP或硬件加速器的架构不同,Hailo在这款处理器上运用了自研的结构定义数据流架构。在ResNet-50的神经网络测试中,Hailo-8取得了1330FPS@3.2W的成绩。Hailo还在官网晒出出了Hailo-8与英伟达Jetson Nano与Xavier NX在ResNet和SSD_MobileNet等模型下的预期表现对比,我们从上图可以看出,Hailo-8在性能上优势明显,能耗比更是让英伟达的两款Jetson处理器望尘莫及。

Hailo还准备好了开源的Model Zoo,其中囊括了物体识别、分类、人脸检测识别等60多种计算机视觉任务的深度学习模型。开发者利用这些预训练的Tensorflow和ONNX模型,只需用上自己的数据重新训练,即可在Hailo设备上迅速创建好原型。

Mythic - M1076

美国德州的初创公司Mythic推出了利用存内计算技术的M1076模拟矩阵处理器(AMP)。单个M1076芯片的面积只有360mm2,却可以在3W至4W的功耗下提供35 TOPS的算力,与常见的SoC或GPU方案相比,功耗低了10倍以上。

但这并不是M1076的最大特色,与传统数字计算方式不同,Mythic在M1076上运用了模拟计算。模拟计算虽然理论上要要与数字计算,但长久以来收到尺寸的限制,在速度与扩展性上一直提不上去。然而Mythic通过将模拟运算与嵌入式闪存结合,选择了存内计算的方式。

M1076同时支持INT4、INT8和INT16三种数据类型,非常适合作为TinyML的开发平台。Mythic也为客户提供了物体识别/分类、图像分割和姿势评估等模型,可用于AR/VR中的智能健身和游戏等应用。

小结

云计算在边缘端的弱势使得边缘AI处理器有了崛起的机会,在工业4.0、自动化系统和智能IoT的潮流下,边缘AI还需要继续开拓应用场景,而不仅仅是用于机器视觉任务。边缘AI处理器厂商也必须继续提供更多的模型,帮助开发者加速边缘AI应用的落地。

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20378

    浏览量

    255619
  • 芯片
    +关注

    关注

    463

    文章

    54633

    浏览量

    470961
  • AI
    AI
    +关注

    关注

    91

    文章

    41980

    浏览量

    303077
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137422

原文标题:边缘AI处理器拼的不仅是算力和功耗

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    向成电子XC3588E+卡:3W低功耗,25 TOPS硬核算,重塑AI视觉边缘生态

    边缘AI视觉遇上低功耗高性能,一场工业与智能场景的革命正悄然发生。向成电子XC3588E高性能工控主板,凭借旗舰级RK3588芯片与工
    的头像 发表于 05-16 10:07 470次阅读
    向成电子XC3588E+<b class='flag-5'>算</b><b class='flag-5'>力</b>卡:3W低<b class='flag-5'>功耗</b>,25 TOPS硬核算<b class='flag-5'>力</b>,重塑<b class='flag-5'>AI</b>视觉<b class='flag-5'>边缘</b>生态

    Supermicro推出紧凑型高能效系统:以边缘重构AI应用新范式

    近日,全球IT解决方案领导者Supermicro(超微)宣布推出基于**AMD EPYC™ 4005系列处理器**的紧凑型高能效系统,以“小体积、大、低功耗”的颠覆性设计,为零售、
    的头像 发表于 04-22 14:58 2275次阅读

    5W功耗实现25TOPS,LM2-100-V0模组破解AI安防核心难题

    在智慧安防边缘AI应用快速部署需求的背景下,设备制造商常面临终端设备不足、功耗超标、体积受限、部署太慢等困境。模型越复杂,终端越吃力;设
    的头像 发表于 04-03 11:34 552次阅读
    5W<b class='flag-5'>功耗</b>实现25TOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>,LM2-100-V0<b class='flag-5'>算</b><b class='flag-5'>力</b>模组破解<b class='flag-5'>AI</b>安防核心难题

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    310P芯片的底层架构,深度剖析这款产品的技术细节、门槛及其在实际产业落地中的真实价值。 一、176TOPS的产业门槛:为何这是边缘
    发表于 03-10 14:19

    Genio 720处理器规格参数_MTK8391高核心板方案

    Genio 720(MT8391)处理器规格参数,采用先进的6nm制程工艺,兼顾高性能与低功耗,适配无风扇设计及电池供电移动设备需求。CPU架构:八核处理器,包含2颗Arm Cortex-A78核心
    的头像 发表于 01-12 19:57 534次阅读
    Genio 720<b class='flag-5'>处理器</b>规格参数_MTK8391高<b class='flag-5'>算</b><b class='flag-5'>力</b>核心板方案

    瑞芯微SOC智能视觉AI处理器

    需要连接多种外设的产品。显示: 支持双屏异显,最高4K@60fps输出。 RK1126B: 一款集成自研NPU的智能视觉AI处理器,专注于视频输入端的AI分析与处理。CPU: 双核A5
    发表于 12-19 13:44

    应对端侧AI、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    AI大模型正加速从云端向边缘与端侧渗透,然而,、内存、功耗等却成了制约其规模化落地的“高墙”。专为A
    的头像 发表于 12-18 13:45 606次阅读
    应对端侧<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、内存、<b class='flag-5'>功耗</b>“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    什么是AI边缘模组?​

    天数智AI边缘模组以其多元的产品矩阵、领先的技术实力和广泛的行业应用,正成为推动各行业智能化变革的重要力量。未来,天数智
    的头像 发表于 12-17 17:09 1136次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?​

    解锁边缘智能新境界,天数智AI边缘模组赋能端侧AI应用新篇章​

    在数字化与智能化飞速发展的时代,边缘计算正逐渐成为推动行业变革的关键力量。天数智紧跟技术浪潮,精心布局AI边缘
    的头像 发表于 12-12 09:16 956次阅读
    解锁<b class='flag-5'>边缘</b>智能新境界,天数智<b class='flag-5'>算</b><b class='flag-5'>AI</b><b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组赋能端侧<b class='flag-5'>AI</b>应用新篇章​

    解锁边缘智能新境界,天数智AI边缘模组赋能端侧AI应用新篇章​

    在数字化与智能化飞速发展的时代,边缘计算正逐渐成为推动行业变革的关键力量。天数智紧跟技术浪潮,精心布局AI边缘
    的头像 发表于 12-12 09:15 819次阅读
    解锁<b class='flag-5'>边缘</b>智能新境界,天数智<b class='flag-5'>算</b><b class='flag-5'>AI</b><b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组赋能端侧<b class='flag-5'>AI</b>应用新篇章​

    天波科普:超过30T的边缘计算服务可以做什么?

    网关的能力边界,也涉及到高低。那么,目前边缘计算服务到多少算高呢?以广东天波
    的头像 发表于 09-28 11:18 927次阅读
    天波科普:<b class='flag-5'>算</b><b class='flag-5'>力</b>超过30T的<b class='flag-5'>边缘</b>计算服务<b class='flag-5'>器</b>可以做什么?

    AI安防选什么主板?杰和IB3-761靠“精准+多接口”出圈

    任务。杰和科技AI力主板方案杰和科技推出AI力主板IB3-761,基于瑞芯微RK3568四核64位处理器开发,以精准
    的头像 发表于 09-22 16:45 21次阅读
    <b class='flag-5'>AI</b>安防选什么主板?杰和IB3-761靠“<b class='flag-5'>算</b><b class='flag-5'>力</b>精准+多接口”出圈

    EASY-EAI携手Hailo,推出高性能、高边缘AI硬件组合

    人工智能产品,以此满足高力场景需求。随着人工智能的不断发展,各类使用场景中,大模型对提出更高需求。Hailo-8作为一款边缘AI/ML
    的头像 发表于 07-25 15:22 1540次阅读
    EASY-EAI携手Hailo,推出高性能、高<b class='flag-5'>算</b><b class='flag-5'>力</b>的<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>硬件组合

    揭秘瑞芯微处理器,RK3576/RK3588强大搭档

    瑞芯微处理器-Gongga1(简称“贡嘎”),是瑞芯微针对旗舰芯片平台RK3576/RK3588等SoC平台配套的
    的头像 发表于 07-17 10:00 1686次阅读
    揭秘瑞芯微<b class='flag-5'>算</b><b class='flag-5'>力</b>协<b class='flag-5'>处理器</b>,RK3576/RK3588强大<b class='flag-5'>算</b><b class='flag-5'>力</b>搭档

    腾视科技TS-SG-SM7系列AI模组:32TOPS引擎,开启边缘智能新纪元

    从城市管理到工业生产,从物流运输到消费终端,TS-SG-SM7系列AI模组以 “超强、超低功耗
    的头像 发表于 07-07 16:44 2282次阅读
    腾视科技TS-SG-SM7系列<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组:32TOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>引擎,开启<b class='flag-5'>边缘</b>智能新纪元