0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenFive与EdgeCortix合作打造软件定义的边缘AI加速器

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-04-27 08:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)边缘计算从始至终都是一个让业界苦思冥想的问题,与云端计算这种集中式结构不同,边缘计算的分布式结构杜绝了“齐心办大事”的可能性。而且并非将体积依然不可小视的计算服务器部署在边缘端,就能解决边缘计算的一切要求,尤其是在边缘AI需求持续高涨的当下。

根据IDC的统计,到了2025年全球互联设备将达到416亿台,与此同时边缘传感器收集的数据将达到79.4ZB。在这么庞大的量下,边缘AI提出的要求却是高性能、低功耗,挑战确实不亚于手机SoC的开发了。即便如此,雨后春笋一般冒头的AI芯片公司还是在挑战“卷”的限度。

软件定义的边缘AI加速器

平时留意RISC-V动向的小伙伴们应该有所耳闻,3月中旬IP厂商Alphawave花了2亿美元收购SiFive旗下OpenFive。然而同样在3月,在收购之前,专注于高速连接SoC IP的OpenFive宣布了与AI初创公司EdgeCortix的合作,共同打造下一代的边缘AI加速器。

在软件定义的AI加速中,灵活度最高的还得属通用CPU,但一谈到能耗,就有些相形见绌了,与较为专一的GPU相比,从性能和能效上都有一定差距。然而GPU虽说能效高于GPU,但放在边缘端动辄几百瓦的功耗又太夸张了,因此特定领域的AI加速器虽然牺牲了一定的灵活性,但做到了最高的能效比,也因此被边缘AI所看重。

在这一理念下,EdgeCortix推出了动态神经加速器(DNA),一个运行时可重构的特定领域加速器设计,用于低功耗的实时AI推理应用,既可以部署在FPGA上,也可以部署在自研设计的ASIC芯片上。

SAKURA,正是基于该设计打造的一款高能效的边缘AI协处理器。与部分AI芯片不一样,SAKURA并没有选择5nm之类的先进工艺,而是选择了12nm的成熟工艺。在800MHz的频率下,SAKURA可以达到40TOPS的算力,在多芯片组合下更是可以达到200TOPS,搭载该芯片的PCIe板卡典型功耗只有10W到15W。

只谈性能不谈规模是毫无意义的,AI芯片厂商最喜欢拿来对比还是英伟达的各大GPU,这不,EdgeCortix也选择了同用台积电12nm工艺的英伟达AGX Xavier GPU来进行对比,可以看出AGX Xavier的面积近乎是SAKURA的四倍,在算力上依然比后者低上25%,两者能耗相差不大,但PPA上明显是SAKURA更胜一筹。

不过这也不是实际场景的比较,我们还是拿深度学习模型的测试结果来看,由于软件定义的特性,无论是在单芯多核和多芯的扩展下,SAKURA的异构计算单元都可以得到有效的利用。EdgeCortix给出了在YOLOv3这一实时物体检测算法中的比较,在同规模的数据下SAKURA的推理耗时最高可以做到AGX Xavier的16分之一。

这倒不是说SAKURA就一定是边缘AI的最优解,在给出的诸多对比中,大部分是Batch Size只有1下的测试结果,这是因为SAKURA对低Batch Size和INT8做过优化。更何况SAKURA对标的还是英伟达AGX Xavier、AGX Orin和高通Cloud AI 100这一档的边缘AI芯片。

模拟与AI

不久前,笔者曾介绍了AI初创公司Aspinity的AML100边缘AI芯片,主打处理传感器输出的模拟数据,来实现降低功耗的作用。近日,Aspinity透露了更多这款芯片的细节,并更新了一些数据。传统的数据Always On方案无论是在智能手机、智能手表还是智能家居产品中都已经普及,而且主打的就是低功耗,甚至低至数十uW。那么这种模拟AI芯片的优势又在哪呢?

传统的超低功耗芯片在提及功耗时,其实还是自身的功耗乃至待机时的功耗,而从传感器和ADC再到芯片的功耗,以及整个系统的功耗还是没那么容易忽略的。比如传统的Always On数字处理器架构系统在检测语音事件时,总功耗大概在3700uW左右,数字处理器的功耗还是占大头。

而在AML100组成的Always On系统中,传感器的功耗不变,而AML100可以做到40uW以下的功耗,这时由于AML100从模拟端接手了预处理和机器学习的任务,ADC和数字处理器端的功耗无限约接近0uW,因此总功耗要小于140uW,将整个系统的功耗降低了95%以上。

AML100终究还是一个用于事件唤醒的边缘AI芯片,面向破窗安全监测、语音唤醒之类的Always On应用,那么针对通用的边缘AI应用,它能否派上用场呢?

其实作用也是有的,AML100的定位本质上就是一个模拟层面上的预处理,可以有效减小数据集的大小,这样交给MCU或云端的数据会减少至多百倍,对于大部分边缘应用来说,处理数据的减少也近似等效于延长电池寿命了。

原文标题:边缘AI芯片正在数倍百倍地卷

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40305
  • 边缘计算
    +关注

    关注

    22

    文章

    3577

    浏览量

    53801
  • 边缘AI
    +关注

    关注

    2

    文章

    286

    浏览量

    6240

原文标题:边缘AI芯片正在数倍百倍地卷

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新

    全球物联网智能系统与嵌入式平台厂商研华科技宣布,与开创性的人工智能处理单元(AIPU)解决方案提供商Axelera AI开启全新战略合作,共同研发新一代搭载Europa AIPU的边缘人工智能
    的头像 发表于 05-14 10:24 339次阅读
    研华科技与Axelera <b class='flag-5'>AI</b>深化战略<b class='flag-5'>合作</b> <b class='flag-5'>加速</b>推动基于Europa平台的<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>创新

    边缘 AI 加速的 Arm® Cortex®‑M0+ MCU 如何为电子产品注入更强智能

    的神经网络模型。 · 在 MCU 上运行机器学习推理可实现唤醒词检测、手势识别和预测性维护等高级功能。 利用 MCU 提升边缘 AI 的普及度 如今的通用型 MCU,尤其是集成了 TI TinyEngine™ NPU 这类 AI
    的头像 发表于 03-25 09:22 384次阅读
    <b class='flag-5'>边缘</b> <b class='flag-5'>AI</b> <b class='flag-5'>加速</b>的 Arm® Cortex®‑M0+ MCU 如何为电子产品注入更强智能

    恩智浦携手COMPREDICT加速边缘AI在汽车应用落地

    恩智浦携手COMPREDICT将边缘AI带入汽车应用领域,降低车辆物料清单 (BoM) 成本,助力汽车制造商与一级供应商加速迈向更智能、软件驱动出行的转型。
    的头像 发表于 02-27 14:31 2258次阅读
    恩智浦携手COMPREDICT<b class='flag-5'>加速</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>在汽车应用落地

    使用NORDIC AI的好处

    ; 自定义 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的专用 AI 加速器,对 TensorFlow Lite 模型可实现最高约 15× 推理
    发表于 01-31 23:16

    Ceva在恩智浦的软件定义车辆处理上实现 实时人工智能加速

    恩智浦 * S32Z2 和 S32E2 实时处理集成 Ceva**的* * AI DSP* ,为软件定义车辆提供预测分析、能量管理和智能控制功能 随着车辆向
    的头像 发表于 01-09 11:14 821次阅读
    Ceva在恩智浦的<b class='flag-5'>软件</b><b class='flag-5'>定义</b>车辆处理<b class='flag-5'>器</b>上实现 实时人工智能<b class='flag-5'>加速</b>

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    之后,要打造的是高可靠性、高能效还支持可扩展的 RISC-V 设计方案。而且合作的核心目标特别明确: 让 RISC-V 处理在嵌入式、物联网、AI 系统里更快普及; 用集成式 IP
    发表于 12-18 12:01

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘
    的头像 发表于 11-06 13:42 1130次阅读
    <b class='flag-5'>边缘</b>计算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>类型与应用

    亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

    北京——2025年10月28日 ,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。第三期创业加速器持续聚焦AI
    的头像 发表于 10-29 15:18 1120次阅读

    此芯科技发布“合一”AI加速计划,赋能边缘与端侧AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和端侧AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业合作伙伴共同发起
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能<b class='flag-5'>边缘</b>与端侧<b class='flag-5'>AI</b>创新

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    Transformer和视觉Transformer模型。 ViTA是一种高效数据流AI加速器,用于在边缘设备上部署计算密集型视觉Transformer模型。 2、射频神经网络 2.1线性射频模拟处理
    发表于 09-12 17:30

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建推动与实体经济
    的头像 发表于 08-22 10:00 1466次阅读

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习加速器 Ande
    的头像 发表于 08-20 17:43 3231次阅读

    EASY-EAI携手Hailo,推出高性能、高算力的边缘AI硬件组合

    导读EASY-EAI与Hailo建立合作关系,共同推出高算力的边缘AI产品组合。此次合作,EASY-EAI将采用Hailo公司的AI
    的头像 发表于 07-25 15:22 1539次阅读
    EASY-EAI携手Hailo,推出高性能、高算力的<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>硬件组合

    Elektrobit 携手全球合作伙伴联合开发 EV.OS ---- 面向软件定义汽车的 AI 驱动汽车平台

    以 AI 为核心的智能汽车平台将加速软件定义出行的转型进程 德国埃朗根 2025年6月25日 /美通社/ -- Elektrobit 今日宣布与全球领先的电子制造商之一——鸿海科技集
    的头像 发表于 06-25 16:08 700次阅读

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 4467次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置