0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Flex Logix InferX X1M边缘推理加速器

星星科技指导员 来源:嵌入式计算设计 作者:嵌入式计算设计 2022-07-11 09:56 次阅读

每种类型的边缘 AI 都有三个硬性和快速的技术要求:低功耗、小尺寸和高性能。当然,“小型”、“节能”或“高性能”的构成因用例而异,可以描述从小型微控制器到边缘服务器的所有内容,但通常您必须至少牺牲一个才能获得其他。

但是,一种可以解决从边缘云到端点的所有问题而无需牺牲的解决方案是 FPGA

几十年来,FPGA 一直用于提供低功耗、高性能的设计灵活性,无论应用程序或外形尺寸如何,但它们并不完全是用户友好的——复杂的 AI 模型和算法的不断发展加剧了这一事实。然而,在有挑战的地方通常也有机会,对于工业自动化、智慧城市、交通、医疗保健、农业和其他市场中的边缘人工智能用例,以及其他快速采用计算机视觉等功能的市场,机会以FlexLogix X1M 人工智能加速器。

Flex Logix X1M AI 加速器针对实时、高分辨率计算机视觉用例,这些用例运行基于 Yolov3、Yolov4 和 Yolov5 等模型的小批量深度学习工作负载。为了以比 NVIDIA Tesla T4、Xavier NX 或 Jetson TX2 等设备更高的每美元吞吐量提供视觉边缘推理,新的 X1M M.2 模块利用 Flex Logix 的 InferX X1 架构,将 4K INT8 MAC 内核组合成 64 个8 MB SRAM 和 4 GB 16 MTps LPDDR4X DRAM 支持 x 64 张量处理器阵列。

鉴于板载内存,X1M AI 加速器本身支持 PCI Express Gen 3 或 4 的 x2 通道作为主机总线协议。PCIe 支持不仅促进了张量阵列与内存和存储中的数据或模型之间的高速数据传输,还能够符合 M.2 2280 B+M 关键外形规格规格,尺寸为 22 mm (W) x 80 毫米(长)x 17 毫米深(包括散热器)。

X1M AI 加速器的大小与口香糖差不多,消耗的功率也比时钟收音机多一点,它真正占据了技术功率-性能尺寸维恩图的中心

InferX X1M 边缘推理加速器正在运行

该平台的张量阵列使其能够处理具有数百层、数十个并行通道和多种算子类型的深度神经网络,与 GPU 不同,它可以应用于批量小至 1 的百万像素图像。

尽管展示了 ASIC 的性能特征,但 InferX X1M 拥有 FPGA 独有的能力。其中包括可重新配置的数据路径,允许设备硬件适应新的和不同的模型技术,即使在现场部署之后也是如此。从本质上讲,这使这些设备能够面向未来。

重要的是,用户无需了解硬件开发语言或手动重新编程 FPGA 比特流即可访问这些功能以及控制逻辑等其他功能。这要归功于为用户提供对低级平台控制功能和监控功能的内部访问以及可用于应用程序配置或模型部署的外部访问的 API

此外,开放神经网络交换 (ONNX) 格式的兼容性允许 InferX X1M 工具以最佳方式自动将框架中表示的任何模型映射到 X1 加速器。

该解决方案支持在 Windows 和 Linux 操作环境中进行开发。

Flex Logix InferX X1M 加速器入门

除了上面列出的好处之外,InferX X1M 加速器的最大优势可能在于它使边缘 AI 和计算机视觉 OEM 和系统集成商不必设计自己的定制板。这些 M.2 模块设计用于在 0ºC 至 50ºC 的温度范围和 10% 至 90% 的相对非冷凝湿度范围内可靠地运行,所有这些都具有竞争力的成本。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • asic
    +关注

    关注

    34

    文章

    1137

    浏览量

    119240
  • 神经网络
    +关注

    关注

    42

    文章

    4560

    浏览量

    98622
  • AI
    AI
    +关注

    关注

    87

    文章

    26323

    浏览量

    263933
收藏 人收藏

    评论

    相关推荐

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器
    的头像 发表于 04-16 09:10 1579次阅读
    Arm推动生成式AI落地<b class='flag-5'>边缘</b>!全新Ethos-U85 AI<b class='flag-5'>加速器</b>支持Transformer 架构,性能提升四倍

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一种重要的实验设备,用于研究粒子物理学、核物理学等领域。其主要原理是通过电场和磁场的作用,对带电粒子进行加速,在高速运动过程中使其获得较大的动
    的头像 发表于 12-18 13:52 843次阅读

    在CCES环境下如何使用21489的IIR加速器

    在VDSP++的环境下程序已经实现,但是到了CCES下,把中断初始化函数修改了,还是无法正确配置中断,直接返回IIR的中断初始化失败,请问CCES下怎么使用IIR加速器
    发表于 11-30 08:20

    21489的IIR加速器滤波参数设置如何对应加速器的滤波参数?

    目前在用21489内部的IIR加速器去做一个低通滤波,在例程的基础上修改参数。通过平板的fda 工具工具去设计参数,但是设计出来的参数不知道如何对应加速器的滤波参数,手册里也看得不是很明白。 设计的参数如下: 请问
    发表于 11-30 08:11

    使用ADSP-21489的fir加速器时,存在很大的噪音如何解决?

    您好!当我使用ADSP-21489的fir加速器时,存在很大的噪音,未知如何解决,希望这里有高人帮我解决。 附件上有工程,该工程参考iir加速器使用例子编写。
    发表于 11-30 07:49

    使用赛灵思Alveo加速器加速DNN

    电子发烧友网站提供《使用赛灵思Alveo加速器加速DNN.pdf》资料免费下载
    发表于 09-18 09:27 0次下载
    使用赛灵思Alveo<b class='flag-5'>加速器</b>卡<b class='flag-5'>加速</b>DNN

    《 AI加速器架构设计与实现》+第2章的阅读概括

    。 从名字上就能看出来书里可能覆盖的内容是和CNN加速器有关的内容了。 作者在前言里说这本书主要讨论Inference(推理)的过程,“主要讨论神经网络硬件,尤其是芯片设计层面的内容”。这本书的第2,3章
    发表于 09-17 16:39

    Rapanda流加速器-实时流式FPGA加速器解决方案

    电子发烧友网站提供《Rapanda流加速器-实时流式FPGA加速器解决方案.pdf》资料免费下载
    发表于 09-13 10:17 0次下载
    Rapanda流<b class='flag-5'>加速器</b>-实时流式FPGA<b class='flag-5'>加速器</b>解决方案

    SynSense将开发基于铁电技术的超低功耗边缘AI加速器

    SynSense时识科技宣布成功斩获欧盟边缘人工智能项目Ferro4EdgeAI,将联合11家知名研发机构及企业,开发基于低成本、高密度、多级铁电(FE)存储技术及存内计算范式的超低功耗边缘人工智能加速器
    发表于 09-08 10:21 261次阅读

    华秋硬创联合安创加速器加速和创新赋能技术驱动型创业者

    参赛项目提供中国电子产业资源专属支持: 1、总决赛前3名获奖项目获得优先入选安创成长营的机会; 2、基于安创加速器的属性,通过整合上下游产业链资源,按各自需求为总决赛前5名获奖项目,对接相应资源,实现
    发表于 08-18 14:37

    Intel媒体加速器参考软件用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和
    发表于 08-04 07:07

    英特尔媒体加速器参考软件发行说明

    使用 Linux* 版本的这些发布注释来审查 Intel 媒体加速器参考软件的最新修改和改进。 您将会发现PDF 中的最新功能、 最著名的配置、 硬件和软件兼容性以及已知问题 。
    发表于 08-04 06:57

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和
    发表于 08-04 06:34

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    的设计 摸清加速器设计中遇到的具体问题及其解决方法 了解NPU架构需要考虑的控制通路和数据通路 从算法角度看,神经网络分Training(训练)和Inference(推理)两个过程,本书主要讨论
    发表于 07-28 10:50

    IMX8PLUS需要为M2 TPU加速器启用MSI-X,要怎么操作才可以实现?

    你好。我们正在与 pycoral github 技术支持合作,以便为即将到来的网关部署集成他们的 M.2 Edge TPU 加速器。在 Intel Atom SBC 上测试正常,但我们想推出
    发表于 04-26 06:27