0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Flex Logix InferX X1M边缘推理加速器

星星科技指导员 来源:嵌入式计算设计 作者:嵌入式计算设计 2022-07-11 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

每种类型的边缘 AI 都有三个硬性和快速的技术要求:低功耗、小尺寸和高性能。当然,“小型”、“节能”或“高性能”的构成因用例而异,可以描述从小型微控制器到边缘服务器的所有内容,但通常您必须至少牺牲一个才能获得其他。

但是,一种可以解决从边缘云到端点的所有问题而无需牺牲的解决方案是 FPGA

几十年来,FPGA 一直用于提供低功耗、高性能的设计灵活性,无论应用程序或外形尺寸如何,但它们并不完全是用户友好的——复杂的 AI 模型和算法的不断发展加剧了这一事实。然而,在有挑战的地方通常也有机会,对于工业自动化、智慧城市、交通、医疗保健、农业和其他市场中的边缘人工智能用例,以及其他快速采用计算机视觉等功能的市场,机会以FlexLogix X1M 人工智能加速器。

Flex Logix X1M AI 加速器针对实时、高分辨率计算机视觉用例,这些用例运行基于 Yolov3、Yolov4 和 Yolov5 等模型的小批量深度学习工作负载。为了以比 NVIDIA Tesla T4、Xavier NX 或 Jetson TX2 等设备更高的每美元吞吐量提供视觉边缘推理,新的 X1M M.2 模块利用 Flex Logix 的 InferX X1 架构,将 4K INT8 MAC 内核组合成 64 个8 MB SRAM 和 4 GB 16 MTps LPDDR4X DRAM 支持 x 64 张量处理器阵列。

鉴于板载内存,X1M AI 加速器本身支持 PCI Express Gen 3 或 4 的 x2 通道作为主机总线协议。PCIe 支持不仅促进了张量阵列与内存和存储中的数据或模型之间的高速数据传输,还能够符合 M.2 2280 B+M 关键外形规格规格,尺寸为 22 mm (W) x 80 毫米(长)x 17 毫米深(包括散热器)。

X1M AI 加速器的大小与口香糖差不多,消耗的功率也比时钟收音机多一点,它真正占据了技术功率-性能尺寸维恩图的中心

InferX X1M 边缘推理加速器正在运行

该平台的张量阵列使其能够处理具有数百层、数十个并行通道和多种算子类型的深度神经网络,与 GPU 不同,它可以应用于批量小至 1 的百万像素图像。

尽管展示了 ASIC 的性能特征,但 InferX X1M 拥有 FPGA 独有的能力。其中包括可重新配置的数据路径,允许设备硬件适应新的和不同的模型技术,即使在现场部署之后也是如此。从本质上讲,这使这些设备能够面向未来。

重要的是,用户无需了解硬件开发语言或手动重新编程 FPGA 比特流即可访问这些功能以及控制逻辑等其他功能。这要归功于为用户提供对低级平台控制功能和监控功能的内部访问以及可用于应用程序配置或模型部署的外部访问的 API

此外,开放神经网络交换 (ONNX) 格式的兼容性允许 InferX X1M 工具以最佳方式自动将框架中表示的任何模型映射到 X1 加速器。

该解决方案支持在 Windows 和 Linux 操作环境中进行开发。

Flex Logix InferX X1M 加速器入门

除了上面列出的好处之外,InferX X1M 加速器的最大优势可能在于它使边缘 AI 和计算机视觉 OEM 和系统集成商不必设计自己的定制板。这些 M.2 模块设计用于在 0ºC 至 50ºC 的温度范围和 10% 至 90% 的相对非冷凝湿度范围内可靠地运行,所有这些都具有竞争力的成本。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • asic
    +关注

    关注

    34

    文章

    1269

    浏览量

    124052
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106795
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296556
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 423次阅读
    <b class='flag-5'>边缘</b>计算中的AI<b class='flag-5'>加速器</b>类型与应用

    航裕电源以大电流技术为国内外超导加速器项目提供优质方案

    航裕电源:以大电流技术,护航尖端科技 大科学装置建设热潮中,超导加速器作为探索微观世界、推动前沿科研的 “国之重”,对供电系统的稳定性、精度及功率提出极致要求。航裕电源以31.5kA、80kA万安
    的头像 发表于 10-12 15:02 1282次阅读

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供
    的头像 发表于 08-26 19:18 2581次阅读
    英特尔Gaudi 2E AI<b class='flag-5'>加速器</b>为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习加速器 AndesAIRE AnDLA I370。此产品专为
    的头像 发表于 08-20 17:43 1841次阅读

    研华科技推出紧凑型边缘AI推理系统AIR-120

    研华科技隆重宣布,推出紧凑型边缘AI推理系统——AIR-120。该系统搭载英特尔凌动x7433RE(Amston Lake)处理、酷睿i3-N305处理
    的头像 发表于 07-17 17:16 862次阅读

    大模型推理显存和计算量估计方法研究

    GPU、FPGA等硬件加速。通过分析硬件加速器的性能参数,可以估算模型在硬件加速下的计算量。 四、实验与分析 为了验证上述估计方法的有效性,我们选取了几个具有代表性的深度学习模型,在多个硬件平台
    发表于 07-03 19:43

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 2535次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    MAX7800X AI 微控制开发人员资源

    的 Arm M4F 微控制。CNN 加速器使用 μJ 的能量执行 AI 推理,为小型电池供电应用程序提供一条参与当前 AI 革命的途径。MAX78000 和 MAX78002 非常适
    的头像 发表于 05-14 15:09 1184次阅读
    MAX7800<b class='flag-5'>X</b> AI 微控制<b class='flag-5'>器</b>开发人员资源

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达
    的头像 发表于 05-06 14:15 1249次阅读
    <b class='flag-5'>边缘</b>AI运算革新 DeepX DX-<b class='flag-5'>M1</b> AI<b class='flag-5'>加速</b>卡结合Rockchip RK3588多路物体检测解决方案

    【米尔MYC-YM90X安路飞龙DR1开发板】安路科技 SALDRAGON开发板介绍

    。 5.1、开发套件硬件架构 核心板(MYC-YM90X)主控芯片:搭载安路科技DR1M90GEG484 FPGA SoC,集成95K逻辑单元、双核ARM Cortex-A35处理、NPU神经网络
    发表于 04-28 17:57

    【幸狐Omni3576边缘计算套件试用体验】RKNN 推理测试与图像识别

    【幸狐 Omni3576 边缘计算套件测评】RKNN 推理测试与图像识别 本文介绍了幸狐 Omni3576 边缘计算套件实现 RKNN 推理和图像物体识别的测试流程,包括 RKNN 介
    发表于 03-20 16:14

    小型加速器中子源监测系统解决方案

    小型加速器中子源是一种基于先进加速器技术的中子产生装置,凭借体积小、成本低、安全性高的优势,在医学、工业、科研、安全、能源等多个领域展现出巨大的应用潜力和价值。无论是用于医学领域的精准放疗,还是工业
    的头像 发表于 03-13 11:19 1145次阅读
    小型<b class='flag-5'>加速器</b>中子源监测系统解决方案

    AN207 GD32G5x3三角函数加速器TMU的使用说明

    电子发烧友网站提供《AN207 GD32G5x3三角函数加速器TMU的使用说明.pdf》资料免费下载
    发表于 01-21 17:30 2次下载
    AN207 GD32G5<b class='flag-5'>x</b>3三角函数<b class='flag-5'>加速器</b>TMU的使用说明

    EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器

    电子发烧友网站提供《EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器.pdf》资料免费下载
    发表于 01-07 14:12 0次下载
    EE-436:使用ADSP-SC59<b class='flag-5'>x</b>/2159<b class='flag-5'>x</b>高性能FIR/IIR<b class='flag-5'>加速器</b>

    STM32N647X0 高性能 Arm Cortex-M55 MCU、800MHz、4.2MB SRAM、Neural-ART 加速器 600 GOPS、NeoChrom GPU

    主要优点 在 MCU 上实现高性能边缘 AI 嵌入式专有神经处理单元 ST Neural-ART 加速器。 ® Arm Cortex-M55® 内核,频率为 800 MHz,是迄今为止最高
    的头像 发表于 12-30 11:18 4229次阅读
    STM32N647<b class='flag-5'>X</b>0 高性能 Arm Cortex-<b class='flag-5'>M</b>55 MCU、800MHz、4.2MB SRAM、Neural-ART <b class='flag-5'>加速器</b> 600 GOPS、NeoChrom GPU