0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FPGA、eFPGA、加速卡,全面应对多样化的边缘AI

21克888 来源:电子发烧友网 作者:黄晶晶 2022-07-13 16:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

与将数据处理集中在云计算设施或数据中心进行云端训练和推理的模式不同,边缘AI在本地就能给终端设备提供智能化功能,并且具有低延迟、隐私保护等优势。据市场咨询公司ABI Research的数据显示,预计到2025年,边缘AI芯片市场的收入将达到122亿美元,云AI芯片市场的收入将达到119亿美元,边缘AI芯片市场将超过云AI芯片组市场。边缘AI芯片当前主要用于AI推理,未来可实现边缘AI训练乃至自主学习,从而使得边缘AI更加智能。由于边缘AI的兴起,不同于云端AI的GPU占据主流,FPGAASIC等芯片在边缘AI的价值得到更多体现。

最近,电子发烧友采访到Achronix中国区总经理郭道正,郭总分享了作为一家FPGA厂商怎么看到边缘AI,以及Achronix有哪些先进的解决方案等话题。

边缘AI对FPGA和eFPGA的需求


郭道正表示,边缘AI将在智能化时代发挥巨大的作用,但是边缘AI的应用场景数量众多,这意味着它们需要不同的计算器件和算力等级。这也意味着边缘的计算架构应该有很高的灵活性,而这正是FPGA技术在提供并行计算的同时还能提供的。在工业应用中还有一些特殊的要求,如工业通信协议转换或者时常更新等,而FPGA是满足这些要求的最好技术。

Achronix中国区总经理郭道正



他进一步指出,实际上,边缘AI也不得不面临许多云端推理/机器学习不会面对的制约因素,如系统的大小、功耗和成本等;同时,边缘AI的计算设备不得不面临来自于各种各样的传感器等数据源的数据;此外,这些数据可能还是通过不同的专用通信协议传输过来的,这在许多垂直行业中非常常见。因此,边缘AI的计算架构必须拥有足够的灵活性和可编程性,这也就是我们认为FPGA是边缘AI最好技术之一。

不过正因为边缘AI面对的复杂性,因此独立FPGA似乎并不能完全满足所需。因此,Achronix为解决方案提供商提供了eFPGA IP。郭道正说道:“在他们自己面向边缘AI推出的ASIC或SoC等芯片上,他们可以在其特有的计算器件旁边引入我们的Speedcore eFPGA IP来作为硬件加速器,从而为整个边缘AI解决方案带来非常高的性价比和能效,并同时为新的应用场景、新的算法、新的协议甚至新的传感器保持足够的灵活性。”

全面FPGA技术和三大产品组合


Achronix为边缘AI提供了全面的FPGA技术和产品组合。Achronix的解决方案包括Speedster7t系列独立FPGA芯片、Speedcore eFPGA IP和VectorPath加速卡,所有这些都由Achronix ACE工具链提供支持。

Speedster7t系列独立FPGA芯片

据介绍,Speedster7t FPGA的特点是在其高性能、高密度逻辑阵列之外,还具有二维片上网络(2D NoC)和机器学习处理器(MLP),该器件采用7nm工艺打造。这样,开发人员就不必担心数据在流进流出以及芯片内部流动的带宽。

具体来看,Speedster7t FPGA架构的各个方面都经过了优化,以便为AI/ML应用创建一个优化的、平衡的、大规模并行的计算引擎。每个Speedster7t FPGA都具有一个大规模并行的可编程计算单元阵列,并被整合成全新的机器学习处理器(MLP)模块。每个MLP都是一个高度可配置的、计算密集型的单元模块,具有多达32个乘法器,支持4到24位的整数格式和各种浮点格式,包括直接支持Tensorflow的bfloat16格式和块浮点(BFP)格式。同时,Speedster7t系列FPGA芯片中集成的2D NoC可以全面消除芯片内外部的数据传输瓶颈。

嵌入式FPGA(eFPGA)

异构计算是边缘AI发展中非常确信的趋势之一,因此许多边缘计算解决方案采用的高集成度系统级芯片(SoC)或专用集成电路(ASIC)都集成了嵌入式FPGA(eFPGA),从而可以帮助解决方案提供商为垂直行业开发边缘AI解决方案,并为特定的边缘应用场所打造专门的解决方案。在部署的规模不断提升之际,一个SoC或者ASIC解决方案的规模经济效应将更加明显。

Speedcore嵌入式FPGA(eFPGA)IP为ASIC和SoC带来了强大的和灵活的可编程逻辑。客户可以将Speedcore eFPGA集成到ASIC或SoC中,可用于高性能、计算密集型和实时处理应用,诸如人工智能(AI)、机器学习(ML)、5G无线、网络、存储和汽车。当然,它也可以用于这些领域中的大量边缘AI应用。

郭道正表示,与独立FPGA芯片的设计过程不同,eFPGA设计人员可以针对客户应用,选择所需逻辑、DSP(或MLP)、2D NoC和存储资源的确切数量。当需要灵活性时,业界也可以使用eFPGA,同时通过消除独立FPGA的多余功能来降低系统成本、功耗和电路板面积,诸如高速I/O这些功能在以SoC或者ASIC形态进入大批量生产时是不需要的。

VectorPath S7t-VG6加速卡

VectorPath S7t-VG6加速卡旨在为人工智能(AI)、机器学习(ML)、网络和数据中心应用开发高性能计算和加速功能时,缩短产品上市时间。该加速卡采用了Achronix的高性能Speedster7t AC7t1500 FPGA。VectorPath S7t-VG6是Achronix与领先的企业级FPGA加速器产品供应商BittWare联合开发,可提供400G和200G以太网接口、GDDR6总存储带宽高达4 Tbps以及一整套软件和工具,可以立即开始使用。

凭借这一独特的产品组合,解决方案提供商能够使用VectorPath加速卡为制造领域快速开发边缘AI/ML解决方案,可适用于不同的垂直市场。此外,解决方案提供商可以将其硬件解决方案集成到带有Speedcore eFPGA的SoC或ASIC之中,并将FPGA开发移植到芯片中,为制造领域的边缘AI提供最高的成本效益和功耗效率。

发展规划


边缘AI不仅得到了FPGA、ASIC厂商的重视,我们看到现在一些厂商在MCU当中集成AI加速器使得MCU更加智能。对于这样的边缘AI趋势,郭道正认为,MCU只是在边缘使用的处理器品类之一。由于边缘应用的多样性,在不同垂直领域或者应用场景中可能需要MCU、通用处理器、应用处理器甚至诸如PLC等技术领域中的特定处理器,而且它们已经在不同的应用场景中构筑了自己相应的优势和生态系统。而当智能化时代到来之后,所有这些处理器都有一个共同的需求:它们都需要硬件加速器来高效地处理AI/ML算法,这也是边缘计算领域中非常清晰的异构计算大趋势。

他说道,与仅用传统处理器来运行AI/ML算法的模式相比,FPGA是最高效的硬件数据处理加速器之一。FPGA技术在边缘计算方面的应用包括板级、芯片级和eFPGA等形式,但是Achronix是唯一一家提供独立FPGA芯片、eFPGA IP和加速卡的供应商,并提供了完整的ACE开发工具来支持所有种类的应用。据此,边缘AI解决方案提供商可以为其应用和其他要求选择最好的解决方案,并高效地重复使用他们的开发成果和IP。

面对如今规模高达100亿美元并且还在不断扩展的硬件加速器市场。Achronix也部署了多项举措。郭道正谈到,其一是Achronix一直在不断扩大自己的团队,这既包括不断扩大的高层管理人员团队,他们为Achronix带来了在不用领域内丰富的经验或者技术特长,而且还包括我们一直在延聘的开发、工程、运营和客户支持团队成员。在中国,我们也在进一步扩大中国团队,以确保客户的成功。

其二,除了组织架构性扩展,Achronix也在不断将FPGA技术推向更远的新领域。例如,先进的封装可以支持Achronix基于chiplet技术构建模块化产品。通过利用先进的封装,Achronix可以更快地进行创新以满足多个市场的需求,而不必为每一代新产品重新设计整个单片FPGA器件。展望未来,云和边缘计算、网络设备、人工智能和机器学习、5G/6G无线网络设备、金融科技、工业和汽车等领域都是Achronix在未来5年内主要的市场机遇。
通过前面对挑战和解决方案的分析,我们可以发现FPGA技术是边缘AI硬件平台的最佳选择,以应对来自技术、经济规模和面向未来的解决方案等挑战。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1656

    文章

    22298

    浏览量

    630471
  • IP
    IP
    +关注

    关注

    5

    文章

    1849

    浏览量

    154943
  • Achronix
    +关注

    关注

    1

    文章

    78

    浏览量

    22966
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产
    的头像 发表于 11-14 08:21 9539次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,一<b class='flag-5'>卡</b>双芯重构<b class='flag-5'>AI</b>推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小
    的头像 发表于 10-10 08:59 2150次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是一款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 545次阅读
    新品 | LLM-8850 Card, AX8850<b class='flag-5'>边缘</b>设备<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    此芯科技发布“合一”AI加速计划,赋能边缘与端侧AI创新

    产品组合,覆盖从1.5B至32B参数规模的端侧AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署需求,推动AI技术从云端向边缘高效落地。“合一”
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能<b class='flag-5'>边缘</b>与端侧<b class='flag-5'>AI</b>创新

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:可重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC AI芯片
    发表于 09-12 16:07

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他
    的头像 发表于 06-05 13:39 1306次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    适配多种系统,米尔瑞芯微RK3576核心板解锁多样化应用

    米尔电子发布的基于瑞芯微 RK3576 核心板和开发板,具备高性能数据处理能力、领先的AI智能分析功能、多样化的显示与操作体验以及强大的扩展性与兼容性,适用于多种应用场景。目前米尔电子为
    发表于 05-23 16:07

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 554次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    Agilex(高端)、Stratix(高性能)、Arria(中端)、Cyclone(低成本)等系列,满足从数据中心到工业自动多样化需求。技术特点:可重构性:支持“现场编程”,灵活适配AI、5G
    发表于 04-25 10:19

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 4108次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出一套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 951次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的三重革命1) 硬件架构革命:英特尔IPU路线图显示,到2026年将推出FPGA+Xeon的异构加速卡;AMD计划2023年集成Xilinx AI Engine的CPU芯片...... 2) 系统集成革命
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    ,开发人员可以根据具体应用需求重新配置硬件逻辑。这种灵活性使得FPGA能够适应不断变化的AI算法和应用场景,而无需更换硬件。 • 定制加速FPG
    发表于 02-19 13:55

    FPGAAI方面有哪些应用

    提供了强有力的支持。 一、FPGA 在深度学习中的应用 深度学习是 AI 的重要分支,涉及海量的数据运算。FPGA 能够针对深度学习算法中的卷积、池等核心运算进行硬件
    的头像 发表于 01-06 17:37 2120次阅读