0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Achronix新一代嵌入式FPGA IP为AI/ML和网络硬件加速应用带来更高性能

独爱72H 来源:刘林华 作者:电子发烧友 2018-12-23 16:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2016年,Achronix推出的Speedcore成为首款向客户出货的嵌入式FPGA(eFPGA)IP,使客户将FPGA功能集成到他们的SoC中成为可能。由于Speedcore IP是专为计算和网络加速应用而设计的,并基于Speedster22i FPGA系列相同的高性能架构,采用Speedcore作为硬件加速器的方案被广泛应用到数据中心通信基础设施等领域。据了解,eFPGA IP授权业务在过去两年间快速增长,2017年,已经占到Achronix FPGA整体营收的20%,而2018年,凭借其显着的功耗和成本优势,eFPGA IP授权业务比重进一步提高。

本月,Achronix宣布推出第四代嵌入式FPGA产品Speedcore Gen4 eFPGA IP。较前代产品,Speedcore Gen4将性能提高了60%、功耗降低了50%、芯片面积减少65%,同时保留了原有的Speedcore eFPGA IP的功能,即可将可编程硬件加速功能引入广泛的计算、网络和存储应用,实现接口协议桥接/转换、算法加速和数据包处理。

图:Speedcore 7t较前代产品性能显著提升

据Achronix市场营销副总裁Steve Mensor介绍,创新的架构使这些性能提升成为可能。与上一代Speedcore产品相比,新的Speedcore Gen4架构实现了多项创新,从而可将系统整体性能提高60%。其中查找表的所有方面都得到了增强,以支持使用最少的资源来实现各种功能,从而可缩减面积和功耗并提高性能。其中的更改包括将ALU的大小加倍、将每个LUT的寄存器数量加倍、支持7位函数和一些8位函数、以及为移位寄存器提供的专用高速连接。

图:Achronix市场营销副总裁Steve Mensor

Speedcore Gen4的路由架构也借由一种独立的专用总线路由结构得到了增强。此外,在该路由结构中还有专用的总线多路复用器,可有效地创建分布式的、运行时可配置的交换网络。这为高带宽和低延迟应用提供了最佳的解决方案,并在业界首次实现了将网络优化应用于FPGA互连。

图:Speedcore Gen4架构为高性能总线提供了专用路由

易用性也是eFPGA的特色之一,降低了客户集成FPGA加速器的门槛。客户通过定制其逻辑、RAMDSP资源需求,Achronix接下来就会为其配置满足其需求的Speedcore IP,Speedcore查找表(LUT)、RAM单元模块和DSP64单元模块可以像乐高积木一样进行组合,以便为特定的应用创建优化的可编程功能。

根据艾瑞咨询的数据,2020年全球人工智能市场规模约1190亿人民币,未来10年,人工智能将会是一个2000亿美元的市场,空间非常巨大。

在人工智能领域,传统的芯片计算架构已无法支撑深度学习等大规模并行计算的需求,这就需要新的底层硬件来更好地储备数据、加速计算过程。其中,FPGA等用于性能加速的硬件、神经网络芯片、传感器与中间件,则是支撑人工智能的前提。新的Speedcore Gen4可谓最佳的人工智能/机器学习加速器。Achronix机器学习处理器(MLP)利用了人工智能/机器学习处理的特定属性,并将这些应用的性能提高了300%。这是通过多种架构性创新来实现的,这些创新可以同时提高每个时钟周期的性能和操作次数。

MLP是一个完整的人工智能/机器学习计算引擎,支持定点和多个浮点数格式和精度。每个机器学习处理器包括一个循环寄存器文件,它用来存储重用的权重或数据。各个机器学习处理器与相邻的机器学习处理器单元模块和更大的存储单元模块紧密耦合,以提供最高的处理性能、每秒最高的操作次数和最低的功率分集。这些机器学习处理器支持各种定点和浮点格式,包括Bfloat16、16位、半精度、24位和单元块浮点。用户可以通过为其应用选择最佳精度来实现精度和性能的均衡。

为了补充机器学习处理器并提高人工智能/机器学习的计算密度,Speedcore Gen4查找表(LUT)可以实现比任何独立FPGA芯片产品高出两倍的乘法器。领先的独立FPGA芯片在21个查找表可以中实现6x6乘法器,而Speedcore Gen4仅需在11个LUT中就可实现相同的功能,并可在1 GHz的速率上工作。

GSMA智库发布的最新的全球物联网市场报告显示,包括连接、应用、平台与服务,到2025年全球物联网市场规模将达到1.1万亿美元。数十亿物联网设备的出现,将给传统网络和计算基础设施带来压力。固定和无线网络带宽的急剧增加,加上处理能力向边缘等进行重新分配。这种新的处理范式意味着每秒将有数十亿到数万亿次的运算。传统云和企业数据中心计算资源和通信基础设施无法跟上数据速率的指数级增长、快速变化的安全协议、以及许多新的网络和连接要求。传统的多核CPU和SoC无法在没有辅助的情况下独立满足这些要求,因而它们需要硬件加速器,通常是可重新编程的硬件加速器,用来预处理和卸载计算,以便提高系统的整体计算性能。经过优化后的Speedcore Gen4 eFPGA已经可以满足这些应用需求。

Steve Mensor告诉21IC记者,现有已量产的Speedcore架构,Achronix可在6周内为客户配置并提供Speedcore eFPGA IP和支持文件。而最新采用台积电7nm工艺节点的Speedcore Gen4将于2019年上半年投入量产,芯片设计企业现已可以联系Achronix,以获得支持其特定需求的Speedcore Gen4实例。此外Achronix还将于2019年下半年提供用于台积电16nm和12nm工艺节点的Speedcore Gen4 eFPGA IP。据Steve Mensor预测,凭借Speedcore Gen4 eFPGA的功耗和成本优势,人工智能/机器学习和高数据带宽应用的爆炸式需求将推动其在边缘计算、5G、网络加速和计算加速等领域被广泛采纳,2019年,eFPGA IP授权业务有望达到Achronix FPGA整体营收的50%甚至更多。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22282

    浏览量

    630076
  • 硬件加速
    +关注

    关注

    0

    文章

    33

    浏览量

    11396
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式FPGA的区别

    嵌入式软件开发,主要与嵌入式cao作系统、应用软件等有关。第二是嵌入式硬件开发,需要掌握硬件
    发表于 11-20 07:12

    嵌入式FPGA的区别

    FPGA凭借硬件并行处理能力,能够实现纳秒级响应,远优于微秒级的嵌入式系统。 功耗效率上,嵌入式系统针对特定应用优化后能效比很高,而FPGA
    发表于 11-19 06:55

    常用硬件加速的方法

    之前总结了些常用硬件加速方法 1)面积换速度:也就是串转并运算,可以多个模块同时计算; 2)时间换空间:时序收敛下通过频率提高性能,虽然面积可能稍微加大点; 3)流水线操作:流水线以面积换
    发表于 10-29 06:20

    硬件加速模块的时钟设计

    硬件加速模块的每层涉及到多位数定点数乘法的运算需要调用dsp这个ip核,dsp处理数据的时钟信号为clk_c,dsp输出数据需要四个clk_c的时钟周期。 clk_n : clk_n
    发表于 10-23 07:28

    新一代嵌入式开发平台 AMD嵌入式软件和工具2025.1版现已推出

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。 2025.1 版嵌入式软件
    的头像 发表于 08-20 09:15 3616次阅读

    AMD 2025.1版嵌入式软件和工具的新增功能

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。
    的头像 发表于 08-15 15:32 1023次阅读

    Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布, AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性
    发表于 03-19 17:54

    嵌入式AI加速器DRP-AI 详细介绍

    深度神经网络中使用的人工智能(AI)已经IT领域提供了新的价值。虽然很多人期望用AI来实现嵌入式应用,但
    的头像 发表于 03-15 16:13 1522次阅读
    <b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器DRP-<b class='flag-5'>AI</b> 详细介绍

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的国产化。 5.未来发展趋势• 高性能与低功耗并重:未来,FPGA将朝着更高性能、更低功耗的方向发展,以满足AI应用对算力和能效的双重需求。• 开源
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    提高了系统的整体性能。 综上所述,FPGAAI时代的重要性不仅体现在其强大的硬件加速能力和高能效比上,更在于其高度的灵活性和定制化能力,使其能够适应不断变化的
    发表于 02-19 13:55

    FPGAAI方面有哪些应用

    随着人工智能技术的飞速发展,对计算性能的需求也日益增长。FPGA(现场可编程门阵列)作为高性能、低功耗、可灵活编程的硬件平台,正逐渐在
    的头像 发表于 01-06 17:37 2085次阅读

    意法半导体发布新一代微控制器,集成NPU加速器推动边缘AI

    )发展方面迈出了重要步。 新一代微控制器的问世,使得嵌入式AI得以真正发挥作用。该系列微控制器专为消费电子和工业产品等注重成本和功耗的领域设计,能够运行多种算法,如计算机视觉、音频处
    的头像 发表于 12-23 18:13 1198次阅读

    芯原推出新一代高性能Vitality架构GPU IP系列

    新一代Vitality GPU架构显著提升了计算性能,并支持多核扩展,以进步提升性能。该GPU架构集成了诸多先进功能,如个可配置的张量
    的头像 发表于 12-19 15:55 726次阅读

    芯华章推出新一代高性能FPGA原型验证系统

    华章科技,也在不断提升硬件验证的对应方案和产品能力。 HuaPro P3作为芯华章第三FPGA验证系统产品,采用最新一代可编程SoC芯片,结合自研的HPE Compiler工具链,可
    发表于 12-10 10:49 817次阅读
    芯华章推出<b class='flag-5'>新一代</b><b class='flag-5'>高性能</b><b class='flag-5'>FPGA</b>原型验证系统

    国产EDA公司芯华章科技推出新一代高性能FPGA原型验证系统

    作为国产EDA公司的芯华章科技,也在不断提升硬件验证的对应方案和产品能力。 HuaPro P3作为芯华章第三FPGA验证系统产品,采用最新一代可编程SoC芯片,结合自研的HPE Co
    发表于 12-10 09:17 1722次阅读
    国产EDA公司芯华章科技推出<b class='flag-5'>新一代</b><b class='flag-5'>高性能</b><b class='flag-5'>FPGA</b>原型验证系统