0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔基于加速卡的FPGA生态系统布局

t1PS_TechSugar 来源:YXQ 2019-04-24 14:21 次阅读

作为加速云数据中心的重要组件,FPGA已经开始了它在数据中心领域的广泛使用。除了像微软、亚马逊这样的大型云服务提供商之外,FPGA也逐渐开始进入其他类型和规模的数据中心,并在大数据处理、AI网络功能加速等领域扮演者重要的角色。

(图片来自英特尔)

在这些基于大数据浪潮的全新应用中,FPGA厂商也在不断的探索和尝试新的FPGA推广方法。他们的最终目的非常简单,就是让更多的用户使用自己的FPGA产品。但在这个过程中,我们可以发现一个重要的发展趋势,那就是FPGA厂商正在逐渐的从单纯的芯片提供商,转变为系统级解决方案提供商

回首过去,在传统的FPGA业务模型里,FPGA厂商通常只负责卖给客户两样东西:一个是FPGA芯片,另外一个是FPGA的开发工具。两件东西一旦售出,客户开发何种应用就与厂商无关。虽然厂商也会提供详尽的技术支持,但主要的开发过程往往还是由客户完成。

如今,FPGA厂商更倾向于提供给客户一个完整的系统级解决方案。两大FPGA厂商英特尔和赛灵思目前纷纷推出的各类FPGA加速卡,就是这个趋势的典型代表。

总体而言,FPGA厂商在硬件层面已经不单单提供芯片级的产品,而是进一步提供板卡级的产品组合。与开发板不同,FPGA加速卡是针对特定领域和应用的专业板卡,通常以PCIe扩展卡的方式进行部署。板卡上设计有丰富的高速I/O接口与存储资源,但往往不会配备太多开发板上常见的调试功能与资源,例如通用I/O等。

在软件层面,FPGA厂商除了提供传统的开发套件之外,现在还会提供与FPGA加速卡配套的驱动、各类软件库、编程接口(API),甚至还有下文会提到的完整的软件开发栈以及软硬件参考设计。

通过提供这些完整的开发环境,大大简化了FPGA的开发难度,使得软件开发人员也能在短时间内完成算法模型的FPGA实现。FPGA厂商的主要目的,是在不断提供原厂软硬件解决方案的同时,也在不断吸收第三方的IP与应用,从而构建一个完整的FPGA生态系统

同时我们也注意到,除了FPGA原厂的加速卡方案之外,很多第三方厂家,比如华为、浪潮和Mellanox等,也相继推出了各自的FPGA加速卡产品。这些第三方加速卡虽然采用的都是英特尔或赛灵思的FPGA芯片,但都针对各自的细分领域做了优化设计,以适应目标应用的需要。

在下文中,我将详细介绍一下当前在市场上主要的FPGA加速卡产品,以及各个厂商基于加速卡的FPGA生态系统布局。

英特尔的FPGA加速卡布局

早在2017年10月,英特尔就官宣了旗下的首款FPGA加速卡产品,名为“Programmable Acceleration Card”,简称PAC。同时发布的,还有与之配套的软硬件开发框架与加速栈系统。这不仅是英特尔FPGA的首款通用FPGA加速卡产品,也是当时市场上的首款面向大数据、AI、高新能计算等新兴领域的数据中心FPGA加速卡,因此PAC的意义非同小可。

(图片来自英特尔)

在硬件规格方面,PAC使用了英特尔的Arria10 GX FPGA,它基于英特尔的20纳米工艺制造,拥有115万个可编程逻辑单元,是当时性能和容量最强大的英特尔FPGA。PAC集成了8GB的DDR4内存和128MB闪存,有一个QSFP+接口,能满足最高40Gbps的网络连接带宽,同时有PCIe Gen3 x8接口与主机CPU互联。

(图片来自英特尔)

值得注意的是,PAC的板级功耗约为45W~60W,因此得以采用了被动散热设计,从而将板卡的尺寸控制在了半高半长,方便在各类服务器的部署。

PAC的主要应用场景是加速数据中心的各类应用,作为英特尔的原厂产品,PAC在数据中心里有着得天独厚的优势。它天生可以作为英特尔Xeon处理器的硬件加速单元,用于卸载和加速原本在CPU上实现的各类应用,从而构成英特尔CPU+FPGA的高性能数据处理组合。

作为生态系统构建的重要组成部分,英特尔还发布了面向Xeon和FPGA的加速堆栈(Acceleration Stack),见下图。这个加速堆栈本质上是一个软件开发框架,包含了FPGA板卡的驱动、API、接口管理、软件库与开发工具等,从而为CPU与FPGA的联合开发提供了通用的编程接口,简化了开发流程,缩短了开发时间。

(图片来自英特尔)

为了向软件开发者进一步抽象底层的FPGA硬件资源,英特尔开源了名为“开放可编程加速引擎(Open Programmable Acceleration Engine - OPAE)”的技术。OPAE是一个层次化模型,提供了一系列标准的软件接口,以及常见硬件功能的FPGA实现,比如各类寄存器与内存分配逻辑等等。同时,也提供了很多操作系统内核空间的FPGA支持,使得开发者可以专注于用户空间的应用开发。

(图片来自英特尔)

PAC发布一年后,英特尔在2018年10月发布了另一款基于Statix10 SX FPGA的加速卡。相比前一代产品,这款加速卡在硬件性能上有了质的飞越。Stratix10作为英特尔的高端FPGA系列,基于英特尔的14纳米工艺制造,并采用了3D系统级封装技术,有着更高的集成度。在这款PAC采用的Stratix10 FPGA上,有280万可编程逻辑单元,244Mb片上内存以及高达26Gbps的串行收发器

(图片来自英特尔)

板上资源方面,这款PAC包含32GB DDR4内存、两个最高支持100Gbps网络带宽的QSFP28接口,以及PCIe Gen3 x16接口。由于这个板卡面向更高性能的数据中心应用,因此在功耗和尺寸方面都有所增加,其中板级功耗约为225W,尺寸为全高、3/4长的双槽设计。

(图片来自英特尔)

在2019年MWC大会的第一天,英特尔又推出了一款针对5G应用的FPGA加速卡PAC N3000,见下图。这款加速卡可以实现高达100Gbps的网络流量的加速处理,同时支持9GB DDR4和144MB QDR IV板上内存。

(图片来自英特尔)

对于英特尔的FPGA加速卡产品而言,它们最大的优势之一就是英特尔在数据中心处理器领域的核心支配地位。由于英特尔Xeon处理器占据了数据中心市场的x86处理器的绝大部分市场份额,因此无论何家的FPGA加速卡都必须针对Xeon处理器做大量的兼容性设计和优化,而英特尔FPGA在这方面有着先天的血统优势。这也使得英特尔成为目前唯一一个能够提供全栈式数据中心解决方案的公司

此外,英特尔与各大服务器制造商保持着良好的合作关系,因此包括戴尔、HPE、富士通等服务器制造商会很自然的在自家的服务器产品中加入并销售基于英特尔FPGA的加速卡。然而,这对于其他FPGA厂商而言就没有那么水到渠成,他们往往很难说服服务器厂商或者客户在已经内置了FPGA的服务器中,再花费额外的成本,并冒着兼容性的风险去添加其他的FPGA加速器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9428

    浏览量

    168878
  • FPGA芯片
    +关注

    关注

    3

    文章

    241

    浏览量

    39555

原文标题:【历史】从芯片到系统:FPGA加速卡的发展历程与展望

文章出处:【微信号:TechSugar,微信公众号:TechSugar】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浅谈AMD Ryzen AI PC生态系统

    AMD与OEM合作伙伴联想和华硕,以及生态系统合作伙伴百川智能、有道、游戏加加、生数、始智AI等共同努力,共庆龙年,并在大中华区扩展了Ryzen AI生态系统
    的头像 发表于 04-11 11:05 283次阅读

    为何高端FPGA都非常重视软件

    生态系统而享有盛誉的人),Vitis可能代表了其行为和理念的转变。Xilinx表示,他们所有的硬件加速库都在GitHub上发布,其运行时XRT也已开源。当然,所有这些开源仍然是最终以Xilinx硬件为
    发表于 03-23 16:48

    莱迪思举办2024莱迪思技术峰会展示其强大的FPGA合作生态系统

    莱迪思半导体近日在上海举办的2024年莱迪思技术峰会上展示了其强大且不断增长的全球生态系统,该生态系统由客户、IP和参考平台合作伙伴以及致力于推动FPGA创新的开发人员组成。
    的头像 发表于 03-14 15:10 243次阅读

    Meta欲打造巨型AI覆盖视频推荐生态系统

    Meta正计划打造一款巨型AI系统,以全面覆盖其视频推荐生态系统,为旗下产品提供统一的视频推荐引擎。
    的头像 发表于 03-11 11:14 271次阅读

    RadioVerse:技术和无线电设计生态系统

    电子发烧友网站提供《RadioVerse:技术和无线电设计生态系统.pdf》资料免费下载
    发表于 11-24 11:43 0次下载
    RadioVerse:技术和无线电设计<b class='flag-5'>生态系统</b>

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    AMD 推出为超低时延电子交易专属打造的基于FPGA加速卡

    加入到不断壮大的面向金融科技市场的超低时延解决方案生态系统—   2023 年 9 月 27 日,加利福尼亚州圣克拉拉讯 —— AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo
    发表于 10-07 14:43 135次阅读
    AMD 推出为超低时延电子交易专属打造的基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>加速卡</b>

    模拟矩阵在生态系统模拟中的应用

    维模拟矩阵在生态系统模拟中的应用主要是通过构建一个包含多个物种、生态系统和环境因素的模拟矩阵,来模拟和预测生态系统在不同条件下的动态变化和稳定性。 在生态系统模拟中,维模拟矩阵可以用来
    的头像 发表于 09-05 21:25 328次阅读

    STM32Cube生态系统助力开发者释放创造力

    STM32Cube生态系统,助力开发者释放创造力,本片文档主要介绍选型、原型评估、配置、编译、软件包、调试、烧录、监测和总结。
    发表于 09-05 06:10

    英特尔加入PyTorch基金会,通过PyTorch*推动AI普及

    不久前,英特尔宣布以Premier会员的身份加入PyTorch*基金会,并期待与各行各业的领军企业在开源PyTorch框架和生态系统上开展合作。PyTorch能够加速人工智能应用的开发,这将促进试验
    的头像 发表于 08-19 11:15 345次阅读

    RISC-V在快速发展的处理器生态系统中找到立足点

    生态系统存在很大的问题——开发人员的支持是可怜的。正在开发芯片架构的RISC-V International更多地谈论硬件,软件在优先级上遥遥领先。 Initial Support Since its
    发表于 08-11 18:20

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和
    发表于 08-04 06:34

    生态伙伴 | 华秋硬创联合长虹创投,共同打造更优生态系统

    ,获2轮及以上融资的企业占比达54%。 02生态伙伴介绍:长虹创投 长虹创投是长虹控股集团进行股权投资的平台,协同内外创新资源,结合产业资金优势,打造“基金+基地+联盟”的生态系统。 长虹创投主要开展直
    发表于 07-31 15:45

    gpt-4怎么用 英特尔Gaudi2加速卡GPT-4详细参数

    介绍GPT-4 详细参数及英特尔发布 Gaudi2 加速器相关内容,对大模型及 GPU 生态进行探讨和展望。英特尔发布高性价比Gaudi2加速卡
    发表于 07-21 10:50 627次阅读
    gpt-4怎么用 <b class='flag-5'>英特尔</b>Gaudi2<b class='flag-5'>加速卡</b>GPT-4详细参数

    GaN功率半导体与高频生态系统

    GaN功率半导体与高频生态系统(氮化镓)
    发表于 06-25 09:38