0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔基于加速卡的FPGA生态系统布局

t1PS_TechSugar 来源:YXQ 2019-04-24 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为加速云数据中心的重要组件,FPGA已经开始了它在数据中心领域的广泛使用。除了像微软、亚马逊这样的大型云服务提供商之外,FPGA也逐渐开始进入其他类型和规模的数据中心,并在大数据处理、AI、网络功能加速等领域扮演者重要的角色。

(图片来自英特尔)

在这些基于大数据浪潮的全新应用中,FPGA厂商也在不断的探索和尝试新的FPGA推广方法。他们的最终目的非常简单,就是让更多的用户使用自己的FPGA产品。但在这个过程中,我们可以发现一个重要的发展趋势,那就是FPGA厂商正在逐渐的从单纯的芯片提供商,转变为系统级解决方案提供商

回首过去,在传统的FPGA业务模型里,FPGA厂商通常只负责卖给客户两样东西:一个是FPGA芯片,另外一个是FPGA的开发工具。两件东西一旦售出,客户开发何种应用就与厂商无关。虽然厂商也会提供详尽的技术支持,但主要的开发过程往往还是由客户完成。

如今,FPGA厂商更倾向于提供给客户一个完整的系统级解决方案。两大FPGA厂商英特尔和赛灵思目前纷纷推出的各类FPGA加速卡,就是这个趋势的典型代表。

总体而言,FPGA厂商在硬件层面已经不单单提供芯片级的产品,而是进一步提供板卡级的产品组合。与开发板不同,FPGA加速卡是针对特定领域和应用的专业板卡,通常以PCIe扩展卡的方式进行部署。板卡上设计有丰富的高速I/O接口与存储资源,但往往不会配备太多开发板上常见的调试功能与资源,例如通用I/O等。

在软件层面,FPGA厂商除了提供传统的开发套件之外,现在还会提供与FPGA加速卡配套的驱动、各类软件库、编程接口(API),甚至还有下文会提到的完整的软件开发栈以及软硬件参考设计。

通过提供这些完整的开发环境,大大简化了FPGA的开发难度,使得软件开发人员也能在短时间内完成算法模型的FPGA实现。FPGA厂商的主要目的,是在不断提供原厂软硬件解决方案的同时,也在不断吸收第三方的IP与应用,从而构建一个完整的FPGA生态系统

同时我们也注意到,除了FPGA原厂的加速卡方案之外,很多第三方厂家,比如华为、浪潮和Mellanox等,也相继推出了各自的FPGA加速卡产品。这些第三方加速卡虽然采用的都是英特尔或赛灵思的FPGA芯片,但都针对各自的细分领域做了优化设计,以适应目标应用的需要。

在下文中,我将详细介绍一下当前在市场上主要的FPGA加速卡产品,以及各个厂商基于加速卡的FPGA生态系统布局。

英特尔的FPGA加速卡布局

早在2017年10月,英特尔就官宣了旗下的首款FPGA加速卡产品,名为“Programmable Acceleration Card”,简称PAC。同时发布的,还有与之配套的软硬件开发框架与加速栈系统。这不仅是英特尔FPGA的首款通用FPGA加速卡产品,也是当时市场上的首款面向大数据、AI、高新能计算等新兴领域的数据中心FPGA加速卡,因此PAC的意义非同小可。

(图片来自英特尔)

在硬件规格方面,PAC使用了英特尔的Arria10 GX FPGA,它基于英特尔的20纳米工艺制造,拥有115万个可编程逻辑单元,是当时性能和容量最强大的英特尔FPGA。PAC集成了8GB的DDR4内存和128MB闪存,有一个QSFP+接口,能满足最高40Gbps的网络连接带宽,同时有PCIe Gen3 x8接口与主机CPU互联。

(图片来自英特尔)

值得注意的是,PAC的板级功耗约为45W~60W,因此得以采用了被动散热设计,从而将板卡的尺寸控制在了半高半长,方便在各类服务器的部署。

PAC的主要应用场景是加速数据中心的各类应用,作为英特尔的原厂产品,PAC在数据中心里有着得天独厚的优势。它天生可以作为英特尔Xeon处理器的硬件加速单元,用于卸载和加速原本在CPU上实现的各类应用,从而构成英特尔CPU+FPGA的高性能数据处理组合。

作为生态系统构建的重要组成部分,英特尔还发布了面向Xeon和FPGA的加速堆栈(Acceleration Stack),见下图。这个加速堆栈本质上是一个软件开发框架,包含了FPGA板卡的驱动、API、接口管理、软件库与开发工具等,从而为CPU与FPGA的联合开发提供了通用的编程接口,简化了开发流程,缩短了开发时间。

(图片来自英特尔)

为了向软件开发者进一步抽象底层的FPGA硬件资源,英特尔开源了名为“开放可编程加速引擎(Open Programmable Acceleration Engine - OPAE)”的技术。OPAE是一个层次化模型,提供了一系列标准的软件接口,以及常见硬件功能的FPGA实现,比如各类寄存器与内存分配逻辑等等。同时,也提供了很多操作系统内核空间的FPGA支持,使得开发者可以专注于用户空间的应用开发。

(图片来自英特尔)

PAC发布一年后,英特尔在2018年10月发布了另一款基于Statix10 SX FPGA的加速卡。相比前一代产品,这款加速卡在硬件性能上有了质的飞越。Stratix10作为英特尔的高端FPGA系列,基于英特尔的14纳米工艺制造,并采用了3D系统级封装技术,有着更高的集成度。在这款PAC采用的Stratix10 FPGA上,有280万可编程逻辑单元,244Mb片上内存以及高达26Gbps的串行收发器

(图片来自英特尔)

板上资源方面,这款PAC包含32GB DDR4内存、两个最高支持100Gbps网络带宽的QSFP28接口,以及PCIe Gen3 x16接口。由于这个板卡面向更高性能的数据中心应用,因此在功耗和尺寸方面都有所增加,其中板级功耗约为225W,尺寸为全高、3/4长的双槽设计。

(图片来自英特尔)

在2019年MWC大会的第一天,英特尔又推出了一款针对5G应用的FPGA加速卡PAC N3000,见下图。这款加速卡可以实现高达100Gbps的网络流量的加速处理,同时支持9GB DDR4和144MB QDR IV板上内存。

(图片来自英特尔)

对于英特尔的FPGA加速卡产品而言,它们最大的优势之一就是英特尔在数据中心处理器领域的核心支配地位。由于英特尔Xeon处理器占据了数据中心市场的x86处理器的绝大部分市场份额,因此无论何家的FPGA加速卡都必须针对Xeon处理器做大量的兼容性设计和优化,而英特尔FPGA在这方面有着先天的血统优势。这也使得英特尔成为目前唯一一个能够提供全栈式数据中心解决方案的公司。

此外,英特尔与各大服务器制造商保持着良好的合作关系,因此包括戴尔、HPE、富士通等服务器制造商会很自然的在自家的服务器产品中加入并销售基于英特尔FPGA的加速卡。然而,这对于其他FPGA厂商而言就没有那么水到渠成,他们往往很难说服服务器厂商或者客户在已经内置了FPGA的服务器中,再花费额外的成本,并冒着兼容性的风险去添加其他的FPGA加速器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179358
  • FPGA芯片
    +关注

    关注

    3

    文章

    250

    浏览量

    40866

原文标题:【历史】从芯片到系统:FPGA加速卡的发展历程与展望

文章出处:【微信号:TechSugar,微信公众号:TechSugar】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    吉方工控亮相2025英特尔技术创新与产业生态大会

    2025年11月19日至20日,由英特尔公司主办的年度重磅盛会——2025英特尔技术创新与产业生态大会(Intel Connection)暨英特尔行业解决方案大会(Edge Indus
    的头像 发表于 11-24 16:57 465次阅读

    创芯赋能智能生态!汇顶科技亮相2025英特尔技术创新与产业生态大会

    11月19–21日,2025英特尔技术创新与产业生态大会在重庆盛大启幕。作为英特尔生态的重要合作伙伴,汇顶科技携人机交互、指纹识别等多项PC端创新成果,为
    的头像 发表于 11-21 15:00 5144次阅读
    创芯赋能智能<b class='flag-5'>生态</b>!汇顶科技亮相2025<b class='flag-5'>英特尔</b>技术创新与产业<b class='flag-5'>生态</b>大会

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    于OpenVINO™ 构建的 AI 软件平台的可扩展性,英特尔助力ISV生态伙伴率先实现应用端Day 0 模型适配,大幅加速了新模型的落地进程,彰显了 “硬件 + 模型 + 生态” 协
    的头像 发表于 08-07 14:42 1124次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套
    的头像 发表于 06-27 11:44 623次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力AI<b class='flag-5'>系统</b>高效运转

    英特尔i210网参考设计

    英特尔i210网参考设计,PCIe2.0接口接CPU,MDI接变压器。包括原理图DSN文件和flash烧写BIN文件。
    发表于 06-25 15:47 8次下载

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日
    发表于 05-20 11:03 1678次阅读

    英特尔系统级代工模式促进生态协同,助力客户创新

    在半导体代工领域,赢得客户信任是业务长期发展的关键,而构建完善的代工生态系统,毫无疑问是实现这一目标的前提。英特尔在2025英特尔代工大会上明确表示,将以客户需求为中心,通过加强生态
    的头像 发表于 05-09 14:38 441次阅读

    英特尔持续推进核心制程和先进封装技术创新,分享最新进展

    英特尔代工已取得重要里程碑。例如,Intel 18A制程节点已进入风险试产阶段,并计划于今年内实现正式量产。这一节点采用了PowerVia背面供电技术和RibbonFET全环绕栅极晶体管。英特尔代工的生态系统合作伙伴为Inte
    的头像 发表于 05-09 11:42 574次阅读
    <b class='flag-5'>英特尔</b>持续推进核心制程和先进封装技术创新,分享最新进展

    英特尔代工:明确重点广合作,服务客户铸信任

    英特尔代工大会召开,宣布制程技术路线图、先进封装里程碑和生态系统合作。 今天,2025英特尔代工大会(Intel Foundry Direct Connect)开幕,英特尔分享了多代核
    的头像 发表于 04-30 10:23 404次阅读
    <b class='flag-5'>英特尔</b>代工:明确重点广合作,服务客户铸信任

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    与战略调整收购背景:2015年,英特尔斥资167亿美元收购Altera,意图通过FPGA技术强化AI、边缘计算等新兴领域布局,但收购后未能实现预期协同效应。战略调整:2025年,英特尔
    发表于 04-25 10:19

    英特尔先进封装:助力AI芯片高效集成的技术力量

    ),以灵活性强、能效比高、成本经济的方式打造系统级芯片(SoC)。因此,越来越多的AI芯片厂商青睐这项技术。 英特尔自本世纪70年代起持续创新,深耕封装技术,积累了超过50年的丰富经验。面向AI时代,英特尔正在与
    的头像 发表于 03-28 15:17 667次阅读
    <b class='flag-5'>英特尔</b>先进封装:助力AI芯片高效集成的技术力量

    英特尔借助开放生态系统加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设施   英特尔发布全新英特尔®AI边缘系统
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放<b class='flag-5'>生态系统</b>,<b class='flag-5'>加速</b>边缘AI创新

    英特尔展示基于至强6处理器的基础网络设施

    ; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔至强6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔至强6能效核处理器机架性能的提高、能耗的降低以及能效的提升。 AI和5G技术的蓬勃发
    的头像 发表于 03-08 09:24 851次阅读

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    MWC 2025:英特尔展示基于至强6处理器的基础网络设施

    3.2倍3; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔®至强®6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔®至强®6能效核处理器机架性能的提高、能耗的降低以及能效的提升。 AI
    发表于 03-03 15:52 999次阅读
    MWC 2025:<b class='flag-5'>英特尔</b>展示基于至强6处理器的基础网络设施