0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能网卡势在必行,可编程、平台化加速行业部署

张慧娟 来源:电子发烧友网 作者:张慧娟 2020-03-11 09:34 次阅读

赛灵思(Xilinx)的数据中心业务,过去一年的年增长率达到24%,季度增长率达到92%。基于UltraScale+架构,赛灵思已经推出了Alveo四大加速卡系列(U50U200U250U280),在计算加速、存储加速、网络加速三方面助力数据中心的发展,同时也构建起庞大的数据中心系统,既有戴尔、HPE、浪潮、安富利等OEM合作伙伴、增值经销商/分销商,也有许多独立软件提供商。

现阶段,不断增长的联网需求与不断上涨的成本正在成为数据中心的新挑战,基于此,赛灵思推出了Alveo家族最新的一体化SmartNIC平台Alveo U25,在单颗器件上实现了一体化的网络、存储、计算加速能力,以提供更高的效率和更低的总拥有成本(TCO)。赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)、数据中心事业部产品及平台营销副总裁Donna Yasay,共同介绍了这一创新平台所传递的价值。

赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)


赛灵思数据中心事业部产品及平台营销副总裁Donna Yasay

数据中心的联网危机

数据中心正在面临联网危机,云基础设施饱受服务器I/O所造成的数据瓶颈的困扰。首先,进出数据中心联网的流量在迅速增长,内部的横向流量年负荷增长率在25%以上。其次,随着网络数据爆炸式地增长,额外的工作涌入云数据中心服务器,大量地挤占了CPU资源。边缘的一级云服务商(如亚马逊、微软)多年前已经注意到了这个问题,采取将联网功能转移到SmartNIC上的做法来为CPU减负,但是,由于超出80%的云服务器节点目前无法提供 SmartNIC 接入,因此联网卸载一时难以实现。

端口的联网问题为何会如此严峻?这是因为端口基于的是模拟技术和调制技术的创新,速度持续以几何级倍数增长,将远超摩尔定律和Dennard缩放比例定律(Dennard’s scaling)计算周期速率。如果这一问题没有得到足够的重视,未来将越来越严重,甚至导致服务器中所有CPU资源遭到挤占,而无暇顾及应用级处理。

Donna Yasay补充,一些云服务器厂商并非不需要对服务器上的联网功能进行卸载,他们通常仍在采用传统的NIC,特别是二级、三级云服务厂商,没有足够雄厚的研发资源,很难通过一己之力采用SmartNIC并做到大规模部署。因此,他们更加需要现成的、便捷的、开箱即用的解决方案。

SmartNIC究竟“Smart”在哪?

事实上,早有业内人士预测,SmartNIC将成为主流的云计算技术。对裸机云和安全性的需求,将推动软件定义的功能进入可编程SmartNIC中,而非增加昂贵的通用服务器CPU。

市场调研机构Dell’Oro集团研究总监Baron Fung表示:“预计到 2024 年,SmartNIC 市场规模将超过6亿美元,占据全球以太网适配器市场的23%。随着云服务提供商的纵向扩容,他们正在不断增加 SmartNIC 的部署,以便为业务应用释放宝贵的CPU核,优化服务器利用率。而电信服务提供商则是另一大具有强劲增长潜力的市场,他们正考虑将 SmartNIC 从核心网集成到边缘网,为 NFV 和 AI 推断等应用提供服务。”

基于 FPGA 的Alveo U25 SmartNIC迎合了这一不断增长的市场机遇。据介绍,Alveo U25是业界首款“一体化 SmartNIC 平台”,通过将高度优化的 SmartNIC 平台与FPGA引擎相结合,实现了全可编程与一站式加速应用,可用于业界具有一定挑战的需求与工作负载中,如:SDN、虚拟交换、NFV、NVMe-oF、电子交易、AI推断、视频转码和数据分析等。

为什么能够做到一体化的平台加速?Donna Yasay介绍了来自FPGA的核心属性:计算应用方面,FPGA在机器学习、推断数据库、加速视频转码等方面表现突出;联网方面:能够迅速进行信息包的处理和查询;存储方面,能够支持如压缩、加密和重复数据的删除等工作。
此外,还有FPGA灵活应变的特性,云服务商不论是开发新功能还是进行扩展,都比ASIC产品更有优势。

与基于SoC的NIC相比,Alveo U25 SmartNIC 平台可以提供更高的吞吐量和更强大的灵活应变引擎,支持云架构师快速为多种类型的功能与应用提速。Alveo U25支持“bump-in-the-wire (线缆内的块)”式无缝嵌入网络、存储和计算卸载及加速功能,可以避免不必要的数据传输和 CPU 处理,从而最大限度提高效率。而这也显著降低了 CPU的负担并释放更多资源,以运行更多应用。嵌入式 ARM 处理器提供了独特、关键的控制层处理功能,可以支持新兴的裸机服务器用例。基本型NIC可提供超高吞吐量、小数据包性能与低时延。标准型全功能 NIC 解决方案与驱动程序采用获得专利的 Onload应用加速软件,时延降幅高达80%,并且在云应用中为基于传输控制协议( TCP )的服务器应用提高了效率,最高可达 400%。

Alveo U25 所提供的首个开箱即用型加速应用,是对 Open vSwitch ( OVS )卸载与加速的支持。这个即插即用型解决方案将从服务器卸载90%以上的 OVS 处理,从而将数据包吞吐量提升 5 倍以上。

未来,赛灵思还计划推出针对安全功能的一站式解决方案,这些安全功能诸如 IPSec、SSL/TLS、AES-256/128,同时还有分布式防火墙和 AI 推断。目前,Alveo U25 SmartNIC 平台正为早期试用客户提供样品。预计将于 2020 年第三季度开始批量供货。

针对高性能电子交易环境与企业级数据中心,赛灵思还推出了XtremeScale X2562 10/25Gb 以太网适配器卡,该卡符合 OCP Spec 3.0 外形尺寸规格,可提供亚微秒级时延、高吞吐量,以及可将实时数据包和信息流连接到数千个虚拟 NIC 的超大规模连接能力。X2562 目前已经开始提供样品,将于 2020 年第二季度批量供货。

同时发布的还有基于 FPGA 的开放计算加速器模块( OAM )的概念验证板。该夹层卡基于赛灵思UltraScale+ VU37P FPGA 并搭载 8GB HBM 存储器,符合开放加速器基础设施( OAI )规格,可支持七条 25Gbps x8 链路,为分布式加速提供了丰富的模块间系统拓扑。

一站式软硬件协同的加速平台

根据Dell'Oro最新报告,整体控制器和适配器市场将以7%的年复合增长率增长,其中25Gbps和100Gbps的销售将是主要增长驱动力。同时,SmartNIC市场的年复合增长率将达到25%,这为适配器供应商提供了以更高价格推出创新产品的机会。反过来,这可以降低数据中心TCO。

唐晓蕾表示,在Alveo系列产品研发和推出策略上,赛灵思从客户TCO角度来分析,希望能真正解决数据中心客户的痛点。数据中心需要加速卡是确定趋势,随着摩尔定律的终结、数据的指数级爆发,数据中心对加速卡的需求会越来越大,现在仅是黎明开始的阶段。未来加速卡的市场格局分布,可以从几个维度看待:一是计算,特别是在云端上要去努力提升;二是网络方面,实现可扩展性、可视化、智能化;三是存储,在带宽的占用、成本方面,加速卡发展潜力很大。

为什么要推出平台型的产品?唐晓蕾表示主要是希望企业在数据加速方面能够更快面向市场。Alveo U25与赛灵思去年推出的Vitis统一软件平台是有机结合。由于之前FPGA开发有一定的门槛,而随着数据中心应用场景的不断扩展,新的客户群体在增加,必须在软硬件协同做更多提升,才能让整个客户群体受益。Alveo U25实现了一站式加速应用,可以助力非一级云数据中心运营商更加方便地部署,同时,还支持赛灵思和独立软件提供商提供的一站式应用。其编程模型既支持 HLS 和 P4 等高级网络编程抽象,也支持 Vitis统一软件平台等计算加速框架,以便实现赛灵思和第三方所提供的加速应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1592

    文章

    21207

    浏览量

    592143
  • 数据中心
    +关注

    关注

    15

    文章

    4125

    浏览量

    69344
  • 智能网卡
    +关注

    关注

    1

    文章

    48

    浏览量

    12154
  • SmartNIC
    +关注

    关注

    0

    文章

    17

    浏览量

    3161
收藏 人收藏

    评论

    相关推荐

    可编程片上系统的基本特征和主要应用

    可编程片上系统是一种特殊的嵌入式系统:首先它是片上系统,即由单个芯片完成整个系统的主要逻辑功能;其次,它是可编程系统,具有灵活的设计方式,可裁减、可扩充、可升级,并具备软硬件在系统可编程的功能。
    的头像 发表于 03-28 15:13 72次阅读

    可编程片上系统是什么意思

    可编程片上系统(Programmable System-on-Chip,PSoC)是一种特殊的嵌入式系统。它首先是一个片上系统,这意味着整个系统的主要逻辑功能由单个芯片完成。其次,它具有可编程的特性,设计方式灵活,可裁减、可扩充、可升级,并具备软硬件在系统
    的头像 发表于 03-28 15:09 70次阅读

    可编程片上系统是什么

    可编程片上系统(Programmable System-on-Chip,PSoC)是一种特殊的嵌入式系统,它集成了数字逻辑、模拟电路和可配置模块,将传统的微处理器、微控制器和可编程逻辑器件等功能融合
    的头像 发表于 03-28 14:55 58次阅读

    现场可编程门阵列的原理和应用

    FPGA是一种可编程的硬件逻辑器件,其核心组成部分是可编程逻辑单元(PLU)和可编程互连资源(Interconnect Resources)。PLU是一组可编程的逻辑门,如与门、或门、
    的头像 发表于 03-27 14:49 75次阅读

    现场可编程门阵列是什么

    现场可编程门阵列(Field Programmable Gate Array,简称FPGA)是一种超大规模可编程逻辑器件,由可编程逻辑资源、可编程互连资源和
    的头像 发表于 03-16 16:38 1546次阅读

    分享 | 可编程晶振芯片几个知识点

    什么是可编程晶振?可编程晶振多为有源晶振,由两个芯片组成;一个是全硅MEMS谐振器,一个是具有温补功能的芯片,可以启动电路锁相环CMOS
    的头像 发表于 01-09 17:51 494次阅读
    分享 | <b class='flag-5'>可编程</b>晶振芯片几个知识点

    基于可编程片上系统(SOPC)的智能电子血压计的设计

    电子发烧友网站提供《基于可编程片上系统(SOPC)的智能电子血压计的设计.pdf》资料免费下载
    发表于 10-20 11:07 5次下载
    基于<b class='flag-5'>可编程</b>片上系统(SOPC)的<b class='flag-5'>智能</b>电子血压计的设计

    可编程晶振详解「工作原理、结构、特点、应用」

    主要部分组成。其工作原理为:当加电压时,石英晶体就会产生振动,并产生电信号,此信号被检测并数字后,再通过处理器进行解调,最后输出所需的频率信号。 二、可编程晶振的结构主要有以下几个部分: 晶体:晶体
    发表于 10-14 17:38

    可编程单芯片自适应无线电平台

    电子发烧友网站提供《可编程单芯片自适应无线电平台.pdf》资料免费下载
    发表于 09-13 15:44 0次下载
    <b class='flag-5'>可编程</b>单芯片自适应无线电<b class='flag-5'>平台</b>

    智能网卡简介及其在高性能计算中的作用

    据包性能和低延迟以及可编程网络结构。除了减轻处理器的负担外,SmartNIC FPGA 还具有可定制性和易于编程的特点。这种灵活性使开发人员能够根据 AI 和深度学习工作负载的特定需求定制智能
    发表于 07-28 10:10

    通过AI加速智能终端应用得到创新提升

    京微齐力采用ImaginationAI加速器,助力打造Avatar高端产品系列第一颗新型智能加速芯片,为不同行业用户提供高性价比、强适配性的系统级
    的头像 发表于 07-12 10:08 251次阅读
    通过AI<b class='flag-5'>加速</b>,<b class='flag-5'>智能</b>终端应用得到创新提升

    2023中国智能网卡行业词条报告

    在网络协议处理卸载、网络功能虚拟化、特定应用加速等应用场景中发挥着重要作用。例如,智能网卡在云服务行业得到广泛应用,公有云服务商通过大规模部署
    的头像 发表于 06-09 16:03 897次阅读
    2023中国<b class='flag-5'>智能</b><b class='flag-5'>网卡</b><b class='flag-5'>行业</b>词条报告

    CVCC可编程电源平台方案

    从应用的角度来看,测试、检测是可编程电源最大的应用领域,包括汽车电子测试,半导体制造设备、元器件老化测试及激光、水处理和表面金属处理等。而半导体制造设备同样离不开可编程电源,如沉积设备、离子注入机
    的头像 发表于 06-08 09:09 505次阅读
    CVCC<b class='flag-5'>可编程</b>电源<b class='flag-5'>平台</b>方案

    可编程逻辑器件测试

    可编程逻辑器件 (Programmable Loeie Device,PLD)是一种用户编程实现某种逻辑功能的逻辑器件,主要由可编程的与阵列、或阵列、门阵列等组成,可通过编程来实现一定
    发表于 06-06 15:37 412次阅读
    <b class='flag-5'>可编程</b>逻辑器件测试

    可编程逻辑器件测试方法

    可编程逻辑器件 (Programmable Loeie Device,PLD)是一种用户编程实现某种逻辑功能的逻辑器件,主要由可编程的与阵列、或阵列、门阵列等组成,可通过编程来实现一定
    的头像 发表于 06-06 15:35 677次阅读
    <b class='flag-5'>可编程</b>逻辑器件测试方法