0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx公司Versal AI Core系列产品实现突破性的AI推断吞吐量和性能

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-09-26 11:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在2018年初出任Xilinx CEO之后,Victor Peng就给FPGA巨头定下了三大战略,分别是数据中心加速、加速主流市场的发展以及推出 ACAP(Adaptive Compute Acceleration Platform, 自适应计算加速平台)。当中ACAP更是他们面向未来的重中之重。按照Xilinx的说法,这是继他们在1984年发明FPGA之后,又一次颠覆性的发明成就。

Victor Peng在中国参加媒体会甚至表示,如果你在一个行业内达到了一种高度,你就有资格玩下一关的游戏。现在Xilinx的ACAP已经上了一个新台阶,接下来我们要和英伟达英特尔处理器展开新竞争。

从最近发布的数据看来,Xilinx的ACAP也的确在一步步实现公司对它寄予的厚望。

不止FPGA,ACAP初战告捷

所谓ACAP,并不是FPGA,正如Victor Peng所说,这是一个整合了了硬件可编程逻辑单元、软件可编程处理器、以及软件可编程加速引擎的计算平台产品。作为一种高度集成的多核异构计算平台,ACAP可在软硬件两个层面随时进行更改,从而动态地适应数据中心、汽车、5G 无线、有线以及国防市场的广泛应用与工作负载需求。而Versal 则是ACAP的首款平台。

据了解,Versal的体系架构从构建伊始即可支持软件可编程,拥有高度灵活的、每秒传输速率高达数兆比特的片上网络 (NoC)。NoC能无缝集成所有引擎和关键接口,使得该平台在启动时即可使用平台的各项资源,并且方便软件开发者、数据科学家和硬件开发者等都能轻松进行编程。通过一系列工具、软件、库、IP、中间件和固件,Versal ACAP让使用者能随时通过业界标准设计流程开发各种定制化的加速计算解决方案。资料显示,Versal包括了几个系列, AI Core和Prime 则是最先推出的两个产品线,并已经开始发货。

据介绍,Versal AI Core 系列在整个Versal产品系列中提供了最高计算性能和最低时延,并通过 AI 引擎实现了突破性的 AI 推断吞吐量和性能。该系列针对云端、网络和自动驾驶技术进行优化,提供了业界最广泛的 AI 和工作负载加速功能。Versal Prime 系列的设计则广泛适用于各种应用,并针对各种工作负载的连接性和在线加速进行了优化。

“自发货以来,Versal AI Core和Versal Prime现在已经是有几百家客户,反响非常好,客户甚至希望我们能够加速其生产”,赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson告诉记者。

再下一城,Versal Premium为数据中心加速

在Versal AI Core和Versal Prime两个系列首战告捷之后,Xilinx又马不停蹄地在日前推出了Versal ACAP的高端系列Versal Premium,旨在帮助超大规模数据中心用户为多元化的数据中心工作负载实现最高加速水平。这一方面体现了Xilinx的有的放矢;另一方面,也再一次显露出了这家用于革自己命企业的底气。

众所周知,在过去几年里,随着AI、5G和物联网等多个新兴应用的崛起,数据成为了各大领域关注的重点。而庞大数据量的传输也给做相关支撑的基础设施带来严峻的挑战。如何提高高带宽、高性能、高可靠性和安全的方案,就成为了相关供应商需要考虑的重要问题。而Xilinx 的Versal Premium就是为了解决这些问题而生的。

Mike Thompson指出,Versal Premium是在Versal Prime的基础上,集成更多的连接和安全功能而打造的产品。从他的介绍我们得知,Versal Premium集成了PCIe Gen5、DMA和CCIX;同时还加上了CXL的支持;另外,最先进的112G PAM4收发器和可以做以太网即时连接的600G Interlaken硬核也是这个新旗舰的另一个亮点。在安全方面,Xilinx还为这款产品加入了400G加密引擎用于加密。是因为这些多样化异构集成,Xilinx让这个产品能给客户带来卓越的效果。

首先,通过软IP和硬IP的配置,能提供功耗优化的带宽密度。

以硬IP连接为例,它不但能够支持多速率以太网,还可以实现如网络遥测、虚拟化和数据包处理等高价值功能。在这些硬IP的支持下,不但可以支持更多标准,还能够以最小占板空间提供高达 5Tb/s 的吞吐量,同时能够让产品满足当前主流的100G和400G光通信需求,还提供了面向未来的800G连接支持,让客户可针对未来做更多提前布局。

Versal Premium 系列还提供了高达 9Tb/s 的可扩展、自适应串行带宽。具体方法是将 112G PAM4 收发器与集成的网络功能模块用于核心网、城域网和数据中心互联( DCI )基础设施,将每端口带宽密度提高两倍,并降低时延高达 50%。

其次,Versal Premium可以帮助客户实现800G DCI,但功耗不到100瓦。在与FPGA方案相比时,前者的功耗降低一半以上,占地面积也降低一半,功耗则提升了60%。

第三,Versal Premium集成的600G Interlaken 和400G高速加密引擎能协助打造更快速和安全的网络。如下图所示,这个产品可以以1.8Tb/s的速度现用Interlaken连接,高速加密引擎也可提供高达 1.6Tb/s 的加密线路速率吞吐量。

为了当前计算加速存储器架构上的瓶颈,Xilinx还给Versal Premium集成了1G片上存储器带宽,让其可以和计算引擎进行非常紧密地吻合,提高它的性能,降低功耗和时延。据Xilinx方面介绍,Versal Premium的存储器带宽为123TB/s,这个数字是英伟达Tesla V100的9倍,与Tesla T4相比,更是快乐25倍。“这让我们的产品解锁了GPU无法企及的性能”,Xilinx方面强调。这样的存储器带宽与异构引擎的搭配,让Versal Premium整体也提供了突破性的性能。

除了硬件之外,Xilinx还为这系列产品提供一个非常丰富和强大的软件生态,搭配其Vitis软件平台,使得软件开发者可以使用他们最熟悉的C、C++Python语言对硬件进行开发,另外数据科学家和算法开发人员也可以使用他们平时最熟悉的框架,在这个硬件上进行研究。Xilinx希望硬件开发者、软件开发者和数据开发者都能加入到其生态中来。

此外,针对当前网络应用的需求,Xilinx还给Versal Premium带来了网络异常检测AI和配置与网络性能AI。前者的引入让其能够执行入侵检测和恶意软件识别的功能,还拥有了应对新兴威胁的自适应算法,同时供公司还提供了随机森林算法(Random Forest) IP,满足客户的多样化需求;至于后者,则可以自动监测与性能瓶颈纠正,还可以自动配置,最大限度延长正常运行时间(MLP)

Mike Thompson强调。这样的异构集成创新使得ACAP尤其是Versal Premium能够超越摩尔定律的限制,能够专注于下一代高带宽和处理能力。还可以帮助客户大大降低资本支出和运营成本。更重要的一点,正因为使用了这样的设计,Versal Premium拥有了更多的逻辑可以用于定制。

虽然网络加速市场高手林立,但Xilinx的强势杀入,让整个市场又增添了几分变数。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20327

    浏览量

    254748
  • FPGA
    +关注

    关注

    1663

    文章

    22494

    浏览量

    638991
  • 数据中心
    +关注

    关注

    18

    文章

    5756

    浏览量

    75195
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科达嘉AI芯片电感CSHN系列荣获CITE 2026创新产品

    电感CSHN系列产品以其卓越的领先技术与突破性的创新应用,斩获了本届CITE2026大会颁发的“创新产品奖”荣誉。
    的头像 发表于 04-15 10:14 194次阅读

    欧洲快递行业巨头部署全新Matrix 830/930系统以应对高吞吐量业务

    迅速的市场认可,有力地证实了该新产品的战略意义。 该决定是在经过严格的基准测试、性能对比以及真实运行条件下的现场验证后做出的。在评估了其他配置方案后,客户确认新款 Matrix 830/930 是其高吞吐量物流环境下的最优解决方
    的头像 发表于 03-17 16:46 820次阅读

    大模型 ai coding 比较

    GLM-5 本地化部署/数据敏感场景 DeepSeek V2 Qwen2开源系列 ai coding 能力 因为 我对 java rust语言比较熟悉,所以想着以下面的提示词 开发项目,看项目的吞吐量
    发表于 02-19 13:43

    使用NORDIC AI的好处

    不依赖持续联网,整体系统可靠更高。[Edge AI 概述; Nordic Edge AI 技术页] 覆盖从“小 MCU”到“高性能 SoC”的完整
    发表于 01-31 23:16

    Enclustra整合AMD Versal实现突破性人工智能与边缘计算

    隆重推出AMDVersalSoC——新时代自适应智能解决方案Enclustra欣然宣布即将推出基于尖端AMDVersal自适应SoC架构的系统级模块,进一步拓展我们高性能嵌入式平台产品线。该系列模块
    的头像 发表于 01-30 08:34 636次阅读
    Enclustra整合AMD <b class='flag-5'>Versal</b>™<b class='flag-5'>实现</b><b class='flag-5'>突破性</b>人工智能与边缘计算

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    系列产品(如 ML100 IO Die)实现硬件级交付。• 解耦架构:将存储接口与核心SoC物理解耦,弱化热效应对存储颗粒的影响,提升系统可靠。• 降本增效:通过国产化供应链和先进互联架构,助力客户降低约20% 的系统级成本
    发表于 01-29 17:32

    用“分区”来面对超大数据集和超大吞吐量

    分区(partitions) 也被称为 分片(sharding),通常采用对数据进行分区的方式来增加系统的 可伸缩,以此来面对非常大的数据集或非常高的吞吐量,避免出现热点。
    的头像 发表于 12-30 16:40 279次阅读
    用“分区”来面对超大数据集和超大<b class='flag-5'>吞吐量</b>

    今日看点:消息称已有模组企业调整原定产品规划;华为将发布 AI 领域突破性技术

    华为将发布 AI 领域突破性技术 业内消息指出,华为将于 11 月 21 日发布一项 AI 领域的突破性技术,该技术有望解决当前算力资源利用效率低下的行业难题。   华为此次发布的
    发表于 11-17 10:47 1335次阅读

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 AI 数据存储、网络和安全带来突破性的加速。
    的头像 发表于 11-03 14:48 1199次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和灵感与诺贝尔奖和重大科学发现 科学发现中,直觉是重要的起点。是基于经验情感及知识的模式识别和类比能力,而不是基于逻辑和推理。 灵感通常是新的、有创意的想法或者突破性的思维,是突然来的、意外的提示。 直觉
    发表于 09-17 11:45

    使用罗德与施瓦茨CMX500的吞吐量应用层测试方案

    5G NR(New Radio)吞吐量应用层测试是评估5G网络性能的一个重要方面,它主要关注的是在实际应用条件下,用户能够体验到的数据传输速率。这种测试通常包括了对下行链路和上行链路的吞吐量进行测量,以确保网络可以满足各种应用场
    的头像 发表于 09-02 13:56 8125次阅读
    使用罗德与施瓦茨CMX500的<b class='flag-5'>吞吐量</b>应用层测试方案

    千方科技推出AI视频充电桩系列产品

    近年来,充电基础设施保有快速增长,运营管理过程中普遍存在充电桩利用率低、设备维护困难等问题。千方科技推出AI视频充电桩系列产品,从感知系统、控制系统到运维体系实现智能化升级,助力充电
    的头像 发表于 07-26 14:47 2287次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    故障)”的自动化推理链条。3.预测防御:智能基线洞察,防患于未然l 基于先进的时序分解算法,为每个关键业务终端/链路动态构建多维性能基线(吞吐量、时延、丢包率)。l 主动预警潜在风险,如带宽瓶颈
    发表于 07-16 15:29

    是德科技如何应对AI数据中心扩展瓶颈

    近几年,多模态学习、多智能体系统(Multi-agent Systems,MAS)和高速 GPU 互联技术快速发展,推动 AI 应用在医疗、气候建模、金融等多个领域实现飞跃。这些突破也带来了前所未有的挑战,对网络速度、
    的头像 发表于 07-11 14:04 1670次阅读
    是德科技如何应对<b class='flag-5'>AI</b>数据中心扩展瓶颈

    AMD第二代Versal AI Edge和Versal Prime系列加速量产 为嵌入式系统实现单芯片智能

    我们推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,这两款
    的头像 发表于 06-11 09:59 2058次阅读