0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新一代数据中心加速卡Alveo U55C最大功耗低至150W

lPCU_elecfans 来源:电子发烧友网 作者:程文智 电 2021-12-09 17:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/程文智)近年来,在数字化浪潮的推动下,传感器及其产生的数据量呈现出了爆炸式的增长,对数据处理基础架构的需求也随之增长。根据国际超级计算大会(ISC)的统计,在HPC领域,超算系统架构正变得越来越多元化,在近几年的TOP500超算榜单中,使用GPUFPGA等加速卡的异构计算系统占比呈上升趋势。

近日,赛灵思(Xilinx)在SC21全球超级计算大会上推出了新的Alveo U55C数据中心加速器卡,以及一款基于标准、API-driven 的集群解决方案,用于大规模部署 FPGA。据赛灵思数据中心事业部高性能计算( HPC )产品经理Nathan Chang介绍,Alveo U55C加速器卡结合了非常多当今HPC和大数据工作负载需要的关键功能。该加速器卡能够提供Alveo 加速器产品系列中的最高计算密度和 HBM2容量。结合赛灵思基于 RoCE v2 的全新集群解决方案,可令运行大规模计算工作负载的各类客户大获裨益,支持其利用现有数据中心基础架构和网络,实现强大的基于 FPGA 的 HPC 集群。

Alveo U55C最重要的特性

Alveo U55C卡融合了当前 HPC工作负载所需的众多关键特性。它能提供更高的数据流水线并行度、卓越的存储器管理、优化的整个流水线的数据迁移,以及Alveo产品系列中最高的单位功耗性能。

Alveo U55C与其前一代产品Alveo U280相比,有了很多升级。从外观上来看,Alveo U55C采用了单插槽、全高半长( FHHL )外形尺寸;从算力上来看,虽然Alveo U55C提供的算力没变,但体积更小了,计算密度得到了很大的提升;从功耗上来看,Alveo U55C的最大功耗为150W,而Alveo U280的功耗为225W。而且,Alveo U55C还将HBM2的容量翻倍至16GB。

Nathan Chang解释说,功耗降低的原因是Alveo U55C去掉了DDR,在存储器卡方面让HBM2增加了一倍,这就相当于让高带宽的数量增加了4倍,由于去掉了DDR,所以Alveo U55C整个TDP功耗也下降了。

在Nathan Chang看来,Alveo U55C有三个非常重要的特性:一是采用了RoCE v2、DCBx,还有MPI,在现有网络和基础架构上,为现在的数据中心提供了最尖端的计算集群。第二,现有的应用开发人员可以利用Vitis平台上的一些已有的API、库以及MPI,来扩展他们的工作负载。第三就是高性能。

据他介绍,通过RoCE v2和 DCBx技术,再结合200 Gbps带宽,Alveo U55C构建的集群解决方案使Alveo网络可在性能和时延方面媲美 InfiniBand 网络,且无需对厂商加锁。MPI (信息传递接口)集成功能使 HPC 开发人员能以赛灵思 Vitis统一软件平台扩展Alveo数据流水线。利用现有开放标准和框架,现在能跨数百张 Alveo 卡上进行性能扩展,无需考虑服务器平台和网络基础架构,同时还能共享工作负载和存储器。

借助面向应用和集群的高层次编程,软件开发者和数据科学家能够运用 Vitis 平台,解锁 Alveo 和自适应计算的优势。赛灵思大力投入于 Vitis 开发平台和工具流程,旨在令不具备硬件专业知识的软件开发者和数据科学家,也能更容易地使用自适应计算。Vitis 平台支持 Pytorch 和 Tensorflow 等主流 AI 框架,还支持 C、C++Python 等高层次编程语言,使开发者能利用特定 API 和库来构建领域解决方案,或者使用赛灵思软件开发套件,从而在现有数据中心内轻松加速关键 HPC 工作负载。

应用案例

谈到Alveo U55C的应用,Nathan Chang列举了几个常用的应用场景,比如几乎每一家汽车厂商都会用到的碰撞仿真软件LS-DYNA。汽车厂商主要是用它赖进行汽车的撞击测试,以便查看仿真效果,确保汽车在设计方面的安全性和结构方面的完整性。而安全性和结构系统的设计往往取决于模型性能,因其能以计算机辅助设计有限元方法( FEM )仿真来降低物理碰撞测试的成本。FEM求解器是驱动具备数亿个自由度仿真的主要算法,而这些庞大的算法可以细分为更基本的求解器,如 PCG、稀疏矩阵、ICCG。与 x86 CPU 相比,利用超并行数据流水线在大量 Alveo 卡上进行性能扩展,LS-DYNA 能够实现超过 5 倍的性能加速。这能在一个 Alveo 流水线中提高单位时钟周期的工作效率,令 LS-DYNA 客户受益于突破性的仿真时间。

另外,他还介绍了一个图分析的案例,“在加入赛灵思之前,我是一个创业者,当时我处于油气行业,主要做的工作是做地壳震动图解决的AI和机器学习。我们知道,数据工程师、科学家、分析师在处理此类课题的时候,都会寻找数据的一些相关性。在寻找的过程中,我们发现了一个巨大的痛点,那就是数据的孤岛越来越多,如果想要把这些不同孤岛上的数据联系起来,真的非常困难。”他感叹。

不过,Nathan Chang表示,图库数据是科学家认为非常具有颠覆性的一个平台,它能够将数据从孤岛中提取出来,让偶让数据科学家可以专注于数据之间的关系,而不是看单张图。赛灵思的合作伙伴,TigerGraph 是一家图分析平台提供商,他们正使用多张 Alveo U55C 卡为两种最高效算法进行集群与加速,以驱动基于图的推荐和集群引擎。图从信息孤岛中采集数据并重点关注数据间的关系。图领域的下一个前沿是实时查找答案。Alveo U55C 将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与基于 CPU 的集群相比,使用多张 U55C 卡扩展分析所提供的出色计算能力和存储器带宽,可将图查询速度提升高达 45 倍。质量评分也提升高达 35%,从而显著提升置信度,将误报几率降至低个位数

另外,他还列举了Alveo U55C在信号处理、医疗和金融方面的应用。

总结

随着高性能计算迈向百亿亿级大关,功耗将成为下一个难关。而典型的高性能计算架构,即CPU和GPU的架构,难以提供可接收的单位功耗性能,因此,现在越来越多的高性能计算集群开始采用一机构计算架构,预计未来将会有更多的算力会部署在专门的加速器上,而不是通用CPU上。对于整个HPC服务器集群的降功耗目标来说,使用加速器卡的效果更好,功耗更低。未来加速器卡的市场前景将会更加广阔。

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

编辑:金巧

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7771

    浏览量

    172461
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226479
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5334

    浏览量

    136236
  • 数据中心
    +关注

    关注

    18

    文章

    5860

    浏览量

    75256

原文标题:新一代数据中心加速卡Alveo U55C,最大功耗低至150W

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PMT2 150W 系列面板安装电源:工业电源解决方案解析

    系列面板安装电源。 文件下载: PMT-48V150W2CA.pdf 产品概述 PMT2 系列电源是第二产品,采用了 30mm 的薄型设计,能够接受通用交流输入。这种高效的对流
    的头像 发表于 05-13 16:15 128次阅读

    150W谐振变换器设计解析与性能评估

    150W谐振变换器设计解析与性能评估 引言 在当今对电源效率要求极高的时代,尤其是对于All-In-One电脑电源等应用,高效、低功耗的开关电源设计显得至关重要。本文将详细介绍款基于L6563H
    的头像 发表于 04-16 09:30 447次阅读

    选择AMD Alveo V80加速卡的五大理由

    AMD Alveo V80 加速卡专为需要实时加速的企业数据中心和云服务提供商而设计,它结合了可编程逻辑、片上高带宽内存( HBM )、高速网络核心以及网络直连接口,可实现实时性能。
    的头像 发表于 04-10 14:59 465次阅读

    150W U-Bracket单输出电源:ULP - 150系列深度解析

    150W U-Bracket单输出电源:ULP - 150系列深度解析 在电子设备的设计中,电源模块的选择至关重要,它直接影响着整个系统的性能和稳定性。今天,我们就来详细探讨下ULP
    的头像 发表于 04-05 15:40 789次阅读

    探索 QP - 150 系列 150W 四输出电源:特性、规格与应用考量

    探索 QP - 150 系列 150W 四输出电源:特性、规格与应用考量 在电子设备的设计中,电源模块的选择至关重要,它直接影响着整个系统的性能、稳定性和可靠性。今天,我们就来深入了解下 QP
    的头像 发表于 04-05 11:40 541次阅读

    晶科能源全球发布新一代数据中心AIDC组件

    2026年3月20日,上海,全球领先的光伏企业晶科能源全球发布新一代数据中心AIDC组件,该产品依托成熟的飞虎3组件平台技术,深度聚焦数据中心高负荷、高财产安全、全天长时运行、极端耐候性、稳定可靠
    的头像 发表于 03-23 11:35 483次阅读

    AMD Alveo MA35D媒体加速卡的AMA SDK 1.4.0版本发布

    我们非常高兴地宣布,面向 AMD Alveo MA35D 媒体加速卡的最新 AMA SDK 1.4.0 版本现已发布。该版本旨在为要求严苛的媒体工作负载提供坚如磐石的稳定性和性能提升。此次更新体现了我们致力于优化平台以适应生产环境的承诺,确保客户能够自信地扩展视频处理能力
    的头像 发表于 03-19 09:36 770次阅读

    Molex产品组合推动下一代数据中心高速互连

    云计算、物联网、VR/AR、数字孪生、人工智能(AI)……这些让科技圈热血沸腾的技术背后,都有个共同的底层逻辑——它们都是以海量数据的处理作为支撑的。因此,无论是哪条赛道上的竞争,都会体现为数字基础设施建设上的比拼,即新一代数据中心
    的头像 发表于 03-12 10:38 755次阅读

    TE Connectivity面向新一代数据中心的高速连接器解决方案

    在数字化转型浪潮的推动下,云计算直处于快速上升通道,而数据中心作为云计算的核心基础设施,也在加速迭代,提升算力,以满足日益增长的海量数据的处理所需。
    的头像 发表于 02-27 15:27 1502次阅读

    浅谈新一代数据中心先进热管理策略

    数据中心功耗需求持续攀升,对高效热管理技术提出了更高要求。随着人工智能与大语言模型(LLM)的飞速发展,为市场提供超大规模云计算服务及基础设施的超大规模云服务商(hyperscaler),正面临前所未有的电力消耗压力。
    的头像 发表于 01-28 16:16 797次阅读

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频解码能力,支持
    的头像 发表于 12-14 13:12 2211次阅读
    昆仑芯R200 AI<b class='flag-5'>加速卡</b>技术规格解析

    CS57066C:功率150W 24V,节点性大功率升压DCDC介绍及方案

    RsENSE,在供电电压适配 4.5V24V 的情况下,最大可实现 36V 输出电压,可以实现150W以内的功率。提供了 TSSOP20-PP 封装形式供客户选择,合适的封装尺寸与 36℃/W 的芯片到
    发表于 08-29 13:40

    HTN865B 150W大功率内置MOS升压芯片方案

    深圳市永阜康科技有限公司针对大功率的升压应用需求,推广款集成20A开关管的36V输出、大电流非同步DC-DC升压IC-HTN865B。HTN865B采用独到的电路研发技术以及先进的半导体工艺,重载时高达95%以上的工作效率,无需外加散热器,可稳定输出
    的头像 发表于 07-22 13:08 1139次阅读
    HTN865B <b class='flag-5'>150W</b><b class='flag-5'>大功</b>率内置MOS升压芯片方案

    中型数据中心应用平台与差分晶体振荡器参数对照中型数据中心应用平台与差分晶体振荡器参数对照

    中型数据中心对高频、抖动、宽温与多电压晶振的需求日益提升,FCO系列差分晶体振荡器凭借丰富封装、输出逻辑选择与优异相位抖动性能,为网络、存储、服务器与边缘系统提供稳定的时钟解决方案。FCO-2L 到 FCO-7L 系列,已成为新一代
    发表于 07-10 14:11

    小型数据中心晶振选型关键参数全解

    BCM57810:支持高效的10GbE连接,适合数据中心内高速、延迟的数据传输。 匹配原因 FCO-3L系列的低功耗设计__(30 mA)和低相位噪声(-145 dBc/Hz@10
    发表于 06-11 13:37