0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC领域的一款大杀器-HBX-G500大带宽加速卡

傅里叶的猫 来源:FPGA技术联盟 2023-11-29 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

HBX-G500是一款为AI、计算和网络领域设计的高性能可编程加速器卡。它配备了多通道的高带宽存储和高效能计算能力,以及先进的高速接口解决方案,特别适用于运行大型模型。即便在小批量数据处理时,它的性能也能媲美A100和H100。

该加速器卡搭载了两组PCIe GEN5接口,并配备了两个400GbE和一个200Gbe网络接口,以及32GB的GDDR6存储单元。

它还具备一个包含超过80个节点的2DNOC网络和2560个高度可配置的MLP计算核心,以支持密集型计算任务。2DNOC不仅连接了高速接口和存储单元,而且还连接了Fabric的80个节点,使得用户可以更专注于功能开发。总线路由问题可以简单地通过NOC连接来解决。

板卡功能:

两路PCIe Gen5 ,其中PCIe Gen5X16支持系统接口,PCIeGen5X4可同时支持RC/EP

两路网口,速率可达400Gbe以及200Gbe,且支持向下速率兼容

32GBGDDR6,市面上为数不多的支持GDDR6的FPGA板卡,支持16通路访问,内存带宽可达3.5Tbps

FPGA可支持达1500K LE

FPGA支持2560高性能计算核心(MLP)

每个MLP最大支持32个乘法器,可根据数据位宽的变化做调整

专属内嵌的LRAM/BRAM可缓存数据或者快速反馈结

支持整型(INT16/INT8/INT4)、浮点(FP24/FP16)、BFP

INT8总算力约61Tops

支持通用串行总线(USB)JTAG配置、PCIe加载

支持上电自加载,1GB QSPI闪存 板卡规格:

尺寸:高度:111.15mm 长度:275mm

工作电压:外部两路+12VDC

适用AI应用的架构特性:

00369078-8e4c-11ee-939d-92fbcf53809c.png

2D NOC的高效路由架构让用户可以集中精力于开发:

它支持广泛采用的AXI4标准接口。

NOC的工作频率可达2Ghz,数据传输宽度为256位。

主机通过PCIe接口,可以直接通过NOC的黄色区域访问16条通道的GDDR6存储。

主机通过PCIe,同样可以通过NOC的黄色区域直接访问连接在NAP上的任意功能单元。

功能单元能够通过NOC直接访问存储资源(GDDR6或DDR)。

不同功能单元之间可以通过NOC进行高效互联。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1655

    文章

    22287

    浏览量

    630315
  • JTAG
    +关注

    关注

    6

    文章

    411

    浏览量

    74617
  • QSPI
    +关注

    关注

    0

    文章

    47

    浏览量

    13241
  • PCIe接口
    +关注

    关注

    0

    文章

    121

    浏览量

    10463
  • GDDR6
    +关注

    关注

    0

    文章

    52

    浏览量

    11569

原文标题:HPC领域的一款大杀器---HBX-G500大带宽加速卡

文章出处:【微信号:傅里叶的猫,微信公众号:傅里叶的猫】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索ADS5474:一款高性能14位、400-MSPS模数转换

      在当今高速数据采集和处理的领域中,模数转换(ADC)扮演着至关重要的角色。德州仪器(TI)的ADS5474就是一款备受关注的高性能ADC,今天我们就来深入了解下这款产品。 文件
    的头像 发表于 11-27 14:04 291次阅读
    探索ADS5474:<b class='flag-5'>一款</b>高性能14位、400-MSPS模数转换<b class='flag-5'>器</b>

    算力密度翻倍!江原D20加速卡发布,一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新代全国产AI加速卡——江原D20
    的头像 发表于 11-14 08:21 9484次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,<b class='flag-5'>一卡</b>双芯重构AI推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2130次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是一款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 514次阅读
    新品 | LLM-8850 Card, AX8850边缘设备AI<b class='flag-5'>加速卡</b>

    25W 功耗稳跑 104TOPS!H2 加速卡:让智能医疗设备的 AI 分析 “快又稳”

    H2 加速卡的出现,不仅解决了众多智能设备厂商“算力不足、空间受限、稳定性差”的三大难题,更通过医疗级可靠性设计与全链路服务支持,成为了设备厂商打造差异化产品的“秘密武器”。
    的头像 发表于 07-21 18:00 833次阅读
    25W 功耗稳跑 104TOPS!H2 <b class='flag-5'>加速卡</b>:让智能医疗设备的 AI 分析 “快又稳”

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他们嘴里多了个新词儿——智算
    的头像 发表于 06-05 13:39 1286次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在AI战场上干掉GPU和TPU!

    用ZX7981EP方案打造一款直播不顿的5G路由

    直播场景是网络解决方案经典场景之,它有着独特的网络需求,多设备接入、高带宽、高覆盖……因此,打造一款直播不顿的路由很有必要。启明智显Z
    的头像 发表于 05-15 18:01 853次阅读
    用ZX7981EP方案打造<b class='flag-5'>一款</b>直播不<b class='flag-5'>卡</b>顿的5<b class='flag-5'>G</b>路由

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 551次阅读
    410 基于 XCVU9P+ C6678 的 100<b class='flag-5'>G</b> 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    边缘AI运算革新 DeepX DX-M1 AI<b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    AI加速卡到底是个啥?文让小白也能看懂AI时代的“超级计算”!

    你有没有发现,现在人工智能(AI)越来越火了?聊天机器人能陪你谈天说地,自动驾驶汽车能自己避障,手机拍照能自动美颜……这些背后都离不开种神秘的技术——AI加速卡
    的头像 发表于 04-28 14:46 3445次阅读
    AI<b class='flag-5'>加速卡</b>到底是个啥?<b class='flag-5'>一</b>文让小白也能看懂AI时代的“超级计算<b class='flag-5'>器</b>”!

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推体AI加速卡,基于寒武纪全新代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 4060次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    ADL6012 2GHz至67GHz,500MHz带宽检波技术手册

    ADL6012是一款通用宽带包络检波,工作频率范围为2 GHz到67 GHz。该器件具有500 MHz宽包络带宽和0.6 ns快速上升时间特性,适合各种应用,包括宽带包络跟踪、发射
    的头像 发表于 03-24 16:21 731次阅读
    ADL6012 2GHz至67GHz,<b class='flag-5'>500</b>MHz<b class='flag-5'>带宽</b>检波<b class='flag-5'>器</b>技术手册

    stspin32G4这颗mcu里面集成的是哪一款G4?能不能用cubemx来进行配置?

    stspin32G4这颗mcu里面集成的是哪一款G4?能不能用cubemx来进行配置
    发表于 03-12 07:01

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 951次阅读
    边缘AI新突破:MemryX AI<b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    南京芯麒电子-基于KU15P的双路100G光纤加速卡

            该平台是由16nm工艺的的Kintex UltraScale+系列主器件XCKU15P构建的一款加速卡平台,支持 PCIE Gen3x16 模式,支持 2组 72-bit DDR4
    的头像 发表于 01-15 10:11 1004次阅读
    南京芯麒电子-基于KU15P的双路100<b class='flag-5'>G</b>光纤<b class='flag-5'>加速卡</b>