0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC领域的一款大杀器-HBX-G500大带宽加速卡

傅里叶的猫 来源:FPGA技术联盟 2023-11-29 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

HBX-G500是一款为AI、计算和网络领域设计的高性能可编程加速器卡。它配备了多通道的高带宽存储和高效能计算能力,以及先进的高速接口解决方案,特别适用于运行大型模型。即便在小批量数据处理时,它的性能也能媲美A100和H100。

该加速器卡搭载了两组PCIe GEN5接口,并配备了两个400GbE和一个200Gbe网络接口,以及32GB的GDDR6存储单元。

它还具备一个包含超过80个节点的2DNOC网络和2560个高度可配置的MLP计算核心,以支持密集型计算任务。2DNOC不仅连接了高速接口和存储单元,而且还连接了Fabric的80个节点,使得用户可以更专注于功能开发。总线路由问题可以简单地通过NOC连接来解决。

板卡功能:

两路PCIe Gen5 ,其中PCIe Gen5X16支持系统接口,PCIeGen5X4可同时支持RC/EP

两路网口,速率可达400Gbe以及200Gbe,且支持向下速率兼容

32GBGDDR6,市面上为数不多的支持GDDR6的FPGA板卡,支持16通路访问,内存带宽可达3.5Tbps

FPGA可支持达1500K LE

FPGA支持2560高性能计算核心(MLP)

每个MLP最大支持32个乘法器,可根据数据位宽的变化做调整

专属内嵌的LRAM/BRAM可缓存数据或者快速反馈结

支持整型(INT16/INT8/INT4)、浮点(FP24/FP16)、BFP

INT8总算力约61Tops

支持通用串行总线(USB)JTAG配置、PCIe加载

支持上电自加载,1GB QSPI闪存 板卡规格:

尺寸:高度:111.15mm 长度:275mm

工作电压:外部两路+12VDC

适用AI应用的架构特性:

00369078-8e4c-11ee-939d-92fbcf53809c.png

2D NOC的高效路由架构让用户可以集中精力于开发:

它支持广泛采用的AXI4标准接口。

NOC的工作频率可达2Ghz,数据传输宽度为256位。

主机通过PCIe接口,可以直接通过NOC的黄色区域访问16条通道的GDDR6存储。

主机通过PCIe,同样可以通过NOC的黄色区域直接访问连接在NAP上的任意功能单元。

功能单元能够通过NOC直接访问存储资源(GDDR6或DDR)。

不同功能单元之间可以通过NOC进行高效互联。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22571

    浏览量

    640736
  • JTAG
    +关注

    关注

    6

    文章

    417

    浏览量

    75334
  • QSPI
    +关注

    关注

    0

    文章

    55

    浏览量

    13440
  • PCIe接口
    +关注

    关注

    0

    文章

    130

    浏览量

    10662
  • GDDR6
    +关注

    关注

    0

    文章

    52

    浏览量

    11634

原文标题:HPC领域的一款大杀器---HBX-G500大带宽加速卡

文章出处:【微信号:傅里叶的猫,微信公众号:傅里叶的猫】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    BMA220:一款高性能的三轴加速度传感

    。博世的BMA220就是一款备受关注的三轴加速度传感,今天我们就来深入了解下它。 文件下载: BMA220-SHUTL.pdf 、产品
    的头像 发表于 05-09 14:40 136次阅读

    AMD正式推出Instinct MI350P PCIe GPU加速卡

    AMD于2026年5月8日正式推出Instinct MI350P PCIe GPU加速卡,作为四年来首面向企业级市场的PCIe接口Instinct系列产品,其以“精简架构+极致能效”为核心,专为AI推理任务优化,实现从部署到运行的“开箱即用”体验,重新定义企业级AI
    的头像 发表于 05-08 11:25 656次阅读

    瀚博半导体载天VA16加速卡成功适配DeepSeek-V4大模型

    4月24日,深度求索正式开源全新系列模型DeepSeek-V4。瀚博半导体第时间完成载天VA16加速卡的FP4+FP8 混合精度适配,加速大模型高并发、低成本落地。
    的头像 发表于 05-06 15:54 535次阅读

    选择AMD Alveo V80加速卡的五大理由

    V80 是一款用途高度多样化的加速卡,业已应用于高性能计算、金融科技、数据分析、传感处理、网络、存储等众多市场,能利用 AMD Versal 自适应 SoC 架构提供高效的量产路径。
    的头像 发表于 04-10 14:59 458次阅读

    AMD Alveo MA35D媒体加速卡的AMA SDK 1.4.0版本发布

    我们非常高兴地宣布,面向 AMD Alveo MA35D 媒体加速卡的最新 AMA SDK 1.4.0 版本现已发布。该版本旨在为要求严苛的媒体工作负载提供坚如磐石的稳定性和性能提升。此次更新体现了我们致力于优化平台以适应生产环境的承诺,确保客户能够自信地扩展视频处理能力。
    的头像 发表于 03-19 09:36 750次阅读

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 634次阅读
    FPGA硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    LLM-8850KitLLM-8850Kit是一款面向边缘AI与嵌入式计算场景的高性能AI加速卡套件,由LLM-8850CardAI加速卡与LLM-8850PiHat转接板组成。核心加速卡
    的头像 发表于 01-30 16:11 1521次阅读
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤加速卡

    C6678, XCVU9P, ZU19EG开发板,, 高速信号处理, 光纤加速卡, XCVU9P光纤加速卡
    的头像 发表于 01-08 16:06 532次阅读
    高速信号处理设计方案:413-基于双XCVU9P+C6678的100<b class='flag-5'>G</b>光纤<b class='flag-5'>加速卡</b>

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频解码能力,支持
    的头像 发表于 12-14 13:12 2138次阅读
    昆仑芯R200 AI<b class='flag-5'>加速卡</b>技术规格解析

    迈向云端算力巅峰:昆仑芯K200 AI加速卡全面解读

    昆仑芯K200作为云端AI加速卡,在K100架构基础上全面升级。其INT8算力达256 TOPS,配备16GB HBM内存与512GB/s带宽,专为千亿参数大模型训练与高并发推理优化。采用全高全长双
    的头像 发表于 12-14 11:17 2481次阅读
    迈向云端算力巅峰:昆仑芯K200 AI<b class='flag-5'>加速卡</b>全面解读

    深圳光量子工厂启示:PCI 加速卡为何偏向 25MHz 2016 有源晶振?

    在 PCI 加速卡项目中,工程师使用SJK 2016 系列有源晶振 25MHZ。原因不仅仅是规格匹配,更在于系统复杂度。
    的头像 发表于 12-12 16:43 1446次阅读
    深圳光量子工厂启示:PCI <b class='flag-5'>加速卡</b>为何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡发布,一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新代全国产AI加速卡——江原D20
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,<b class='flag-5'>一卡</b>双芯重构AI推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2937次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是一款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 1546次阅读
    新品 | LLM-8850 Card, AX8850边缘设备AI<b class='flag-5'>加速卡</b>

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他们嘴里多了个新词儿——智算
    的头像 发表于 06-05 13:39 2032次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在AI战场上干掉GPU和TPU!