0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

技术革新,GCU-LARE实现高性能互联

燧原科技Enflame 来源:燧原科技Enflame 作者:燧原科技Enflame 2020-10-31 09:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2020年10月26日,燧原科技正式推出搭载燧原科技云燧T10的PCIe Gen4全互联AI高算力训练系统。该系统目前为国内第一套基于PCIe Gen4的全互联AI高算力训练系统,不仅使配备云燧T10的机内PCIe带宽得以全面提升,同时结合燧原科技GCU-LARE技术可实现系统高性能互联。

Supermicro 4U A+ 服务器(搭载8张云燧T10)

技术革新,GCU-LARE实现高性能互联

PCIe Gen4全互联AI高算力训练系统由燧原科技与Supermicro合作研发,其中,燧原科技云燧系列产品PCIe Gen4的高带宽和GCU-LARE智能互联特点,在此研发中发挥了关键作用。

以该系统的创新技术——GCU-LARE来说,燧原科技GCU-LARE智能互联技术为系统提供了最大提供双向200GB/s的互联带宽。在2D Torus 6x6节点连接方式中,若采用GCU-LARE互联,一个机柜内3台8卡服务器,垂直方向环6个节点,水平方向用2张RDMA/RoCE网卡,通过类似可扩展的连接方式,可以实现千卡级别高线性度互联,其线性加速比可达86%以上,远超业内水平,故而实现其高性能互联特色。

2D Torus 6x6节点示意图(144张云燧T10)

精准攻克,强强联手解决算力瓶颈

燧原科技产品部资深总监邓辉表示,随着AI模型的复杂化和大型化,AI算力需求成指数级增长。其中,运算集群和CPU通信带宽,以及运算加速卡节点之间scale out时的高性能、低延迟、智能化互联成为高算力集群的瓶颈。

此次燧原科技正式推出的PCIe Gen4全互联AI高算力训练系统,便着重解决通信带宽与运算加速卡节点之间的高性能、低延迟、智能化互联问题。

PCIe Gen4连接拓扑

燧原科技通过直接连接PCIe Gen4 x16 CPU至云燧T10,使得Supermicro新的4U A+ Server 4124GS-TNR系统支持最多可8张云燧T10 PCIe AI加速卡,而单机8张云燧T10支持4卡作为一个节点的HCM(HybridCube Mesh)互联拓扑,节点内通过GCU-LARE桥接卡实现4卡间点对点全互联,节点之间通过GCU-LARE高速线缆实现互联,总互联带宽高达800GB/s。最终,该系统无需任何PCIe Switch,便可实现最低延迟、最高带宽和最大限度的加速。

GCU-LARE互联HCM拓扑(单机8卡)

此外,该系统还支持最多两个额外高性能PCIe Gen4扩展槽,且支持单个PCIe Gen4 x8以及最多2个用于RDMA高速网卡提供最高200Gb/s的高性能网络连接,用于实现最先进的2D Torus的高性能AI训练集群互联拓扑。

多方攻克,具有强大算力与超高加速的PCIe Gen4全互联AI高算力训练系统搭载燧原科技云燧T10,应运而生。该系统加速了计算和网络性能,极大的丰富和提升了整个AI高算力训练系统互联拓扑和带宽,为客户带来强大的产品性能和可扩展性,使其拥有前所未有的速度为最复杂的Al网络进行训练。

系统落地,彰显训练芯片实力

燧原科技正是认可Supermicro在全球企业服务器先进解决方案上的突出地位,并与其创新性、革命性的研发特理念不谋而合,故而凭借其独创的GCU-LARE互联技术与Supermicro展开合作,成功地推出了中国第一套PCIe Gen4的多卡AI服务器训练系统,解决了大型AI训练系统互联接口的瓶颈和规模部署的门槛。此次合作的成功还为双方后期深入合作奠定了良好基础,让未来更多基于多卡互联的AI模型训练系统逐一实现。

对于燧原科技而言,这款搭载云燧T10的中国第一套PCIe Gen4全互联AI高算力训练系统成功推出,是对其研发方向的极致肯定,同时也彰显了燧原科技在训练芯片领域的技术实力与企业地位。

燧原科技创始人兼COO张亚林认为,能与全球企业服务器先进解决方案的倡导者和领先者Supermicro保持前瞻性技术上的一致,并展开深入合作,最后成功落地合作成果,是燧原科技走向国际舞台的标志性一步,代表我国训练芯片行业曙光在即,前景远大。

未来,AI训练芯片的算力需求将以每三个月增长一倍的惊人速度增长,而AI应用率到2025年将达80%。急速变化的AI训练芯片技术、产量需求为该领域企业带来了严峻考验,燧原科技必将全力践行其研发战略,全面攻克数据分析、深度学习和深度学习推理等多方难题,为真正的算力普惠和应用落地创造价值和铺平道路。

原文标题:燧原科技上线AI高算力训练系统PCIe Gen4

文章出处:【微信公众号:燧原科技Enflame】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54384

    浏览量

    469039
  • 服务器
    +关注

    关注

    14

    文章

    10345

    浏览量

    91739
  • AI
    AI
    +关注

    关注

    91

    文章

    40962

    浏览量

    302531

原文标题:燧原科技上线AI高算力训练系统PCIe Gen4

文章出处:【微信号:gh_1222367b8780,微信公众号:燧原科技Enflame】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微电网规划中储能技术革新的方向有哪些?

    微电网规模扩大、源网荷储充高度耦合,以及多场景差异化规划需求的凸显,传统储能技术在能量密度、循环寿命、成本控制、协同能力等方面的局限日益凸显,推动储能技术革新成为微电网高质量规划的必然选择。本文结合最新技术实践与规划需求,系统梳
    的头像 发表于 04-09 13:51 147次阅读
    微电网规划中储能<b class='flag-5'>技术革新</b>的方向有哪些?

    核芯互联推出低功耗高性能射频合成器CLF2574

    近日,国产模拟芯片领军企业核芯互联 推出了其高性能宽带射频合成器 —— CLF2574。凭借其卓越的低功耗设计、极宽的频率范围以及创新的杂散抑制技术,该芯片正成为高性能射频时钟方案的理
    的头像 发表于 01-28 11:10 552次阅读
    核芯<b class='flag-5'>互联</b>推出低功耗<b class='flag-5'>高性能</b>射频合成器CLF2574

    国产高性能ONFI IP解决方案全解析

    )时代,数据存储的吞吐量瓶颈日益凸显,高性能的ONFI IP能够确保大规模数据的高效存取,是SSD及先进存储系统的核心技术基石。2. 奎芯科技 ONFI IP 的核心技术规格奎芯科技提供的 ONFI
    发表于 01-13 16:15

    “5G+工业互联网”下的龙芯2K2000工控主板强势发展赋能

    作为工业经济与信息通信技术深度融合的核心驱动力,“5G+工业互联网”绝非单纯的技术革新,其核心价值在于借助5G网络高速率、低时延的核心特性,实现工业设备、产品与生产流程的全域
    的头像 发表于 01-08 17:42 1176次阅读

    惠伦晶体晶振产品推动光通信技术革新

    件。作为国内领先的频率元器件制造商,惠伦晶体科技有限公司凭借其高性能晶体与晶振产品,为光通信模块提供精准、可靠、低抖动的时钟基准,成为推动光通信技术革新的关键力量。
    的头像 发表于 12-23 12:51 1479次阅读
    惠伦晶体晶振产品推动光通信<b class='flag-5'>技术革新</b>

    国产时钟缓冲器:技术革新与市场竞争

    随着科技的飞速发展,时钟缓冲器作为电子设备中的关键部件,其技术性能和市场需求也在不断提高。本文将以国产时钟缓冲器为切入点,深入探讨其技术革新和市场竞争。一、国产时钟缓冲器的技术革新1.高精度控制
    的头像 发表于 11-18 17:14 6267次阅读
    国产时钟缓冲器:<b class='flag-5'>技术革新</b>与市场竞争

    小型自动气象站:精细化气象监测的技术革新与应用拓展

    小型自动气象站:精细化气象监测的技术革新与应用拓展 柏峰【BF-QX】随着气象服务向“精细化、精准化、智能化”升级,传统气象观测站点密度不足、覆盖范围有限的问题日益凸显。小型自动气象站作为一种集成化、低功耗、易部署的气象监测设备,凭借其灵活的应用场景和高精度的监测能力,
    的头像 发表于 10-23 10:53 893次阅读
    小型自动气象站:精细化气象监测的<b class='flag-5'>技术革新</b>与应用拓展

    智能进化:高端平板操控系统的技术革新

    科技重塑交互,指尖轻触未来。 在当今数字化时代,平板电脑已从简单的消费设备演变为关键的生产力工具。高端平板操控系统作为决定用户体验的核心要素,正经历着前所未有的技术革新。从精密的多点触控到智能化
    的头像 发表于 09-27 16:08 622次阅读

    雷达水文监测站:智慧水文监测的技术革新与应用实践

    雷达水文监测站:智慧水文监测的技术革新与应用实践 柏峰【BF-LDSW】在全球气候变化与极端水文事件频发的背景下,传统水文监测手段面临着监测范围有限、实时性不足、恶劣环境适应性差等诸多挑战。
    的头像 发表于 09-16 10:13 954次阅读
    雷达水文监测站:智慧水文监测的<b class='flag-5'>技术革新</b>与应用实践

    Metyos借助Altium解决方案实现医疗技术革新

    了解 Metyos 如何借助 Altium Designer 和 Altium 365,助力数百万人在肾病最早期阶段实现主动管理。
    的头像 发表于 07-02 10:43 1152次阅读

    高性能低功耗双核Wi-Fi6+BLE5.3二合一

    随着物联网技术的不断发展,无线通信模块在各种应用场景中扮演着越来越重要的角色。近日,蓝科迅通科技宣布推出一款基于Nordic Semiconductor的Wi-Fi 6芯片nRF7002和高性能双核
    发表于 06-28 21:42

    技术革新,EtherCAT转CAN网关,新能源汽车电池产线再升级

    技术革新,EtherCAT转CAN网关,新能源汽车电池产线再升级 在智能制造快速发展的浪潮下,工业机器人核心部件的生产精度要求不断提升。某工业机器人减速器制造企业的精密加工产线中,前道工序的数控机床
    的头像 发表于 06-11 17:10 720次阅读
    <b class='flag-5'>技术革新</b>,EtherCAT转CAN网关,新能源汽车电池产线再升级

    耐能KNEO Pi开发板的三大技术革新

    在万物互联与AI普惠化的浪潮中,边缘计算正成为技术革新的核心战场。 传统开发板受限于算力、功耗与生态封闭性,难以满足实时AI推理与工业级部署的需求。
    的头像 发表于 06-06 09:58 1291次阅读

    通讯设备散热解决方案:从技术革新到实践优化

    智能手机等终端设备在高性能运行时温度可突破60℃阈值。本文将从技术突破、设计优化及用户行为干预三个维度,解析通讯设备散热的破局之道。 一、技术革新:从风冷到液冷的范式转移 传统风冷技术
    的头像 发表于 05-09 15:38 1270次阅读

    Condor使用Cadence托管云服务开发高性能RISC-V微处理器

    Condor 是一家美国初创企业,致力于开发高性能 RISC-V 微处理器。公司的目标是通过创新技术彻底革新整个行业,打破高性能计算的极限。
    的头像 发表于 05-08 09:03 1292次阅读