中国最大的计算芯片诞生！燧原科技发布邃思2.0 AI训练芯片-电子发烧友网

燧原科技于7月7日在上海发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组，全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”，成为国内首家发布第二代人工智能训练产品组合的公司。

这是继2019年12年发布第一代训练芯片，邃思1.0及云燧T10/T11，2020年12月发布第一代推理产品云燧i10之后，燧原科技的又一力作。

燧原科技CEO赵立东（左）与燧原科技COO张亚林（右）共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原产品的商业落地场景包括，液冷超大规模集群，加速视频内容生产；强化学习使能游戏AI，改变数字娱乐的方式；强大的视觉能力，保驾护航金融安全；边缘部署融合多数据，构建新型智能化交通；高效推理算力集群，建设园区AI视频云。

随着第二代产品的发布，将加速这些场景的商业化落地。

云燧智算集群

随着自然语言处理、强化学习、无监督学习、多模态和认知模型等的发展，在知识图谱、智慧大脑、游戏引擎、融合媒体和通用人工智能的应用上，绿色一体化的超级智算集群是关键趋势。

燧原发布CloudBlazer Matrix云燧智算集群，它代表世界最高水平，最高8192Enflame CloudBlazer训练卡和DTU芯片，最高1.3E（130000T）单精度智能算力集群。液冷/每一体化PUE降到1.15以下。最高160T单精度张量训练卡以及80%的线性度。

这是为智能计算和新基建算力而推出的集群化产品。CloudBlazer Matrix 2.0将包括邃思DTU2.0，云燧CloudBlazer T20/T21板卡，和驭算软件Topsrider2.0。

打造中国最大的计算芯片，邃思DTU2.0性能强悍

邃思DTU2.0是中国最大的计算芯片，突破封装的极限。DTU2.0采用2.5D高级封装，整合9颗芯片，其中1颗DTU芯片、4颗三星HBM2E等构成先进封装。封装尺寸为57.5mm*57.5mm。

燧原科技第二代通用人工智能训练芯片“邃思2.0”

DTU2.0的计算能力，单精度FP32达40FLOPS，支持单精度张量TF32，达160T FLOPS。TF32格式被认为是在数据中心最先进的数据模式。

此外，DTU2.0植入完全可编程的数据流，软件指令驱动的传输和数据计算，标量、向量和张量的高效数据处理，和多地址广播等。

存储方面，邃思2.0共搭载了4颗HBM2E片上存储芯片，高配支持64GB内存，带宽达1.8TB/s，是中国第一个支持世界最先进存储HBM2E和单芯片64 GB内存的产品。

6个LARE卡间互联端口，每一个端口双向50GB/s，总集群互联带宽300GB/s。

云燧T21\T20训练产品，分别为OAM标准模组和全高全长PCIE板卡。

以Benchmark数据来看，云燧T20与友商次旗舰相比，在图像识别/分类、NLP、目标检测、图像分割、推荐等均有明显优势。

驭算Topsrider2.0架构

驭算TopsRider是燧原科技自主知识产权的计算及编程平台，通过软硬件协同架构设计，充分发挥邃思2.0的性能；基于算子泛化技术及图优化策略，支持主流深度学习框架下的各类模型训练；利用Horovod分布式训练框架与GCU-LARE互联技术相互配合，为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口，为客户模型的优化提供了自定义的开发能力。

云端训练计算产品路线图

训练产品方面，燧原计划第三代T30/T31产品将于2023年发布，每瓦的能效将提升14倍。同时升级到Matrix3.0。

推理计算方面，2021年下半年将发布i20推理芯片，以及2023年将发布i30。其每瓦能效将分别提升4倍和16倍。

另外，在Topsrider2.x的基础上，还将进一步升级至Topsrider3.x，致力于泛AI生态。

生态建设

AI生态也是跨行业的、复杂的生态竞争。燧原推出的异构计算生态燎原计划，将聚集生态的三大特征：原始创新、标准化和生态共建。

燎原计划将建立繁荣开放的开发者生态，健康互利的产业生态，持续创新的科研生态。打造以人工智能为起点构建通用异构计算生态，构建标准化的技术体系，共建完整生态服务数字中国。将涵盖深度学习计算，通用异构计算以及视觉计算。

赵立东表示，未来行业的发展趋势表明，以芯片为核心的算力，是工业4.0兵家必争之地。工业4.0时代，人工智能是关键动力。摩尔定律放缓，异构计算加速，基于小芯片、封装技术，人工智能落地将改变互联网重塑传统行业。算力需示爆炸，算力成为人工智能技术发展的基础。燧原科技要建立世界水平的本土化研发和工程化团队，开发国产自主创新的核心技术，布局云端AI+高端芯片双赛道。我们为数据中心打造最优的云端AI产品，形成训练推理完整的闭环解决方案。

本文由电子发烧友原创，作者黄晶晶，微信号kittyhjj，转载请注明以上来源。如需入群交流，请添加微信elecfans999，投稿发邮件到huangjingjing@elecfans.com。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26424

浏览量
264030
燧原科技

燧原科技

+关注

关注
0

文章
98

浏览量
8143

英伟达将用AI设计AI芯片

AI芯片行业资讯

深圳市浮思特科技有限公司

发布于 :2024年02月19日 17:54:43

硅光计算芯片：AI芯片国产化的关键突破口

大模型训练和推理的硬件以通用图形处理单元（GPU）为主，2022年全球GPU市场规模达到448.3亿美元，美国AI芯片巨头英伟达公司占有80%的市场份额并仍在持续攀升。

发表于 01-19 14:12 •451次阅读

硅光<b class='flag-5'>计算</b><b class='flag-5'>芯片</b>：<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>国产化的关键突破口

AI芯片、光模块和光芯片的发展趋势

根据 OpenAI 官网，AI 模型训练计算量自 2012 年起每 3.4 个月就增长一倍。以 GPT-3 模型为例，根据 lambdalabs 数据，该模型参数规模达 1750 亿，完整训练

发表于 12-29 10:07 •600次阅读

墨芯：聚焦颠覆性技术创新争当AI芯片2.0时代全球领跑者

墨芯作为具有革新性的ai芯片设计师，拥有世界领先的自主开发稀有算法，作为双重稀有算法的发明者，公司的目标是制造世界新一代人工智能芯片，成为ai芯片

发表于 12-08 10:28 •300次阅读

腾讯：已储备足够英伟达芯片，将寻求国内AI训练芯片供应

腾讯总裁刘炽平表示，美国上个月决定禁止更多人工智能芯片向中国出口，这将迫使该公司更有效地使用现有芯片并寻求国产人工智能芯片。“我们必须找到更有效地使用我们的人工智能

发表于 11-16 15:27 •986次阅读

多GPU训练大型模型：资源分配与优化技巧｜英伟达将推出面向中国的改良芯片HGX H20、L20 PCIe、L2 PCIe

。为了解决这个问题，英伟达将针对中国市场推出新的AI芯片，以应对美国出口限制。本文将探讨如何在多个GPU上训练大型模型，并分析英伟达禁令对中国

发表于 11-16 11:39 •1034次阅读

#芯片 #AI 世界最强AI芯片H200性能大揭秘！

芯片AI

深圳市浮思特科技有限公司
发布于 :2023年11月15日 15:54:37

英伟达确认为中国推三款改良AI芯片性能暴降80%

据报道，nvidia的3种ai芯片不是“改良版”，而是“缩水版”，分别是hgx h20、l20 pcle和l2 pcle。用于ai模型训练的hgx h20虽然带宽和

发表于 11-13 10:46 •450次阅读

2023中国AI芯片企业榜再次入榜，知存科技即将发布新品

近日，2023全球AI芯片峰会（GACS 2023）在深圳圆满举行。作为大会主题「AI大时代逐鹿芯世界」的载体之一， “2023年度中国AI

发表于 09-20 09:15 •809次阅读

芯算一体获千万级战略轮融资，已与众多AI芯片原厂合作

该公司正致力于与许多ai芯片制造商的合作，目前rk、计算、mtk等国内外制造企业的ai芯片质能环网的适合和优化工作完成了，开发者们利用自动化

发表于 09-13 10:46 •308次阅读

AI芯片的诞生和发展背景 AI芯片发展的技术方向 AI芯片的发展趋势

高算力需求正催生AI芯片的快速迭代，“无芯片，不AI”，以AI芯片为载体实现的算力正成为人工智能

发表于 08-16 10:11 •2504次阅读

ai芯片和传统芯片的区别

等方面进行详细介绍。应用领域的区别传统芯片的应用范围主要是计算机、家电、汽车和电子产品等领域，而AI芯片的应用范围更加广泛。它可以应用于机器人、自动驾驶、智能家居、视频监控、医疗等

发表于 08-08 19:02 •2642次阅读

ai芯片和soc芯片的区别

在设计和功能上有着极大的不同。本文将从技术角度深入探讨AI芯片和SoC芯片的区别。一、定义 AI芯片指的是人工智能专用

发表于 08-08 19:00 •2718次阅读

AI芯片的优势和主要挑战 AI芯片和存储芯片的区别

　　AI芯片也被称为AI加速器或计算卡，即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算

发表于 08-03 17:19 •2177次阅读

【机器视觉】欢创播报 | 英特尔发布Gaudi2争夺AI芯片市场

。英特尔也强调，Gaudi 2芯片是专为训练大语言模型而构建，采用7纳米制程，有24个张量处理器核心。事实上，去年英特尔就已经在海外发布了Gaudi 2，此次在中国推出的是“

发表于 07-13 11:21 •383次阅读

搜索历史

中国最大的计算芯片诞生！燧原科技发布邃思2.0 AI训练芯片

评论

英伟达将用AI设计AI芯片

硅光计算芯片：AI芯片国产化的关键突破口

AI芯片、光模块和光芯片的发展趋势

墨芯：聚焦颠覆性技术创新争当AI芯片2.0时代全球领跑者

腾讯：已储备足够英伟达芯片，将寻求国内AI训练芯片供应

多GPU训练大型模型：资源分配与优化技巧｜英伟达将推出面向中国的改良芯片HGX H20、L20 PCIe、L2 PCIe

#芯片 #AI 世界最强AI芯片H200性能大揭秘！

英伟达确认为中国推三款改良AI芯片性能暴降80%

2023中国AI芯片企业榜再次入榜，知存科技即将发布新品

芯算一体获千万级战略轮融资，已与众多AI芯片原厂合作

AI芯片的诞生和发展背景 AI芯片发展的技术方向 AI芯片的发展趋势

ai芯片和传统芯片的区别

ai芯片和soc芯片的区别

AI芯片的优势和主要挑战 AI芯片和存储芯片的区别

【机器视觉】欢创播报 | 英特尔发布Gaudi2争夺AI芯片市场