0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国最大的计算芯片诞生!燧原科技发布邃思2.0 AI训练芯片

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2021-07-08 21:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

燧原科技于7月7日在上海发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”,成为国内首家发布第二代人工智能训练产品组合的公司。

这是继2019年12年发布第一代训练芯片,邃思1.0及云燧T10/T11,2020年12月发布第一代推理产品云燧i10之后,燧原科技的又一力作。

 
燧原科技CEO赵立东(左)与 燧原科技COO张亚林(右)共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原产品的商业落地场景包括,液冷超大规模集群,加速视频内容生产;强化学习使能游戏AI,改变数字娱乐的方式;强大的视觉能力,保驾护航金融安全;边缘部署融合多数据,构建新型智能化交通;高效推理算力集群,建设园区AI视频云。

随着第二代产品的发布,将加速这些场景的商业化落地。

云燧智算集群

随着自然语言处理、强化学习、无监督学习、多模态和认知模型等的发展,在知识图谱、智慧大脑、游戏引擎、融合媒体和通用人工智能的应用上,绿色一体化的超级智算集群是关键趋势。

燧原发布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer训练卡和DTU芯片,最高1.3E(130000T)单精度智能算力集群。液冷/每一体化PUE降到1.15以下。最高160T单精度张量训练卡以及80%的线性度。



这是为智能计算和新基建算力而推出的集群化产品。CloudBlazer Matrix 2.0将包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和驭算软件Topsrider2.0。

打造中国最大的计算芯片,邃思DTU2.0性能强悍

邃思DTU2.0是中国最大的计算芯片,突破封装的极限。DTU2.0采用2.5D高级封装,整合9颗芯片,其中1颗DTU芯片、4颗三星HBM2E等构成先进封装。封装尺寸为57.5mm*57.5mm。

 
燧原科技第二代通用人工智能训练芯片“邃思2.0”

DTU2.0的计算能力,单精度FP32达40FLOPS,支持单精度张量TF32,达160T FLOPS。TF32格式被认为是在数据中心最先进的数据模式。

此外,DTU2.0植入完全可编程的数据流,软件指令驱动的传输和数据计算,标量、向量和张量的高效数据处理,和多地址广播等。

存储方面,邃思2.0共搭载了4颗HBM2E片上存储芯片,高配支持64GB内存,带宽达1.8TB/s,是中国第一个支持世界最先进存储HBM2E和单芯片64 GB内存的产品。



6个LARE卡间互联端口,每一个端口双向50GB/s,总集群互联带宽300GB/s。

云燧T21\T20训练产品,分别为OAM标准模组和全高全长PCIE板卡。



以Benchmark数据来看,云燧T20与友商次旗舰相比,在图像识别/分类、NLP、目标检测、图像分割、推荐等均有明显优势。



驭算Topsrider2.0架构

驭算TopsRider是燧原科技自主知识产权的计算及编程平台,通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。



云端训练计算产品路线图

训练产品方面,燧原计划第三代T30/T31产品将于2023年发布,每瓦的能效将提升14倍。同时升级到Matrix3.0。



推理计算方面,2021年下半年将发布i20推理芯片,以及2023年将发布i30。其每瓦能效将分别提升4倍和16倍。


另外,在Topsrider2.x的基础上,还将进一步升级至Topsrider3.x,致力于泛AI生态。

生态建设

AI生态也是跨行业的、复杂的生态竞争。燧原推出的异构计算生态燎原计划,将聚集生态的三大特征:原始创新、标准化和生态共建。

燎原计划将建立繁荣开放的开发者生态,健康互利的产业生态,持续创新的科研生态。打造以人工智能为起点构建通用异构计算生态,构建标准化的技术体系,共建完整生态服务数字中国。将涵盖深度学习计算,通用异构计算以及视觉计算。



赵立东表示,未来行业的发展趋势表明,以芯片为核心的算力,是工业4.0兵家必争之地。工业4.0时代,人工智能是关键动力。摩尔定律放缓,异构计算加速,基于小芯片、封装技术,人工智能落地将改变互联网重塑传统行业。算力需示爆炸,算力成为人工智能技术发展的基础。燧原科技要建立世界水平的本土化研发和工程化团队,开发国产自主创新的核心技术,布局云端AI+高端芯片双赛道。我们为数据中心打造最优的云端AI产品,形成训练推理完整的闭环解决方案。

本文由电子发烧友原创,作者黄晶晶,微信号kittyhjj,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿发邮件到huangjingjing@elecfans.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296389
  • 燧原科技
    +关注

    关注

    0

    文章

    148

    浏览量

    9714
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产AI芯片真能扛住“算力内卷”?海昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    全球首款“可逆计算”冰河芯片诞生,相比普通芯片节能30%

    近日,国内芯片研发团队正式宣布全球首款基于可逆计算架构的 “冰河芯片” 成功诞生,经第三方权威机构测试,该芯片相比同性能传统
    的头像 发表于 10-09 17:05 513次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、分布式群体智能 1)物联网AGI系统 优势: 组成部分: 2)分布式AI训练 7、发展重点:基于强化学习的后训练与推理 8、超越大模型:神经符号计算 三、AGI
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片不仅包括深度学细AI加速器,还有另外一个主要列别:类脑芯片。类脑芯片是模拟人脑神经网络架构的芯片
    发表于 09-17 16:43

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    持续发展体现在: 1、收益递减 大模型的基础的需要极大的算力,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现在: ①模型大小 ②训练数据量 ③训练
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    算法 5.2加速矩阵乘法的芯片架构 ①新的矩阵乘法器架构 ②基于RISC-V的矩阵乘法扩展指令集 ③用信息论的思想来减少AI推理计算量 三、用于边缘侧训练或推理的
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:可重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC AI芯片
    发表于 09-12 16:07

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新性的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审中的竞争力。例如,在芯片设计中引入新的计算范式,如存算一体技术
    发表于 08-19 08:58

    今日看点丨两家国产头部厂商发布新一代AI芯片 ;台积电在美先进封装布局启动

        H20重返中国在即,两家国产头部厂商发布新一代AI芯片   日前,原科技和沐曦这两家头部国产A
    发表于 07-28 10:41 2214次阅读
    今日看点丨两家国产头部厂商<b class='flag-5'>发布</b>新一代<b class='flag-5'>AI</b><b class='flag-5'>芯片</b> ;台积电在美先进封装布局启动

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI
    的头像 发表于 07-09 15:59 882次阅读

    SD3403边缘计算AI数据训练概述

    AI数据训练:基于用户特定应用场景,用户采集照片或视频,通过AI数据训练工程师**(用户公司****员工)** ,进行特征标定后,将标定好的训练
    发表于 04-28 11:11

    Deepseek海SD3403边缘计算AI产品系统

    SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针
    发表于 04-28 11:05

    原科技正式纳入飞桨例行版本发布体系

    原科技与飞桨经过长时间的适配合作和持续集成(CI)建设,对飞桨合⼊的每⼀行代码都在原硬件上进⾏了验证。如今,原正式纳入飞桨例行版本发布体系。未来,
    的头像 发表于 04-11 11:31 821次阅读
    <b class='flag-5'>燧</b>原科技正式纳入飞桨例行版本<b class='flag-5'>发布</b>体系

    原科技亮相2024中国人工智能大会

    近日,原科技创新研究院首席研究员石恒博士受邀在2024中国人工智能大会的“AI芯片与智能计算创新生态”专题论坛上,发表了《面向
    的头像 发表于 12-19 13:58 910次阅读

    亚马逊转向Trainium芯片,全力投入AI模型训练

    ,亚马逊AWS推出了两款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium则专注于AI模型的训练。 然而,随着生成式
    的头像 发表于 12-13 14:14 958次阅读