0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Cerebras推WSE-3芯片,性能翻倍,助力超大规模AI模型训练

微云疏影 来源:综合整理 作者:综合整理 2024-03-14 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据报道,硅谷晶圆芯片创企 Cerebras 近日公布了其 WSE-3 芯片型号,声称在保持相同能耗的基础上,性能较前作 WSE-2 提升逾一倍。主要技术规格如下:

首先,WSE-3采用台积电最新的5nm工艺制作(目前领先业界)。其次,该芯片拥有超过4万亿个晶体管以及90万个AI核心,配合44GB片上SRAM高速缓存及三种可选片外存储方案(分别是1.5TB、12TB与1.2PB)。此外,WSE-3还具备125 PFLOPS的AI运算能力。

Cerebras指出,新款CS-3系统基于WSE-3芯片设计,最高支持1.2PB的内存容量,适于训练比GPT-4及Gemini更大的未来模型。借助独特的逻辑内存空间技术,能将24000T模型参数集中储存,大幅减轻了开发者负担。

尤为值得关注的是,CS-3强大的卓越的训练性能使其成为满足大规模AI需求的最佳选择,甚至可以在单日内完成70B模型的精炼。借助最大规模的2048套CS-3系统集群,仅仅一天便能够完成长毛羊 70B 神经网络(Netrep Tempo)模型的深度学习。同时,CS-3系统在用户友好性设计方面也表现出色,与GPU相比,大模型训练中的编码量降低高达97%,更多人可以轻松掌握超大规模AI处理技能。

值得一提的是,阿联酋G42财团已经表态将创建含64套 CS-3系统在内的Condor Galaxy 3超级计算机,预计综合AI运算能力可达8 exaFLOPs。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53539

    浏览量

    459198
  • 台积电
    +关注

    关注

    44

    文章

    5787

    浏览量

    174787
  • sram
    +关注

    关注

    6

    文章

    809

    浏览量

    117226
  • 晶体管
    +关注

    关注

    78

    文章

    10257

    浏览量

    146302
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    和探索;人类级别的理解能力;常识推理;现实世界的知识整合。 3、测试时计算 测试时计算(TTC)是指在模型推理阶段利用额外的计算资源来提升泛化性能。 4、具身智能与渗透式AI 1)具身
    发表于 09-18 15:31

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。AI工厂依赖
    发表于 08-13 19:01

    Cognizant加速AI模型企业级开发

    全新解决方案旨在帮助企业快速且大规模地构建、微调和实施AI模型。 Cognizant 凭借其作为数据与AI模型
    的头像 发表于 07-31 17:25 594次阅读

    伟创力高效电源模块在超大规模数据中心的应用

    受云端存储和数据处理需求持续增长的推动,数据中心正以前所未有的速度扩张。当前全球超大规模数据中心,即规模最大的那些数据中心,总容量在过去四年内翻了一番,并仍在不断增长。
    的头像 发表于 07-07 15:41 911次阅读

    超大规模芯片验证:基于AMD VP1902的S8-100原型验证系统实测性能翻倍

    引言随着AI、HPC及超大规模芯片设计需求呈指数级增长原型验证平台已成为芯片设计流程中验证复杂架构、缩短迭代周期的核心工具。然而,传统原型验证系统受限于单
    的头像 发表于 06-06 13:13 1094次阅读
    <b class='flag-5'>超大规模</b><b class='flag-5'>芯片</b>验证:基于AMD VP1902的S8-100原型验证系统实测<b class='flag-5'>性能</b><b class='flag-5'>翻倍</b>

    CMOS超大规模集成电路制造工艺流程的基础知识

    本节将介绍 CMOS 超大规模集成电路制造工艺流程的基础知识,重点将放在工艺流程的概要和不同工艺步骤对器件及电路性能的影响上。
    的头像 发表于 06-04 15:01 1907次阅读
    CMOS<b class='flag-5'>超大规模</b>集成电路制造工艺流程的基础知识

    纳微半导体推出12kW超大规模AI数据中心电源

    近日,纳微半导体宣布推出专为超大规模AI数据中心设计的最新12kW量产电源参考设计,可适配功率密度达120kW的高功率服务器机架。
    的头像 发表于 05-27 16:35 1153次阅读

    BDx成功融资助力香港超大规模数据中心扩建

     亚太地区发展势头迅猛的数据中心运营商BDx数据中心宣布,其香港首个专用超大规模数据中心开发项目融资已顺利完成。此次融资由Clifford Capital、大华银行(UOB)和三井住友银行(SMBC
    的头像 发表于 05-22 17:27 519次阅读

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的算力突破

    近年来,随着千亿级参数模型的崛起,AI训练对算力的需求呈现指数级增长。传统服务器架构在应对分布式训练、高并发计算和显存优化等场景时逐渐显露瓶颈。而RAKsmart为
    的头像 发表于 04-24 09:27 613次阅读

    谷歌新一代 TPU 芯片 Ironwood:助力大规模思考与推理的 AI 模型新引擎​

    Cloud 客户开放,将提供 256 芯片集群以及 9,216 芯片集群两种配置选项。   在核心亮点层面,Ironwood 堪称谷歌首款专门为 AI 推理精心设计的 TPU 芯片
    的头像 发表于 04-12 00:57 3220次阅读

    适用于数据中心和AI时代的800G网络

    下降。 InfiniBand助力AI性能提升 在AI工厂中,InfiniBand网络技术因其超低延迟和高带宽,成为大规模
    发表于 03-25 17:35

    DeepSeek推动AI算力需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI算力需求正以前所未有的速度增长。DeepSeek等大模型训练与推理任务对算力的需求持续攀升,直接推动了服务器、光通信设备以及数据中心基础设施的升级。特别是在
    发表于 03-25 12:00

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    伟创力如何应对超大规模数据中心建设挑战

    在当今瞬息万变的数字世界中,数据中心正面临着前所未有的挑战。随着人工智能(AI)的迅速崛起,传统的数据中心设计与运营模式遭遇了巨大压力。伟创力通信、企业和云业务总裁Rob Campbell 指出,超大规模数据中心建设面临独特挑战,传统运营模式亟待革新。
    的头像 发表于 03-06 13:58 756次阅读

    晶科鑫SJK晶振在不同领域的应用

    在科技时代,高性能芯片的需求日益增长。据《财富》杂志报道,Cerebras Systems推出的WSE-3 AI
    的头像 发表于 02-07 18:03 871次阅读