0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

预定下代超算第一?富士通144核Arm处理器公开

E4Life 来源:电子发烧友网 作者:周凯扬 2024-06-24 00:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)相信对超算市场有过一定了解的朋友,都对曾经的第一名富岳超算不陌生。这台2021年正式启用的超算,是全球首台登顶TOP500的Arm架构超算。富岳采用了富士通设计A64FX SoC,整个超算集群的峰值性能可以达到537.21PFlop/s。如此强大的性能,甚至于日本东京工业大学、日本东北大学等都宣布将借助富岳来开发日语生成式AI

然而在最新的TOP500排行榜上,随着更新的英特尔Xeon和AMD EPYC处理器纷纷到位,如今的富岳已经降至第四名的位置。为此,富士通也在开发A64FX的继任者,并计划用于下一代超算的开发中去。

Monaka,A64FX的继任者

作为一直在超算领域发力的头部厂商之一,富士通此前一直选择SPARC作为其计算处理器的架构,直到A64FX的出现。A64FX面世之时一度被称为最强Arm处理器,也让不少人对Arm在数据中心和HPC的前景有了新的改观。

然而这种众核处理器,除非经过特殊的架构优化,否则并不适合用于通用服务器,国产的申威26010服务器也是类似的设计思路。但不可否认在HPC应用下,众核处理器可以发挥出媲美甚至超越传统x86旗舰处理器的实力。

近日,富士通宣布了他们在研的下一代众核Arm处理器Monaka,该处理器除了改用Armv9架构,引入了SVE2之外,还采用了云原生的3D众核设计,专为数据中心做了能效优化。Monaka采用了3D Chiplet的设计方案,其中处理器核心die基于2nm工艺打造,而SRAM和IO die基于5nm工艺打造,通过TSV与核心die相连。
Monaka 3D众核架构 / 富士通

据富士通透露,2nm的核心die区域仅仅占了整个芯片面积的不到30%,从而带来极高的能效表现,只需用到风冷。同时3D众核架构使其可以塞入双插槽144个核心,实现极低的延迟和更高的带宽。

至于在软件支持上,富士通除了持续开发Linux OS中行业标准软件的支持外,也会参与发展与Arm相关的开源软件生态,加强在PythonJava、LLVM等标准工具上的性能表现。Monaka预计将于2027年正式亮相,考虑到其流片时间,富士通既有可能选择台积电、英特尔等现有的先进晶圆代工厂,也可能考虑正在建设2nm工厂的Rapidus。

HPC转向AI主导?

作为目前最有利可图的市场,AI正在驱动GPGPU聚焦在低精度计算的算力升级上。在CUDA平台的助力下,HPC生态的门槛也在持续降低。从这几年发布的新品来看,无论是FP16、FP8的算力都在成倍增长,然而在FP64这种传统HPC应用需要用到的高精度数据格式上,性能提升却相当有限。

更重要的是,要想通过堆量来提高HPC集群的FP64性能也不再现实了,因为GPU的TDP提升幅度甚至更高。为此,富士通的看法是,将更多的FP64单元放在CPU端,而将更多的HBM和低精度矩阵单元放在GPU端,这样构建HPC系统的客户就不再需要为GPU的巨额成本和巨量功耗买单,却可以利用其在深度学习上的卓越性能。同时,开发更多HPL-MxP应用,利用混合精度计算来提高效率。当然了,也可以施压GPU厂商进一步改善其FP64性能,只不过在生成式AI依旧火热的当下,让GPU厂商放弃这个摇钱树并不现实。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9501

    浏览量

    388920
  • 超算
    +关注

    关注

    1

    文章

    118

    浏览量

    9500
  • 富士通
    +关注

    关注

    2

    文章

    210

    浏览量

    55817
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    富士通FRAM秒写实时数据

    富士通MB85RC04VPNF-G-JNERE1 4Kbit工业级FRAM,150ns极速写入、1万亿次擦写、-40℃~+85℃宽温,I²C接口低功耗,SOP-8小封装,为PLC、电表、编码等边缘节点提供高可靠非易失存储。
    的头像 发表于 10-10 09:45 266次阅读
    <b class='flag-5'>富士通</b>FRAM秒写实时数据

    Andes晶心科技推出AndesCore 46系列处理器家族

    Andes晶心科技,作为高效能、低功耗32/64位RISC-V处理器的领导供货商及RISC-V国际组织的创始首席会员,今日宣布推出具有4个成员的AndesCore 46系列处理器家族。首款成员AX46MPV是
    的头像 发表于 08-13 14:02 2231次阅读

    富士通2025年第一季度营收7498亿日元

    富士通于7月30日发布了2025财年第一季度财报。根据财报显示,2025财年第一季度整体营收为7,498亿日元,调整后营业利润351亿日元,较上年度同期增长111.9%,利润率提升至
    的头像 发表于 08-07 15:01 1275次阅读

    Texas Instruments 适用于AM64x Sitalog ™处理器的SK-AM64B入门套件数据手册

    Texas Instruments适用于AM64x Sitara™处理器的SK-AM64B入门套件是个独立的测试和开发平台,是加速设计原型阶段的理想选择。AM64x处理器个双
    的头像 发表于 07-28 10:20 523次阅读
    Texas Instruments 适用于AM64x Sitalog ™<b class='flag-5'>处理器</b>的SK-AM64B入门套件数据手册

    揭秘瑞芯微力协处理器,RK3576/RK3588强大力搭档

    瑞芯微力协处理器-Gongga1(简称“贡嘎”),是瑞芯微针对旗舰芯片平台RK3576/RK3588等SoC平台配套的处理器。凭借其先进的封装技术、高性能低功耗、超低延迟响应和多
    的头像 发表于 07-17 10:00 845次阅读
    揭秘瑞芯微<b class='flag-5'>算</b>力协<b class='flag-5'>处理器</b>,RK3576/RK3588强大<b class='flag-5'>算</b>力搭档

    富士通发布2025年技术与服务愿景

    富士通株式会社发布了《Technology and Service Vision 2025(富士通技术与服务愿景2025)》,对商业与社会的未来愿景进行了总结与展望。借助人机智能协作驱动的跨行业
    的头像 发表于 06-28 10:15 1104次阅读

    龙芯处理器支持WINDOWS吗?

    龙芯处理器目前不支持原生运行Windows操作系统,主要原因如下: 架构差异 龙芯架构:龙芯早期基于MIPS架构,后续转向自主研发的LoongArch指令集(与x86/ARM不兼容
    发表于 06-05 14:24

    紫光展锐4G旗舰性能之王智能穿戴平台W527登场 三小异构处理器架构

    W527产品亮点: 1、业界领先的三小异构处理器架构,性能体验凌驾同类产品; 2、12nm工艺制程,微高集成3D SiP技术,PC
    的头像 发表于 06-03 16:44 8429次阅读
    紫光展锐4G旗舰性能之王智能穿戴平台W527登场 <b class='flag-5'>一</b>大<b class='flag-5'>核</b>三小<b class='flag-5'>核</b>异构<b class='flag-5'>处理器</b>架构

    适用于单核、双和四应用处理器的PMIC DA9063L-A数据手册

    DA9063L-A 是款功能强大的系统电源管理集成电路(PMIC),适用于单核、双和四应用处理器,例如那些基于 ARM® Cortex
    的头像 发表于 04-01 18:19 762次阅读
    适用于单核、双<b class='flag-5'>核</b>和四<b class='flag-5'>核</b>应用<b class='flag-5'>处理器</b>的PMIC DA9063L-A数据手册

    爆款推荐 | 迅为RK3568开发板4处理器+1T力NPU+好用到爆的配套资料和视频!

    爆款推荐 | 迅为RK3568开发板4处理器+1T力NPU+好用到爆的配套资料和视频!
    的头像 发表于 03-19 13:41 1200次阅读
    爆款推荐 | 迅为RK3568开发板4<b class='flag-5'>核</b><b class='flag-5'>处理器</b>+1T<b class='flag-5'>算</b>力NPU+好用到爆的配套资料和视频!

    AI MPU# 瑞萨RZ/V2H 四视觉 ,采用 DRP-AI3 加速和高性能实时处理器

    RZ/V2H 高端 AI MPU 采用瑞萨电子专有的AI 加速-动态可重配置处理器 (DRP-AI3)、四 Arm^®^ Cortex ^®^ -A55 (1.8GHz) Linu
    的头像 发表于 03-15 11:50 1947次阅读
    AI MPU# 瑞萨RZ/V2H 四<b class='flag-5'>核</b>视觉 ,采用 DRP-AI3 加速<b class='flag-5'>器</b>和高性能实时<b class='flag-5'>处理器</b>

    带四Arm Cortex-A57和四Arm Cortex-A53 CPU的RZ/G2H超高性能微处理器数据手册

    具有超高处理性能的四 Arm®Cortex®-A57(1.5GHz)和四 Arm Cortex-A53(1.2GHz)CPU,具有 3D
    的头像 发表于 03-12 17:59 1088次阅读
    带四<b class='flag-5'>核</b><b class='flag-5'>Arm</b> Cortex-A57和四<b class='flag-5'>核</b><b class='flag-5'>Arm</b> Cortex-A53 CPU的RZ/G2H超高性能微<b class='flag-5'>处理器</b>数据手册

    采用双Arm Cortex-A57 CPU的超高性能微处理器RZ/G2N数据手册

    RZ/G2N凭借双 Arm® Cortex®-A57(1.5GHz)处理器,具备更高规格的处理性能,同时拥有 3D 图形处理能力以及 4K
    的头像 发表于 03-10 17:05 990次阅读
    采用双<b class='flag-5'>核</b><b class='flag-5'>Arm</b> Cortex-A57 CPU的超高性能微<b class='flag-5'>处理器</b>RZ/G2N数据手册

    Andes晶心科技推出AndesCore AX66乱序纯量多核处理器IP

    Andes晶心科技(Andes Technology)作为高效能、低功耗、32/64位RISC-V处理器的领先供货商及RISC-V国际组织的创始顶级会员,今日宣布推出支持RVA23规范的AndesCore AX66乱序纯量多
    的头像 发表于 01-23 11:05 1682次阅读

    8FX-PRO(富士通编程)软件与使用手册

    8FX-PRO是ZEZHAO针对富士通8FX-MCU 研发生产的款专用离线脱机编程;解决富士通MCU用户批量生产烧录,在板更新软件编程烧录的问题.文件包含上位机软件,8FX-PRO
    发表于 12-18 16:59 7次下载