0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

日本百亿亿次超算曝光:性能提升100倍,2021年争第一

章鹰观察 来源:新智元 作者:新智元 2018-07-11 11:19 次阅读

日本欲重夺超算第一的行动初见端倪,近日,富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试,研究者称,这台超算的应用性能将是前一代的100倍,达到百亿亿次级,计划在2021年推出。

日本计算机巨头富士通(Fujitsu)和日本最大的研究机构理化学研究所(RIKEN,简称理研)已经开始对下一代超级计算机的原型CPU进行实地测试,他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。

这台下一代超级计算机被称为“Post-K超级计算机”(Post-K supercomputer),是继两家合作机构开发出8 petaflops的“京”超级计算机(K Computer)之后开发的。“京”自2012年开始在理化学研究所内运行,并已经升级到11 petaflops的峰值性能。2014年11月,全部组装完成后的京LINPACK性能达到10 PFLOPS(即每秒1京),创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。

富士通在最近的一份新闻稿中称,他们目标是“创造出世界上最高性能的超级计算机”,“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。

如果他们实现了这一执行速度,那么Post-K超算将进入百亿亿次级别(exascale),1 exaflops表示每秒一佰京/一亿亿亿(1018)次浮点运算。

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU

为此,他们用Arm8A-SVE(可伸缩矢量扩展)512-bit架构取代了京超算的SPARC64 VIIIfx CPU,该架构已被增强为超级计算机使用,富士通和理研都参与了开发。

Post-K超算原型机的CPU package和CPU内存单元

新的设计在CPU上运行,计算节点具有48个核心和2个辅助核心,I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。

出于战略原因,富士通和理研都没有透露Post-K超算的节点总数。但是,位于神户的理研计算科学中心主任松冈聪(Satoshi Matsuoka)说,“这将是世界上最大的Arm系统,事实上,它可能是世界上最大的超级计算机。”

在系统互连方面,富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。

松冈聪表示,除了采用新的CPU之外,Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”,网络带宽也显著增加。

此外,富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说,为了提高应用程序的通用性,它还增加了对半精度浮点运算的支持,这种运算可以减少AI等应用程序的内存负载,在这些应用程序中,低精度是可以接受的。

除了采用Arm指令集架构外,富士通还与英国剑桥的Arm控股公司合作,该公司开发并授权Arm技术,以允许可伸缩矢量扩展实现新的指令。

此外,富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令,但是它没有定义芯片的内部结构。相反,这是微架构的工作,因为它直接影响处理器的性能,富士通认为这将是一个对它有利的重要差异化因素。

理研和富士通在采用新架构时看到了其他一些优势,尤其是设计本身的节能特性,比如电源开关,可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦,而京超算的耗电量为12.7兆瓦,尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。

富士通和理研都表示,它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统,”理研的松冈聪说。他补充说,这将有助于富士通的商业成功,因为“不仅可以向外部公司出售他们的系统,还可以出售芯片”。

与此同时,富士通“将为京超算提供兼容的性能平衡,以便在重新编译后可以迁移当前的应用程序。”

最近,在美国橡树岭国家实验室新安装的超级计算机Summit,使美国重获超级计算机全球排名的榜首位置,这是六年来的首次。根据6月份的Top500榜单,Summit取得了122.3 petaflops的性能,中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。

因此,假如Post-K在2021年前后上线,不过到时,它将发现,争夺领先地位的竞争对手比比皆是。比如,中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功,并且其原型机早已亮相。不过,松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说,Post-K可能表现出最快的解决时间和最大的可扩展性,因为它拥有出色的内存和网络带宽,以及出色的节能设计。”

毫无疑问,不久之后超算领域的竞争对手将会焕然一新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8639

    浏览量

    361615
  • 超级计算机
    +关注

    关注

    2

    文章

    431

    浏览量

    41605
  • 浮点运算
    +关注

    关注

    0

    文章

    19

    浏览量

    11098
  • 富士通
    +关注

    关注

    1

    文章

    178

    浏览量

    54295
收藏 人收藏

    评论

    相关推荐

    科普 | 文了解FPGA技术知识

    以上,价格和能耗缩小了一千以上。受到先进制程迭代的推动,FPGA 的架构不断更新。1985 ,Xilinx 公司推出了全球第一款 FPGA 产品 XC2064,采用 2μm 工艺,包含 64 个
    发表于 03-08 14:57

    iBeLink KS MAX 10.5T大力领跑KAS新领域

    —KHeavyHash。在市场上,有款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    【重磅新品】盘古100K开发板,紫光同创PG2L100H,Logos2系列,性能全面提升

    工艺,提供丰富的片上资源和高性能接口,支持Serdes\PCle\Gen2\DDR3等特性,相较于第一代Logos,性能提升50%,功耗降低40%,适用于大批量、低功耗、高
    发表于 12-29 16:31

    2024新品推荐|盘古100K开发板,紫光同创PG2L100H,Logos2系列,性能全面提升

    工艺,提供丰富的片上资源和高性能接口,支持Serdes\\\\PCle\\\\Gen2\\\\DDR3等特性,相较于第一代Logos,性能提升50%,功耗降低40%,适用于大批量、低功
    发表于 12-28 18:09

    电机在停机段时间后,在第一次开车时有异响的原因?

    我们是部矿井提升机,提升机用的西玛格的,电机是西门子变频电机,采用SM150驱动,当电机在停机段时间后,在第一次开车时有异响,但当滚筒转
    发表于 12-13 07:38

    AD8422设计放大100,+/-12供电电路,当输入超过0.1v时供电电源出现偶谐波怎么消除?

    AD8422设计放大100,+/-12供电电路,当输入超过0.1v时,供电电源出现偶谐波,如何能消除这个影响呢?
    发表于 11-17 13:29

    制作实用的PCB曝光

    为PCB制作个Arduino电子紫外线/LED曝光盒。让曝光过程可控,可定时!下载文件包含:相关代码+线路图+物料表+PCB文件
    发表于 09-25 06:36

    2023光博会回顾丨亿源通展示应用于400G/800G的高速光组件

    9月6-8日,第24届中国国际光电博览会在深圳国际会展中心盛大举办。根据CIOE光博会官方数据显示,展会3天共计10万名的观众人数,同比2021整体增长20.17%。亿源通科技也携
    发表于 09-15 10:16

    华秋观察 | 通讯产品 PCB 面临的挑战,文告诉你

    迎来巨大的挑战和发展机遇。 根据Prismark报告预测,2021全球PCB产值为804.49亿美元,较上年增长23.4%,各区域PCB产业均呈现持续增长态势。2021
    发表于 06-09 14:19

    国产第二代“香山”RISC-V 开源处理器计划 6 月流片:基于中芯国际 14nm 工艺,性能 Arm A76

    月流片,性能超过 2018 ARM 发布的 Cortex-A76,主频 2GHz@14nm,SPEC 2006 得分为 20 分。香山用湖来命名每代架构 —— 第一代架构是雁栖
    发表于 06-05 11:51

    圣邦股份:品类持续深挖,高端加速推进,模拟龙头稳健发展

    增长24.92%。当期电源管理芯片业务实现19.91亿元收入,较上年同期增长30.21%,占主营业务收入的比例为62.47%。电源管理芯片毛利率从2021的53.03%提升至55.4
    发表于 06-02 14:13

    2022营收31.88亿,国产模拟 IC 头部企业持续扩充品类促发展

    增长24.92%。当期电源管理芯片业务实现19.91亿元收入,较上年同期增长30.21%,占主营业务收入的比例为62.47%。电源管理芯片毛利率从2021的53.03%提升至55.4
    发表于 06-02 14:06

    性能ARM A76!国产第二代“香山”RISC-V开源处理器最快6月流片

    A76,为工业控制、汽车、通信等泛工业领域提供CPU IP核;高性能核则基于第三代“香山”(昆明湖)性能提升,对标ARM N2,为数据中心和力设施等领域提供高
    发表于 05-28 08:41

    体技术发展现状和未来趋势

    电子发烧友网官方
    发布于 :2023年04月25日 17:21:41

    PROTEUS示波器怎么只能第一次仿真时用?

    PROTEUS示波器怎么只能第一次仿真时用?求大神指点
    发表于 04-23 16:35