日本百亿亿次超算曝光:性能提升100倍,2021年争第一

章鹰 2018-07-11 11:19 次阅读

日本欲重夺超算第一的行动初见端倪,近日,富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试,研究者称,这台超算的应用性能将是前一代的100倍,达到百亿亿次级,计划在2021年推出。

日本计算机巨头富士通(Fujitsu)和日本最大的研究机构理化学研究所(RIKEN,简称理研)已经开始对下一代超级计算机的原型CPU进行实地测试,他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。

这台下一代超级计算机被称为“Post-K超级计算机”(Post-K supercomputer),是继两家合作机构开发出8 petaflops的“京”超级计算机(K Computer)之后开发的。“京”自2012年开始在理化学研究所内运行,并已经升级到11 petaflops的峰值性能。2014年11月,全部组装完成后的京LINPACK性能达到10 PFLOPS(即每秒1京),创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。

富士通在最近的一份新闻稿中称,他们目标是“创造出世界上最高性能的超级计算机”,“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。

如果他们实现了这一执行速度,那么Post-K超算将进入百亿亿次级别(exascale),1 exaflops表示每秒一佰京/一亿亿亿(1018)次浮点运算。

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU

为此,他们用Arm8A-SVE(可伸缩矢量扩展)512-bit架构取代了京超算的SPARC64 VIIIfx CPU,该架构已被增强为超级计算机使用,富士通和理研都参与了开发。

Post-K超算原型机的CPU package和CPU内存单元

新的设计在CPU上运行,计算节点具有48个核心和2个辅助核心,I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。

出于战略原因,富士通和理研都没有透露Post-K超算的节点总数。但是,位于神户的理研计算科学中心主任松冈聪(Satoshi Matsuoka)说,“这将是世界上最大的Arm系统,事实上,它可能是世界上最大的超级计算机。”

在系统互连方面,富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。

松冈聪表示,除了采用新的CPU之外,Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”,网络带宽也显著增加。

此外,富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说,为了提高应用程序的通用性,它还增加了对半精度浮点运算的支持,这种运算可以减少AI等应用程序的内存负载,在这些应用程序中,低精度是可以接受的。

除了采用Arm指令集架构外,富士通还与英国剑桥的Arm控股公司合作,该公司开发并授权Arm技术,以允许可伸缩矢量扩展实现新的指令。

此外,富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令,但是它没有定义芯片的内部结构。相反,这是微架构的工作,因为它直接影响处理器的性能,富士通认为这将是一个对它有利的重要差异化因素。

理研和富士通在采用新架构时看到了其他一些优势,尤其是设计本身的节能特性,比如电源开关,可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦,而京超算的耗电量为12.7兆瓦,尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。

富士通和理研都表示,它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统,”理研的松冈聪说。他补充说,这将有助于富士通的商业成功,因为“不仅可以向外部公司出售他们的系统,还可以出售芯片”。

与此同时,富士通“将为京超算提供兼容的性能平衡,以便在重新编译后可以迁移当前的应用程序。”

最近,在美国橡树岭国家实验室新安装的超级计算机Summit,使美国重获超级计算机全球排名的榜首位置,这是六年来的首次。根据6月份的Top500榜单,Summit取得了122.3 petaflops的性能,中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。

因此,假如Post-K在2021年前后上线,不过到时,它将发现,争夺领先地位的竞争对手比比皆是。比如,中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功,并且其原型机早已亮相。不过,松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说,Post-K可能表现出最快的解决时间和最大的可扩展性,因为它拥有出色的内存和网络带宽,以及出色的节能设计。”

毫无疑问,不久之后超算领域的竞争对手将会焕然一新。

收藏 人收藏
分享:

评论

相关推荐

富士通以RFID技术推动物联网应用

据罗总介绍,该创新技术的目标是要减少甚至避免人们在一些应用场景下对电池的依赖。以最新推出的MB97R....

发表于 08-15 10:42 37次 阅读
富士通以RFID技术推动物联网应用

测试Arduino代码示例及功能介绍

业界认为,物联网 (IoT) 对紧凑型无头微控制器板的快速增长起到了重要作用,控制器板专为传感器和致....

的头像 Duke 发表于 08-15 09:52 398次 阅读
测试Arduino代码示例及功能介绍

下载TM4C123的TIVA程序包提示Request Entity Too Large怎么解决?

我想学习TM4C123这个ARM芯片,下载TIVA程序包的时候,总是提示 Request Entity Too Large A request entity ...

发表于 08-15 07:32 39次 阅读
下载TM4C123的TIVA程序包提示Request Entity Too Large怎么解决?

请问TM4C系列的ARM对晶振的要求到底有多严格?

为新项目选择了TM4C平台作为主控制芯片,用到了该芯片的几乎所有的接口,SSI,I2C,UART,PWM,USB,CAN等...

发表于 08-15 06:41 15次 阅读
请问TM4C系列的ARM对晶振的要求到底有多严格?

符合IEEE 802.3标准的紧凑型CAN转以太网转换器参考设计包括原理图,BOM及光绘文件

描述 此参考设计展示了使用 TM4C129XNCZAD 32 位 ARM® Cortex™-M4F MCU 的小型控制器接入网络 (CAN) ...

发表于 08-15 06:17 84次 阅读
符合IEEE 802.3标准的紧凑型CAN转以太网转换器参考设计包括原理图,BOM及光绘文件

STM32系列的32位微控制器详细产品数据手册免费下载

按内核架构分为不同产品: 主流产品(STM32F0、STM32F1、STM32F3)、超低功耗产品....

发表于 08-14 17:41 37次 阅读
STM32系列的32位微控制器详细产品数据手册免费下载

arm加载fpga程序为什么DONE信号一直为低?

[ENV] 我们的一块板卡上有FPGA(7A200T),ARM(tm4c1294),FLASH(N25Q),想通过arm上电加载fpga启动,过程如下;...

发表于 08-14 14:35 37次 阅读
arm加载fpga程序为什么DONE信号一直为低?

ARM是一款什么样的处理器

体积小、低功耗、低成本、高性能; 支持Thumb(16位)/ARM(32位)双指令集,能很好的兼容8位/16位器件; 大量使用寄存器,指令...

发表于 08-14 13:55 206次 阅读
ARM是一款什么样的处理器

ARM Cortex-M4中断优先级和嵌套

我前面提到一句,M4虽然指令集是向下兼容M0+的,但是在中断优先级管理上是有区别的,由于M4的中断源....

的头像 电子技术应用ChinaAET 发表于 08-14 09:29 476次 阅读
ARM Cortex-M4中断优先级和嵌套

STM32F101xx和STM32F103xx的固件函数库详细整理资料免费下载

本手册介绍了 32 位基于 ARM 微控制器 STM32F101xx 与 STM32F103xx 的....

发表于 08-14 08:00 39次 阅读
STM32F101xx和STM32F103xx的固件函数库详细整理资料免费下载

请问使用stm32f4比较多的浮点运算就会串口打印乱码是什么原因?

使用stm32f405,少量的浮点运算,串口打印正常,但是添加比较过的运算,串口就打印乱码!! 我调大了堆栈空间,问题还是依然在...

发表于 08-14 06:19 149次 阅读
请问使用stm32f4比较多的浮点运算就会串口打印乱码是什么原因?

浅谈ARM 7和ARM 9两类处理器

[table] [tr][td]    目前应用最多的是ARM 7和ARM9两类处理器。    ARM 7较便宜,可跑ucl...

发表于 08-14 05:46 31次 阅读
浅谈ARM 7和ARM 9两类处理器

ARM与嵌入式Linux的入门建议

也许你会注意到,现在做嵌入式的人中,做linux研究的人远比做WinCE的人多,很多产家提供的资料也是以linux为主。我一直很难理...

发表于 08-13 17:40 213次 阅读
ARM与嵌入式Linux的入门建议

国产CPU的发展现状分析

目前,主要的CPU架构有四种:ARM、X86、MIPS、Power。其中ARM/MIPS/Power....

的头像 Linuxer 发表于 08-13 17:25 280次 阅读
国产CPU的发展现状分析

Firefly支持AI引擎Tengine,性能提升,轻松搭建AI计算框架

Tengine 是OPEN AI LAB 为嵌入式设备开发的一个轻量级、高性能并且模块化的引擎。基于ARM平台高效的计算库实现,针...

发表于 08-13 15:58 394次 阅读
Firefly支持AI引擎Tengine,性能提升,轻松搭建AI计算框架

一文盘点孙正义背后的“自动驾驶帝国”

“时代太好,感觉睡觉都在浪费时间。”孙正义的言语间透漏着对未来的渴望,以及拥抱物联网时代的热情。而他....

的头像 章鹰 发表于 08-13 15:39 864次 阅读
一文盘点孙正义背后的“自动驾驶帝国”

深度解析与探讨:嵌入式系统的高低温故障的根源

ARM7、ARM9 还有PXA3XX 等等嵌入式ARM都存在高低温时容易爆发故障?尤其是主频越高的CPU,越容易爆发高低温故障...

发表于 08-13 13:44 254次 阅读
深度解析与探讨:嵌入式系统的高低温故障的根源

ARM推出新架构,最早产品或于明年推出

在早些时候于旧金山举行的一场活动中,Arm 公开了三款为移动设备而设的全新芯片设计。首先在 CPU ....

的头像 39度创意研究所 发表于 08-13 10:29 178次 阅读
ARM推出新架构,最早产品或于明年推出

四大移动芯片巨头加大投入物联网

从各大芯片巨头在物联网领域的动作及战略来看,每家公司的优势与弱点都不太一样,但它们都在发挥自身最大优....

的头像 物联之家网 发表于 08-13 10:00 565次 阅读
四大移动芯片巨头加大投入物联网

Arm收购Stream Technologies为物联网设备保驾护航

将Stream团队加入到Arm加速了其发展,使客户能够从其连接设备生成的数据中获取真实可靠的信息。

的头像 ssdfans 发表于 08-13 09:36 444次 阅读
Arm收购Stream Technologies为物联网设备保驾护航

如何设计一个基于嵌入式系统的智能交通灯控制系统?

电源是整个系统的动力源,对于整个系统运行过程处于至关重要的作用,系统中不同模块对供电需求也各不相同。....

发表于 08-12 09:15 95次 阅读
如何设计一个基于嵌入式系统的智能交通灯控制系统?

ARM:半导体界真正的扛把子,离开他谁都不行

以下,是市面上主流的CV芯片中包含的Cortex系列芯片,这些芯片厂商涵盖GPU、CPU、FPGA等....

的头像 高工智能汽车 发表于 08-11 11:10 876次 阅读
ARM:半导体界真正的扛把子,离开他谁都不行

飞腾CPU的演进与我国超级计算机的成长史是同步的

“天河一号”,是由国防科技大学研制的我国首台千万亿次超级计算机,采用6144个英特尔INTEL通用多....

的头像 电子技术应用ChinaAET 发表于 08-10 09:48 521次 阅读
飞腾CPU的演进与我国超级计算机的成长史是同步的

基于ARM架构的优化工业控制方案设计详解

运营现代化的工厂和加工车间,在技术上都非常复杂。为实现对机械设备和生产过程的精确控制,生产企业需要采....

发表于 08-09 16:59 101次 阅读
基于ARM架构的优化工业控制方案设计详解

采用自研芯片的神威E级原型机系统通过课题验收

5日,记者从国家超级计算济南中心获悉,全部采用自主芯片研制的新一代神威E级原型机系统通过课题验收,正....

的头像 芯师爷 发表于 08-09 14:37 348次 阅读
采用自研芯片的神威E级原型机系统通过课题验收

以骁龙845为例 比较X86与ARM真正的区别

高通马上要推晓龙855,华为也要推出麒麟980处理器了,通过媒体的泛滥宣扬,感觉到现在手机端的处理器....

的头像 EETOP 发表于 08-09 11:06 647次 阅读
以骁龙845为例 比较X86与ARM真正的区别

SpiNNaker为模拟大规模神经网络提供高性能平台

科研人员利用一个名为SpiNNaker的神经形态计算机开展大脑仿真实验,取得的效果与利用传统超级计算....

的头像 人工智能快报 发表于 08-09 10:06 519次 阅读
SpiNNaker为模拟大规模神经网络提供高性能平台

VD-B501蓝牙4.0 低能耗模块详细资料和数据免费下载

VD-B501是一种高度集成的蓝牙4.0 BLE模块,设计用于2.4GHz ISM频段的高数据速率、....

发表于 08-08 08:00 38次 阅读
VD-B501蓝牙4.0 低能耗模块详细资料和数据免费下载

随着工业控制要求越来越高,ARM架构处理器优化也在不断进步

运营现代化的工厂和加工车间,在技术上都非常复杂。为实现对机械设备和生产过程的精确控制,生产企业需要采....

发表于 08-07 16:00 115次 阅读
随着工业控制要求越来越高,ARM架构处理器优化也在不断进步

ARM积极迎接物联网时代,英特尔以战略布局驱动万物智能互联

物联网作为互联网发展趋势,也是整个人类梦想之一,全球巨头都已瞄准,ARM则希望到2035年实现1万亿....

的头像 传感物联网 发表于 08-07 15:25 974次 阅读
ARM积极迎接物联网时代,英特尔以战略布局驱动万物智能互联

Arm收购Treasure Data,迈向物联网转型新阶段

8月3日, Arm宣布收购企业数据管理领导厂商Treasure Data,结合日前收购Steam的....

的头像 章鹰 发表于 08-07 14:23 1020次 阅读
Arm收购Treasure Data,迈向物联网转型新阶段

Arm收购Treasure Data,开拓物联网新价值

Arm宣布收购企业数据管理领导厂商Treasure Data,结合日前收购Steam的连接管理能力以....

的头像 嵌入式资讯精选 发表于 08-06 16:41 635次 阅读
Arm收购Treasure Data,开拓物联网新价值

吹响进军物联网的号角 Treasure Data投入ARM怀抱

企业级数据分析市场上已经是硝烟弥漫,总部位于加州一家初创公司 Treasure Data在今天投入A....

的头像 物联网技术 发表于 08-05 09:07 546次 阅读
吹响进军物联网的号角 Treasure Data投入ARM怀抱

联想的超算到底怎么样呢?联想深腾X8800技术自主技术到底有多少?

一方面,联想作为商业公司,而商业公司的逐利性使联想更愿意采用国外成熟技术,而不是国内单位自主研发的技....

的头像 科工力量 发表于 08-03 17:05 1643次 阅读
联想的超算到底怎么样呢?联想深腾X8800技术自主技术到底有多少?

ARM斥资6亿美元收购Treasure Data,有利提升物联网设备的连接性

据消息报道,知情人士透露,软银旗下英国芯片设计商ARM已经同意收购美国数据分析公司Treasure ....

的头像 EETOP 发表于 08-02 19:04 1308次 阅读
ARM斥资6亿美元收购Treasure Data,有利提升物联网设备的连接性

前5年的中国超算有多强?现在中国超算落后了吗?

天河三号项目团队自主设计了三款芯片:“迈创”众核处理器(Matrix-2000+)、互连接口芯片、路....

的头像 中关村集成电路设计园 发表于 08-02 17:16 709次 阅读
前5年的中国超算有多强?现在中国超算落后了吗?

ARM与嵌入式Linux入门的6个建议

也许你会注意到,现在做嵌入式的人中,做linux研究的人远比做WinCE的人多,很多产家提供的资料也....

的头像 玩转单片机 发表于 08-02 17:02 361次 阅读
ARM与嵌入式Linux入门的6个建议

AI的“马斯洛”需求层次,Arm如何满足?

有研究分析显示:目前中国AI开发者正在接受从封闭的单机系统转向快捷灵活的开源框架的新一代AI技术演进....

的头像 章鹰 发表于 08-02 11:02 962次 阅读
AI的“马斯洛”需求层次,Arm如何满足?

ARM斥资6亿美元收购Treasure Data

软银旗下英国芯片设计企业ARM已经同意收购美国数据分析公司Treasure Data,交易价格约为6....

的头像 DIGITIMES 发表于 08-01 09:48 380次 阅读
ARM斥资6亿美元收购Treasure Data

网曝三星将自主研发GPU,那么三星自主设计和研发GPU又是为什么?

前段时间,一直有消息称韩国电子巨头三星即将自主设计GPU图形处理单元,为此不仅有招聘信息侧面证明,更....

的头像 半导体动态 发表于 07-31 17:00 457次 阅读
网曝三星将自主研发GPU,那么三星自主设计和研发GPU又是为什么?

天河3号原型机完成研发与部署 多种芯片与操作系统采用本土产品

近期中国新一代百京次(E级;Exa级)超级计算机天河3号原型机传出已在国家超级计算天津中心完成研发与....

的头像 DIGITIMES 发表于 07-31 16:34 464次 阅读
天河3号原型机完成研发与部署 多种芯片与操作系统采用本土产品

Zynq UltraScale+ MPSoC系列新增新型双核器件,提高了ZynqMPSoC产品组合的可扩展性

赛灵思公司 (Xilinx)今天宣布其Zynq UltraScale+ MPSoC系列新增新型双核....

发表于 07-31 09:38 75次 阅读
Zynq UltraScale+ MPSoC系列新增新型双核器件,提高了ZynqMPSoC产品组合的可扩展性

ARM收购美国的数据分析公司Treasure Data 收购金额为6亿美元

据知情人士透露,软银集团旗下的英国芯片公司ARM已同意收购总部位于美国的数据分析公司Treasure....

发表于 07-31 09:13 469次 阅读
ARM收购美国的数据分析公司Treasure Data 收购金额为6亿美元

keil arm stm32的应用程序免费下载

本文档的主要内容详细介绍的是keil arm stm32的应用程序免费下载这是stm32单片机的软件

发表于 07-31 08:00 78次 阅读
keil arm stm32的应用程序免费下载

ARM mbed IoT设备平台,全新设计环境简化加密过程

不断壮大的DeepCover参考设计产品组合是Maxim在安全微控制器、协处理器以及安全认证器领域数....

发表于 07-30 15:19 448次 阅读
ARM mbed IoT设备平台,全新设计环境简化加密过程

布局物联网 外媒传ARM同意收购美国数据分析公司

7月30日消息,据彭博社报道,知情人士披露,软银集团(SoftBank)旗下英国电脑芯片设计子公司A....

的头像 章鹰 发表于 07-30 11:20 1261次 阅读
布局物联网 外媒传ARM同意收购美国数据分析公司

浅谈STM32芯片行丝印含义,固件库命名规则及三大结构发展图示

外围模块的功能函数的名字,需要有相应的外围模块缩写加下划线这样的前缀,每个单词的首字符要大写。例如S....

发表于 07-28 10:02 173次 阅读
浅谈STM32芯片行丝印含义,固件库命名规则及三大结构发展图示

美国重夺超算第一,中国反超还有机会吗?

超算,超级计算机,是所有计算机中运算速度最快、性能最强的一类,在科研和军事等尖端领域拥有举足轻重的地....

的头像 EETOP 发表于 07-27 17:05 797次 阅读
美国重夺超算第一,中国反超还有机会吗?

ARM Linux各种驱动的中断服务程序工作在ARM的IRQ模式吗?

可见,ARM Linux最初进入IRQ模式后,比较快速地从IRQ模式切换到了SVC模式,但是这个时候....

的头像 Linuxer 发表于 07-27 14:54 318次 阅读
ARM Linux各种驱动的中断服务程序工作在ARM的IRQ模式吗?

Shippable宣布和Arm,Packet.net达成合作伙伴关系

现在你可以开始用Arm aarch64的服务器来做CI了,使用方法跟正常的Shippable CI的....

的头像 Arm芯闻 发表于 07-27 14:34 1170次 阅读
Shippable宣布和Arm,Packet.net达成合作伙伴关系

谁掌握了超算能力,谁就在科技领域占据了一个制高点

 “天河一号”研发部部长孟祥飞在十九大“党代表通道”上透露,他们正在进行百亿亿次超级计算机的研发,预....

的头像 电子技术应用ChinaAET 发表于 07-27 09:06 410次 阅读
谁掌握了超算能力,谁就在科技领域占据了一个制高点

应用材料公司与Arm以及Symetrix合作开发“神经形态”的电子开关

2018年7月25日——应用材料公司今天宣布,已与美国国防部高级研究计划局(DARPA)签订合同,开....

的头像 人间烟火123 发表于 07-26 15:33 1268次 阅读
应用材料公司与Arm以及Symetrix合作开发“神经形态”的电子开关

新思科技助力包括Cortex-A76和Mali-G76处理器在内的Arm最新高级移动IP的早期使用者实现成功流片

DesignWare Interface IP包括USB、DDR、PCI Express、MIPI和....

的头像 人间烟火123 发表于 07-26 15:21 1052次 阅读
新思科技助力包括Cortex-A76和Mali-G76处理器在内的Arm最新高级移动IP的早期使用者实现成功流片

一文带你了解ARM的发展历程

ARM公司既不生产芯片也不销售芯片,它只出售芯片技术授权。却做到了在手持设备市场上占有90%以上的份....

的头像 半导体行业联盟 发表于 07-26 08:20 1212次 阅读
一文带你了解ARM的发展历程

ARM与RISC-V:精简指令集兄弟之争

ARM教育计划分为三个阶段,一是基于ARM技术和应用进行核心课程的开放;二是为高校的课程和相关教育套....

的头像 芯师爷 发表于 07-25 19:06 659次 阅读
ARM与RISC-V:精简指令集兄弟之争

一场关于ARM的深度谈话

过去几年里,半导体产业风云变幻,除了大小企业之间的并购不断之外,作为新挑战者的中国企业也在全球市场上....

的头像 安创空间ARMaccelerator 发表于 07-25 15:44 611次 阅读
一场关于ARM的深度谈话

富士通量子计算芯片即将量产 英特尔不甘落后推出双量子计算

量子计算之所以重要,是因为其具备快速解决过去很难利用传统计算架构解决的“人类规模”问题的能力,比如说....

的头像 芯师爷 发表于 07-25 15:04 565次 阅读
富士通量子计算芯片即将量产 英特尔不甘落后推出双量子计算

OMAP-L138 C6000 DSP ARM处理器的详细中文数据手册免费下载

OMAP-L138 C6000 DSP+ARM 处理器 是一款低功耗 应用 处理器,该处理器基于 A....

发表于 07-25 08:00 65次 阅读
OMAP-L138 C6000 DSP ARM处理器的详细中文数据手册免费下载

以ARM处理器为基础的吸尘机器人硬件设计方案详解

随着人们生活水平的日益提高,我国人口的老龄化也越来明显,吸尘机器人作为服务机器人的一种,能够代替人....

发表于 07-24 15:22 144次 阅读
以ARM处理器为基础的吸尘机器人硬件设计方案详解

一文带你了解CPLD、FPGA、DSP之间的区别与联系

ARM(Advanced RISC Machines)是微处理器行业的一家知名企业,设计了大量高性....

发表于 07-23 15:40 176次 阅读
一文带你了解CPLD、FPGA、DSP之间的区别与联系