0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

日本百亿亿次超算曝光:性能提升100倍,2021年争第一

章鹰观察 来源:新智元 作者:新智元 2018-07-11 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日本欲重夺超算第一的行动初见端倪,近日,富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试,研究者称,这台超算的应用性能将是前一代的100倍,达到百亿亿次级,计划在2021年推出。

日本计算机巨头富士通(Fujitsu)和日本最大的研究机构理化学研究所(RIKEN,简称理研)已经开始对下一代超级计算机的原型CPU进行实地测试,他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。

这台下一代超级计算机被称为“Post-K超级计算机”(Post-K supercomputer),是继两家合作机构开发出8 petaflops的“京”超级计算机(K Computer)之后开发的。“京”自2012年开始在理化学研究所内运行,并已经升级到11 petaflops的峰值性能。2014年11月,全部组装完成后的京LINPACK性能达到10 PFLOPS(即每秒1京),创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。

富士通在最近的一份新闻稿中称,他们目标是“创造出世界上最高性能的超级计算机”,“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。

如果他们实现了这一执行速度,那么Post-K超算将进入百亿亿次级别(exascale),1 exaflops表示每秒一佰京/一亿亿亿(1018)次浮点运算。

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU

为此,他们用Arm8A-SVE(可伸缩矢量扩展)512-bit架构取代了京超算的SPARC64 VIIIfx CPU,该架构已被增强为超级计算机使用,富士通和理研都参与了开发。

Post-K超算原型机的CPU package和CPU内存单元

新的设计在CPU上运行,计算节点具有48个核心和2个辅助核心,I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。

出于战略原因,富士通和理研都没有透露Post-K超算的节点总数。但是,位于神户的理研计算科学中心主任松冈聪(Satoshi Matsuoka)说,“这将是世界上最大的Arm系统,事实上,它可能是世界上最大的超级计算机。”

在系统互连方面,富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。

松冈聪表示,除了采用新的CPU之外,Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”,网络带宽也显著增加。

此外,富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说,为了提高应用程序的通用性,它还增加了对半精度浮点运算的支持,这种运算可以减少AI等应用程序的内存负载,在这些应用程序中,低精度是可以接受的。

除了采用Arm指令集架构外,富士通还与英国剑桥的Arm控股公司合作,该公司开发并授权Arm技术,以允许可伸缩矢量扩展实现新的指令。

此外,富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令,但是它没有定义芯片的内部结构。相反,这是微架构的工作,因为它直接影响处理器的性能,富士通认为这将是一个对它有利的重要差异化因素。

理研和富士通在采用新架构时看到了其他一些优势,尤其是设计本身的节能特性,比如电源开关,可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦,而京超算的耗电量为12.7兆瓦,尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。

富士通和理研都表示,它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统,”理研的松冈聪说。他补充说,这将有助于富士通的商业成功,因为“不仅可以向外部公司出售他们的系统,还可以出售芯片”。

与此同时,富士通“将为京超算提供兼容的性能平衡,以便在重新编译后可以迁移当前的应用程序。”

最近,在美国橡树岭国家实验室新安装的超级计算机Summit,使美国重获超级计算机全球排名的榜首位置,这是六年来的首次。根据6月份的Top500榜单,Summit取得了122.3 petaflops的性能,中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。

因此,假如Post-K在2021年前后上线,不过到时,它将发现,争夺领先地位的竞争对手比比皆是。比如,中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功,并且其原型机早已亮相。不过,松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说,Post-K可能表现出最快的解决时间和最大的可扩展性,因为它拥有出色的内存和网络带宽,以及出色的节能设计。”

毫无疑问,不久之后超算领域的竞争对手将会焕然一新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9507

    浏览量

    389063
  • 超级计算机
    +关注

    关注

    2

    文章

    479

    浏览量

    43175
  • 浮点运算
    +关注

    关注

    0

    文章

    19

    浏览量

    11441
  • 富士通
    +关注

    关注

    2

    文章

    210

    浏览量

    55828
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    “四力平台,芯片国产化率九成,兼容8种国产AI芯片

    调度平台可支持每天上亿力调用,能调度全国1/6的力规模,体化效率
    的头像 发表于 04-13 00:03 3616次阅读

    DeepSeek最新论文:训练速度提升9,推理速度快11

    是上代Grok2的15左右。在Benchmarks中,Grok3毫无悬念成功地领先Deepseek R1、o3 mini等对手。   不过用如此大规模的力集群,花费上代15
    的头像 发表于 02-20 11:25 2685次阅读
    DeepSeek最新论文:训练速度<b class='flag-5'>提升</b>9<b class='flag-5'>倍</b>,推理速度快11<b class='flag-5'>倍</b>!

    亚马逊发布新代AI芯片Trainium3,性能提升4

    Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。     作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、能效与扩展性的全面跃升。其计算性能较前代Train
    的头像 发表于 12-09 08:37 7697次阅读
    亚马逊发布新<b class='flag-5'>一</b>代AI芯片Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    被疯抢!国产GPU第一股,网上初步申购额4000

    股本为4.7亿股。   测算下来,按照发行价上市后,摩尔线程的市值将达到537元左右,比IPO前估值翻了近一倍。   当前摩尔线程的发行中签率结果已经出炉,据摩尔线程公布的回拨机制,由于本次网上发行初步有效申购倍数为4126.
    的头像 发表于 11-26 13:52 1884次阅读

    昆仑芯节点亮相,单卡性能提升95%

    ;天池512节点将于 2026下半年上市,最高支持512卡互联、卡间互联总带宽提升1、单节点即可完成万亿参数模型训练。     早在今年4月首亮相之后,昆仑芯
    的头像 发表于 11-16 07:32 9840次阅读
    昆仑芯<b class='flag-5'>超</b>节点亮相,单卡<b class='flag-5'>性能</b><b class='flag-5'>提升</b>95%

    今日看点:谷歌芯片实现量子计算比经典快13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    性能甚至超越了最快的经典超级计算机,速度快 13000 。   Willow是谷歌于去年12月宣布推出的量子芯片。当时,Willow量子芯片在5分钟内完成了项传统超级计算机需要“10的25
    发表于 10-23 10:20 1252次阅读

    体AI芯片公司九天睿芯完成亿元B轮融资

    全球领先的存体AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B轮融资,规模亿元人民币。
    的头像 发表于 10-10 11:41 750次阅读

    力不够、交付太慢?捷智裸金属租赁对标物理机性能,让你立马用上高力!

    2025国产大模型升级带动力租赁需求爆发,高性能力服务器“机难求”。中研普华预测,今年我国
    的头像 发表于 09-12 20:06 1103次阅读
    <b class='flag-5'>算</b>力不够、交付太慢?捷智<b class='flag-5'>算</b>裸金属租赁对标物理机<b class='flag-5'>性能</b>,让你立马用上高<b class='flag-5'>算</b>力!

    富士通2025第一季度营收7498亿日元

    富士通于7月30日发布了2025财年第一季度财报。根据财报显示,2025财年第一季度整体营收为7,498亿日元,调整后营业利润351亿日元,较上一年
    的头像 发表于 08-07 15:01 1285次阅读

    软通智完成亿级A轮融资,加速AI力产业布局

    北京 20256月18日 /美通社/ -- 近日,软通动力旗下软通智科技(广东)集团有限公司(以下简称"软通智")完成亿级A轮融资,
    的头像 发表于 06-18 15:37 439次阅读

    WiFi芯片厂商集体起飞!高通、博通狂揽百亿订单,中国黑马增速300%

    营收破百亿,瑞昱、乐鑫增速碾压行业,更有玩家借AI和WiFi 7实现弯道超车。这场芯片界的“速度与激情”背后,藏着哪些财富密码? 、巨头争霸:高通、博通垄断高端,单季吸金百亿 美国
    的头像 发表于 05-15 11:22 2406次阅读
    WiFi芯片厂商集体起飞!高通、博通狂揽<b class='flag-5'>百亿</b>订单,中国黑马增速<b class='flag-5'>超</b>300%

    集成电路测试中的关键角色:MEDER微型继电器

    脉冲。 MEDER微型继电器:理想的解决方案MEDER特殊设计的CRF微型继电器系列,体积小巧且能够承受上亿的运行任务,具备快速切换和对高速脉冲的传输能力,具有卓越的可靠性和
    发表于 04-23 16:50

    京东方发布2025第一季度业绩预告

    20254月15日,京东方科技集团股份有限公司(京东方A:000725;京东方B:200725)发布2025第一季度业绩预告,预计第一季度营业收入同比增长
    的头像 发表于 04-16 16:11 1157次阅读

    讯通信签订8.5亿元智集成服务大单

    讯通信近日发布公告,宣布公司成功与中特新联科技产业发展(北京)有限公司签署了采购合同及相应的采购订单。根据合同内容,中特新联将向讯通信采购智集成服务,此次合同的总金额(含税)高达约8.5
    的头像 发表于 02-08 09:34 1098次阅读

    华为2024营收8600亿!DeepSeek扩充朋友圈/英飞凌2025财年第一季度业绩 热点科技新闻点评

    2月以来,多家海外公司纷纷发布最新财报,国内最大ICT厂商华为也宣布2024营收将8600亿。此外,DeepSeek火爆全球,国内多家云服务厂商接入DeepSeek大模型,推出服务。英飞凌发布了2025财年
    的头像 发表于 02-06 11:41 1.3w次阅读
    华为2024<b class='flag-5'>年</b>营收<b class='flag-5'>超</b>8600<b class='flag-5'>亿</b>!DeepSeek扩充朋友圈/英飞凌2025财年<b class='flag-5'>第一</b>季度业绩 热点科技新闻点评