0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高性能计算,名副其实的“算力皇冠”

颖脉Imgtec 2025-02-08 14:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来,从金融到汽车、从教育到医疗,人工智能技术,特别是以ChatGPT为代表的生成式人工智能,正在给整个世界带来颠覆性体验。在如今这个“人工智能时代”,人工智能技术的发展离不开服务于AI算法训练和推理的高性能计算技术。

今天,我们就来聊一聊高性能计算。


计算机科学的“皇冠”初次涉及高性能计算,可能许多人会按照字面意思理解为计算性能较好的算法,从而将其列入众多算法之一。其实这种看法并不全面。高性能计算之于计算机科学,如同哥德巴赫猜想之于数学,是计算机学科领域内十分耀眼的存在。在介绍高性能计算之前,我们要先介绍一下高性能计算机。

高性能计算机(HPC)是一种运算速度极快、存储容量极大、通信带宽极高的计算机,又被称作超级计算机,主要用于解决普通计算机解决不了的具有挑战性的问题。高性能计算机发展经历了单计算机时代和多计算机时代。单计算机时代从20世纪60年代开始,以单一内存向量机和对称多处理器技术为主。20世纪90年代后逐步进入到多计算机时代,其中采用商用网络将计算机连接起来组成的集群逐步成为主流。直到今天,这依然是高性能计算系统构建的主要方式。集群是计算机和网络的结合。假如说,互联网是从外部将分立的计算机连接在一起,那么集群就是将网络内部化,让网络成为系统内部不同计算机的沟通桥梁。往简单里说,其实就是将网络连接的所有计算机看作一个整体,这个新的整体就是高性能计算集群。

或许这样乍一看有些难懂,引用电影《西虹市首富》里的一句台词来解释,就是“集中火力干事业”。就好比一台计算机,我们平日里用其写写文档、剪辑简单的日常生活视频可能还很流畅,但是如果想实现大型三维8K高清动画渲染,就难以胜任,这说明当前计算机的算力已经不支持完成当前的工作了。此时通过网络将多台计算机进行连接,把这些设备的算力进行叠加,就可以完成一台计算机完不成的任务。高性能计算集群是将多个计算节点组织起来,通过高速网络连接在一起的大规模并行计算系统。如果将普通计算比作人脑,那么高性能计算集群就是许多人脑连接成矩阵的“超级大脑”。在短时间内,“超级大脑”具有强大的计算能力,可以完成更多计算任务。

相较于普通计算机,高性能计算集群的运算速度能够达到令人难以想象的程度。此外,高性能计算还可以通过大规模的分布式计算技术,将单个计算任务分解为多个子任务并行计算。好比如果需要烹制一桌宴席,一个团队择菜、切菜、炒菜分工明确,多环节同时进行,效率要比一个人独立完成整桌宴席快得多。

高性能计算机采用高可靠性设计,具有超低的故障率以及较好的稳定性和持续运行能力。这也奠定了高性能计算在计算机科学领域的“皇冠地位”。


没有最快,只有更快

谈及高性能计算,或许不少读者会以为这是近些年来伴随科技发展的新兴产物。殊不知,高性能计算已经诞生并发展了相当长一段时间。随着计算机硬件和软件的不断发展,高性能计算在很早以前就成了一个重要的研究领域和技术领域。20世纪六七十年代,美国超级计算中心、法国原子能和替代能源委员会、日本计算机科学研究所等机构纷纷推出了一批超级计算机系统,奠定了高性能计算的发展基础。此后,超级计算机进入了快速发展期。各国投入更多的资金用于高性能计算的研发和应用。超级计算机性能速度不断提升,各种新兴应用也不断涌现。

1983年12月,中国第一台每秒钟运算1亿次以上的“银河”巨型计算机成功问世,中国成为继美国、日本之后,第3个能独立设计和制造巨型计算机的国家。2013年6月至2015年11月,中国“天河二号”超级计算机实现世界超级计算机TOP500排行榜历史上的六连冠。在高性能计算领域,有一个著名的千倍定律——每10年,超级计算机的运行速度就会提升1000倍。2018年,超级计算机“顶点”以每秒20亿亿次的浮点运算速度峰值,名列全球超级计算机500强榜单榜首。4年后,在2022年6月公布的全球超级计算机500强榜单中,超级计算机“前沿”的浮点运算速度峰值已经超过每秒100亿亿次。

这显示了超算技术惊人的发展速度。每秒100亿亿次意味着什么呢?目前主流笔记本电脑运算速度大概每秒10亿次,要10亿个这样的笔记本同时计算,才能赶得上现在最快的超级计算机。百亿亿次超算,又称E级超算,已成为国际上高端信息技术创新和竞争的制高点。目前,世界各国在全球超算领域你追我赶,竞争激烈。美、欧、日等国家和地区纷纷制定和推进百亿亿次超算研制计划。中国的3个E级(百亿亿次)计算机原型系统项目,已经全面启动。欧洲即将推出首台百亿亿次超级计算机“木星”,有望取得突破性的成就。

当然,研发E级超算,目的并非单纯比拼运算速度,促进大规模应用、解决国家面临的挑战性问题,才是关键。


算天、算海、算地、算人

如今,业内人士常用“算天、算海、算地、算人”来形容高性能计算应用的无所不在。

算天——高性能计算广泛应用于天气预报、航天器设计、研究天体物理等。基于超算平台开发的精细数值天气预报系统,能以每12分钟实时刷新未来6小时的气象变化数据,并且准确预测未来15天以上气象变化情况;研制一架大飞机,做全机风动试验过去需耗费数年时间,利用超级计算机模拟仿真,几天就能完成相关工作;2019年人类历史上第一张黑洞照片终于问世,这张照片凝结了当时世界最先进的探测技术,也得益于超级计算机对海量数据的分析和处理。

算海——高性能计算在海洋环境预报、古气候模拟、海洋药物、海洋勘探等领域应用广泛,已经成为人类认识海洋、探索海洋的利器。

算地——高性能计算常用来支撑地质钻探、遥感测量、重大工程建设等。2023年5月,中国测绘科学研究院研究团队自主研发了合成孔径雷达干涉测量超算平台,服务于地面沉降防治、地质灾害隐患识别、地壳运动检测等,也可为油气田开采、采空区塌陷、大型基础设施健康诊断等提供信息支持。

算人——与人的生命健康有关的应用,比如新药研发、基因测序、脑科学等,都离不开高性能计算。近年来,各种新的检查检验设备、可穿戴设备等,使得医生和研究人员更容易获得个人的健康、疾病数据,有助于从更多维度了解疾病发生过程。高性能计算可以帮助研究者和医生从大量数据中摸索出规律,从而更加精准地诊断、治疗疾病或者研发药物。当前,高性能计算最令人瞩目的应用,是超级计算机与人工智能的结合。有人形象地打了一个比方:如果说,人工智能是一座承载机器智能的摩天大楼,那么算法是设计图纸,数据是建筑材料,算力则是地基。一方面,当前人工智能对算力的需求呈指数式增长,需要更高性能的硬件系统提供算力支持。从ChatGPT3.0到ChatGPT4.0,其突破离不开人工智能大模型对海量数据的学习。

另一方面,超级计算机并非简单地堆砌硬件就能达到更高性能,其发展需要复杂而繁多的网络、软件等的互联互通,这便离不开人工智能的支持。因此,超算系统需要从计算密集型向数据密集型转变,将传统超算、AI算法、大数据相结合,实现具备面向海量数据的高性能分析能力的智能超算。

人类对超算应用的需求没有止境。专家表示,超算一直在帮助人类拓展边界。宏观扩展如宇宙天体,微观深入像生命科学,还有对一些极端情况的模拟。超算将继续在这些尖端科学研究领域发挥作用。


未来发展或将超乎想象

花费约200秒,就能完成传统超算需要1万年才能完成的计算任务——2019年,谷歌公司团队宣布成功演示“量子霸权”。这个消息引起轩然大波,一场全球范围内的“量子霸权”争夺战由此愈发激烈。量子计算是一种遵循量子力学规律调控量子信息单元进行计算的新型计算理论和技术。与经典计算机相比,量子计算机可以不受物理结构的局限,利用量子位及其相互作用在瞬间进行大量计算,理论上能够发挥出远超经典计算技术的计算性能。科学家们预言,当可以精确操纵的量子比特超过一定数目时,量子计算机的能力将会远超任何一台经典计算机。那么,量子计算会取代原有的经典计算吗?今天,我们似乎有了一个明确的答案:不会,至少在短时间内,量子计算无法取代经典计算。

量子计算与经典计算基本原理不同、结构不同,二者所擅长计算的问题也不同,因此量子计算机与经典计算机并非“取代”与“被取代”的关系。从实际应用角度,量子计算永远不会完全取代传统超算,两者各有所长,将协同工作。此外,对于量子计算研究来说,实现“量子霸权”只是第一个阶段性目标。目前来看,量子计算机还处于发展早期,技术上还存在许多挑战和难点。“量子霸权”只是证明了在某个特定问题上,量子计算机的计算能力超过现有最强的传统计算机。比起已经深入社会各行各业的高性能计算,量子计算想要实现商用还需要一段时间。不过,这并不意味着高性能计算就能“高枕无忧”。近年来,经典计算和量子计算的有机融合,正在日渐成为重点研究方向。

中、美、日、欧等传统高性能计算强国和地区,正在逐步开展量子计算和经典计算共同执行的混合算法,探索量子计算和经典计算的融合体系结构、计算系统等。在高性能计算的未来发展中,量子计算技术的地位将愈加凸显。超级计算机将成为量子计算和经典计算的深度融合系统,二者互为重要算力补充,面向不同类型的计算问题各自发挥出更大的作用。未来的高性能计算,将超乎我们的想象。

文字|逯心一 范宽 高莉华来源|中国军网、新华社

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38168

    浏览量

    296859
  • 人工智能
    +关注

    关注

    1813

    文章

    49751

    浏览量

    261621
  • 高性能计算
    +关注

    关注

    0

    文章

    95

    浏览量

    13761
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    48 TOPS 高性能 AI 核心板:CORE-8550JD4

    单摄或3600万像素三摄。广泛适用于机器人、无人机、摄像头、边缘计算AI、服务、智能安防、智能家居等行业领域。高通AI处理器QCS8550采用八核64位高性能
    的头像 发表于 12-03 17:47 465次阅读
    48 TOPS <b class='flag-5'>算</b><b class='flag-5'>力</b>!<b class='flag-5'>高性能</b> AI 核心板:CORE-8550JD4

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    不够、交付太慢?捷智裸金属租赁对标物理机性能,让你立马用上高

    2025年国产大模型升级带动租赁需求爆发,高性能服务器“一机难求”。中研普华预测,今年我国
    的头像 发表于 09-12 20:06 1069次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>不够、交付太慢?捷智<b class='flag-5'>算</b>裸金属租赁对标物理机<b class='flag-5'>性能</b>,让你立马用上高<b class='flag-5'>算</b><b class='flag-5'>力</b>!

    板卡:驱动智能时代的核心引擎

    、科学计算等领域的核心硬件,支撑着现代数字化社会的运转。 板卡的核心作用   板卡是一种专为高性
    的头像 发表于 08-01 10:25 985次阅读

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能
    的头像 发表于 06-26 17:36 834次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    搭建中心,从了解的GPU 特性开始

    ABSTRACT摘要本文介绍如何搭建,并介绍A100、H100、H200和B200这些GPU的特性。JAEALOT2025年4月23日随着人工智能、大数据和高性能计算(HPC)的快
    的头像 发表于 04-24 11:08 3010次阅读
    搭建<b class='flag-5'>算</b><b class='flag-5'>力</b>中心,从了解的GPU 特性开始

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、
    的头像 发表于 04-13 00:02 2616次阅读

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破瓶颈,释放AI澎湃动力! 什么是智中心 智中心(AIDC,Artificial Intelligence Data Center)
    的头像 发表于 02-24 17:34 990次阅读
    信而泰CCL仿真:解锁AI<b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心网络<b class='flag-5'>性能</b>跃升之道

    【一文看懂】什么是端侧

    随着物联网(IoT)、人工智能和5G技术的快速发展,端侧正逐渐成为智能设备性能提升和智能化应用实现的关键技术。什么是端侧,它的应用价
    的头像 发表于 02-24 12:02 3036次阅读
    【一文看懂】什么是端侧<b class='flag-5'>算</b><b class='flag-5'>力</b>?

    云 GPU 加速计算:突破传统瓶颈的利刃

    在数字化时代,数据呈爆炸式增长,传统的已难以满足复杂计算任务的需求。无论是人工智能的深度学习、大数据的分析处理,还是科学研究中的模拟计算,都对
    的头像 发表于 02-17 10:36 520次阅读

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4242次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    中心会取代通用中心吗?

    随着人工智能(AI)技术的飞速发展,计算需求不断攀升,数据中心行业正经历着前所未有的变革。传统的通用中心与新兴的智中心之间的竞争日益激烈。那么,在这样的背景下,通用
    的头像 发表于 01-06 14:45 900次阅读
    智<b class='flag-5'>算</b>中心会取代通用<b class='flag-5'>算</b><b class='flag-5'>力</b>中心吗?

    计算 开启贵州人工智能服务新篇章

    伴随数字化转型加速及 “人工智能 +” 行动规划的推进,已成企业创新与业务增长的关键驱动力,其市场需求暴增,企业亟需高效经济的解决方案。在此背景下,由贵州省贵安超级
    的头像 发表于 12-27 00:37 1023次阅读
    <b class='flag-5'>算</b>家<b class='flag-5'>计算</b> 开启贵州人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b>服务新篇章