0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高性能计算的工作原理

Dbwd_Imgtec 来源:智能计算芯世界 作者:智能计算芯世界 2022-04-02 15:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高性能计算(HPC)利用超级计算机和并行处理技术,快速完成耗时较长的任务或同时完成多个任务。HPC市场既是一个传统的市场,又是一个新兴的、高速发展的市场。定位高端用户、标杆项目,影响力大、平民化趋势、快速发展。

高性能计算的工作原理

在高性能计算中,处理信息的两种主要方式为:串行处理,由中央处理器 (CPU) 完成。每个 CPU 核心通常每次只能处理一个任务。CPU 对于运行各种功能而言至关重要,如操作系统和基本应用程序(如文字处理、办公生产力工具等)。

f0730f9c-b0ce-11ec-aa7f-dac502259ad0.png

并行处理,可利用多个 CPU 或图形处理器 (GPU) 完成。GPU 最初是专为图形处理而设计的。它可在数据矩阵(如屏幕像素)中同时执行多种算术运算。同时在多个数据平面上工作的能力使 GPU 非常适合在机器学习 (ML) 应用任务中进行并行处理,如识别视频中的物体。

f083c8c8-b0ce-11ec-aa7f-dac502259ad0.png

突破超级计算的极限需要不同的系统架构。大多数高性能计算系统通过超高带宽将多个处理器和内存模块互连并聚合,从而实现并行处理。一些高性能计算系统将 CPU 和 GPU 结合在一起,被称为异构计算。 计算机计算能力的度量单位被称为“FLOPS”(每秒浮点运算次数)。截至 2019 年初,现有的高端超级计算机可以执行 143.5 千万亿次 FLOPS (143 × 1015)。此类超级计算机被称为千万亿次级,可以执行超过千万亿次 FLOPS。相比之下,高端游戏台式机的速度要慢 1,000,000 倍以上,可执行约 200 千兆次 FLOPS (1 × 109)。超级计算在处理和吞吐量方面的重大突破很快将会实现超级计算的下一个重大级别——百亿亿次级,该级别的速度比千万亿次级约快 1,000 倍。这意味着百亿亿次级超级计算机每秒将能够执行 1018(或者 10 亿 x 10 亿)次运算。

f09ab5d8-b0ce-11ec-aa7f-dac502259ad0.png

“FLOPS”是对理论处理速度的描述,实现该速度需要连续向处理器传输数据。因此,系统设计必须考虑到数据吞吐量这一因素。系统内存以及处理节点之间的互连会影响数据传输到处理器的速度。

f0b5b86a-b0ce-11ec-aa7f-dac502259ad0.png

为了实现1百亿亿次级 FLOPS 的下一级超级计算机处理性能,大概需要 5,000,000 个台式机。*假定每个台式机具备 200 千兆次 FLOPS 的能力。

术语知识

高性能计算 (HPC):一个广义上的强大计算系统,其范围涵盖简单计算机(如 1 个 CPU + 8 个 GPU),乃至世界一流的超级计算机

超级计算机:最先进的高性能计算机,以不断提高的性能标准为依据

异构计算:优化串行 (CPU) 和并行 (GPU) 处理能力的高性能计算架构

内存:在高性能计算系统中为实现快速访问而存储数据的地方

互连:可令处理节点互相通信的系统层;在超级计算机中存在多个级别的互连

千万亿次级:为达到每秒执行千万亿次 (1015) 运算而设计的超级计算机

百亿亿次级:为达到每秒执行百亿亿次 (1018) 运算而设计的超级计算机

为什么要做高性能计算?

从系统的角度:集成系统资源,以满足不断增长的对性能和功能的要求

从应用的角度:适当分解应用,以实现更大规模或更细致的计算

解决问题:科学和工程问题的数值模拟仿真(计算密集、数据密集、网络密集、三种混合)。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222933
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92680
  • 操作系统
    +关注

    关注

    37

    文章

    7328

    浏览量

    128625

原文标题:浅谈高性能计算(HPC)

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【产品介绍】Altair HPCWorks高性能计算管理平台(HPC平台)

    AltairHPCWorksAltair高性能计算平台最大限度地利用复杂的计算资源,并简化计算密集型任务的工作流程管理,包括人工智能、建模和
    的头像 发表于 09-18 17:56 523次阅读
    【产品介绍】Altair HPCWorks<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>管理平台(HPC平台)

    探索CPU架构的奥秘,揭秘高性能计算的隐形引擎

    的深海,揭开那些隐藏在高性能计算背后的神秘面纱。1.取指令(Fetch)程序计数器(PC):CPU通过程序计数器获取下一条指令的内存地址。指令读取:从存储器或缓存中读
    的头像 发表于 08-13 11:58 524次阅读
    探索CPU架构的奥秘,揭秘<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>的隐形引擎

    知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为代表的处理器架构之下,RISC-V在高性能计算
    的头像 发表于 07-18 14:17 2360次阅读
    知合<b class='flag-5'>计算</b>:RISC-V架构创新,阿基米德系列剑指<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    明远智睿RK3588:高性能计算的破局者,模块性能新杆杆

    在当今科技飞速发展的时代,高性能计算需求如潮水般汹涌而至,无论是人工智能、工业自动化,还是多媒体处理领域,对模块性能的要求都达到了前所未有的高度。众多开发者在面对复杂项目时,常常陷入“担心模块
    的头像 发表于 07-04 17:14 448次阅读

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能算力的平台,成功填补了该领
    的头像 发表于 06-26 17:36 832次阅读

    高性能计算集群在AI领域的应用前景

    随着人工智能技术的飞速发展,高性能计算集群(HPC)在AI领域的应用前景日益受到关注。HPC提供的计算能力与AI的智能分析能力相结合,为解决复杂问题和推动科学研究提供了新的动力。1、HPC与AI
    的头像 发表于 06-23 13:07 1038次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群在AI领域的应用前景

    使用树莓派构建 Slurm 高性能计算集群:分步指南!

    的实践经验,并了解了它们是如何协同工作的。设置SLURM组件确实是其中的主要部分,经过一番研究,我终于成功搭建了自己的高性能计算集群。由于设置这台机器非常简单,因
    的头像 发表于 06-17 16:27 1346次阅读
    使用树莓派构建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群:分步指南!

    高性能计算面临的芯片挑战

    高性能计算(简称HPC)听起来像是科学家在秘密实验室里才会用到的东西,但它实际上是当今世界上最重要的技术之一。从预测天气到研发新药,甚至训练人工智能,高性能计算系统都能帮助解决普通
    的头像 发表于 05-27 11:08 816次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>面临的芯片挑战

    Synaptics发布高性能AI MCU,推动边缘计算新突破

    新突思科技发布SR系列高性能自适应微控制器(MCU),基于Astra™原生AI平台,专为边缘AI情境感知设计。该系列支持三种功耗模式(性能、超低功耗、持续运行),搭载Arm Cortex-M55内核
    的头像 发表于 04-23 10:00 926次阅读
    Synaptics发布<b class='flag-5'>高性能</b>AI MCU,推动边缘<b class='flag-5'>计算</b>新突破

    微动开关的工作原理

    微动开关的工作原理
    的头像 发表于 04-17 09:00 2723次阅读

    振弦式锚杆应力计的工作原理与数据计算方法

    准确、稳定性好、长期监测可靠等优点。南京峟思将详细介绍振弦式锚杆应力计的工作原理及其数据计算方法。一、工作原理振弦式锚杆应力计的工作原理基于振弦的频率与所受张力之
    的头像 发表于 02-24 13:49 785次阅读
    振弦式锚杆应力计的<b class='flag-5'>工作原理</b>与数据<b class='flag-5'>计算</b>方法

    高性能计算,名副其实的“算力皇冠”

    和推理的高性能计算技术。今天,我们就来聊一聊高性能计算计算机科学的“皇冠”初次涉及高性能
    的头像 发表于 02-08 14:27 1281次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>,名副其实的“算力皇冠”

    Supermicro高性能服务器量产供货,优化多重工作负载

    应对计算需求严苛的高性能工作负载而设计。无论是大规模AI应用、集群规模的高性能计算,还是需要大量GPU支持的协作设计、媒体传播等场景,这些服
    的头像 发表于 01-21 11:00 756次阅读

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    随着HarmonyOS NEXT的正式推出,鸿蒙原生应用开发热度高涨,数量激增。但在三方应用鸿蒙化进程中,性能问题频出。为此,HarmonyOS NEXT推出了一整套原生页面高性能解决方案,包括
    发表于 01-02 18:00

    Triton编译器在高性能计算中的应用

    高性能计算(High-Performance Computing,HPC)是现代科学研究和工程计算中不可或缺的一部分。随着计算需求的不断增长,对计算
    的头像 发表于 12-25 09:11 1560次阅读