0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是HPC(高性能计算)?

广州虹科电子科技有限公司 来源:广州虹科电子科技有限公 作者:广州虹科电子科技 2022-11-01 11:47 次阅读

随着物联网 (IoT)、人工智能(AI) 、机器学习(ML)和 3-D 成像等技术的发展,数据的速度、种类和数量呈爆炸式增长,企业需要处理的数据规模和数量呈指数级增长。

对许多行业来说,如体育直播赛事、新产品测试或股票趋势分析等,对实时处理数据的能力要求非常高。为了在竞争中领先一步,企业需要闪电般快速和高度可靠的IT基础架构来处理、存储和分析大量数据。这种工具就是高性能计算!

一、

HPC(高性能计算)概述

1.什么是HPC(高性能计算)?

高性能计算 (High Performance Computing,又叫HPC、超级计算)是指比传统计算机和服务器提供更高马力聚合计算能力的计算方法。与超级计算机或硬件加速机器不同,高性能计算特别强调使用分布式资源来组合存储、应用程序、计算能力和网络资源,以完成其他方式无法完成的任务。高性能计算需要处理的TB、PB、甚至ZB级别的数据,并且需要接近实时地处理,比如在几分钟或者几小时内得到结果,而不是几天或几个星期。

5dd12b44-5996-11ed-a3b6-dac502259ad0.png

2.HPC为什么重要?

HPC之所以重要,是因为它能帮助我们更快地完成大型模拟和大型工作负载。

HPC比普通PC更快更强更省力,它每秒可以执行千万亿次计算,配备3 GHz处理器的笔记本电脑或台式机每秒可以执行大约 30 亿次计算。

HPC 通过集群/并行计算、最新CPUGPU、低延迟网络和块存储设备去实现高速处理。

HPC系统更具可扩展性。用户可以在需要时进行纵向扩展(升级 CPU、GPU、内存或其他资源)和横向扩展(将更多节点添加到集群中)。从云服务提供商 (CSP) 租用 HPC 资源可以进一步提高可扩展性并降低成本。

三种HPC解决方案:

本地HPC:本地的HPC就是传统的HPC数据中心,需要有高性能服务器和存储,用户自己去搭建这个HPC集群。

HPC云:云上的高性能计算提供HPC即服务,用户使用公有云去完成计算工作。

混合HPC:一个应用运行在私有云(private cloud)或数据中心(data center)中,当计算能力的需求达到顶峰时则动态地向公有云服务器请求一定量的计算(或存储)能力。当本地的工作负载积压时会立即启动云资源,把工作负载迁移到公有云上去计算,支持的云比如说谷歌云、微软云、Oracle云等。

5dec726e-5996-11ed-a3b6-dac502259ad0.png

3.HPC工作原理

HPC中处理信息的两种主要方法是:

串行处理由中央处理单元 (CPU) 完成。每个 CPU 内核通常一次只处理一个任务。CPU 对于运行操作系统和基本应用程序(例如,文字处理、办公效率)等功能至关重要。

可以使用多个 CPU 或图形处理单元 (GPU) 执行并行处理。GPU 最初是为专用图形开发的,可以同时跨数据矩阵(例如屏幕像素)执行多个算术运算。同时处理大量数据平面的能力使 GPU 非常适合机器学习 (ML) 应用程序任务中的并行处理,例如识别视频中的对象。

5e0a3c18-5996-11ed-a3b6-dac502259ad0.png

5e1be774-5996-11ed-a3b6-dac502259ad0.png

二、

HPC应用场景

HPC出现在 1960 年代,用于支持政府和学术研究。HPC 在 1970 年代开始进入主要行业,以加速复杂产品的开发,例如汽车、航空航天、石油和天然气、金融服务和制药行业。在现在,各行各业都能用到,比如生命科学、天体物理学、基因组学、生物信息学、分子动力学、天气和气候预测。具体应用如图所示:

5e3575e0-5996-11ed-a3b6-dac502259ad0.png

三、

虹科高性能计算解决方案

1.Kubernetes上的高性能计算

Kubernetes作为目前容器管理框架的事实标准,在当下的应用十分火热。随着微服务和容器在企业中越来越流行,它们也在进军机器学习和其他类似的HPC工作。这一趋势模糊了传统HPC和容器技术之间的界限,引发了对利用 Kubernetes进行HPC的可能性的探索。

使用容器和 Kubernetes 来管理和运行 HPC 应用程序有很多好处:

容器化是一种强大的工具,可以打包复杂的依赖关系并提高可重复性。

随着企业将 Kubernetes 作为应用程序现代化的安全和多云平台,在共享环境中托管 HPC 和企业容器工作负载将简化运营并降低成本。

Kubernetes 本质上提供了一个包含 CPU、内存和加速器的共享资源池,就像工作负载管理器一样。

更多深入阅读可以参考《kubernetes上的HPC》白皮书。

5e523edc-5996-11ed-a3b6-dac502259ad0.png

2.HK-Nimbix HPC平台

(1)什么是JARVICE XE

JARVICE XE 是世界上第一个容器原生混合/多云 HPC 平台,可在任何与 Kubernetes 兼容的基础设施上实现全球范围的横向扩展和加速 HPC 和 AI 工作流(SaaS 和 PaaS)。

JARVICE提供加速的应用程序和工作流,这些应用程序和工作流可以利用任何基础设施,无论是裸机还是虚拟化,包括专用Kubernetes基础设施上的InfiniBand、GPU和FPGA

JARVICE 使客户能够轻松地从本地解决方案突发到来自 Google、AWS 和 Azure 等的公有云系统,或者将内部系统作为私有云进行管理。

5e7f36b2-5996-11ed-a3b6-dac502259ad0.png

(2)使用JARVICE XE在 Kubernetes上运行HPC

JARVICE XE通过两个主要改进弥补了在 Kubernetes上运行HPC代码的差距:

两级HPC调度器

调度器提供2个级别,一个将传统的HPC作业请求转换为一组Kubernetes Pod,一个将Pod绑定到节点的组调度器,如果请求的规模不可用,则将整个作业排队。而且组调度器提供一些重要功能去帮助pod调度

JARVICE XE使用来自 HyperHub目录中应用程序的元数据为最终用户定义工作流,而不是要求用户编写PBS 或Slurm脚本来启动工作。

HPC运行时环境

它在作业启动时动态创建,可以根据来自调度程序的工作流请求的参数配置批处理运行或交互界面,可以确保工作流的有限完成,无论求解器成功还是失败,也可以让传统的HPC代码可以不加修改地在JARVICE上运行,如有需要,JARVICE XE还直接支持NFS和CephFS共享文件系统,运行时环境可以通过将主机级别的挂入点定义为机器定义的一部分来附加 Kubernetes原生不支持的存储接口,并行存储系统,例如 WekaIO2。

(3)HyperHub应用市场

Hyperhub是一个精选的点击式目录,提供HPC优化的仿真模拟、Al/ML/DL软件,比如ansys、COMSOL西门子MatlabTensorFlow等等,它具有有数百个加速的高性能工作流,内置支持高性能集群的自动缩放应用程序,将HPC和超级计算应用程序作为点选式的工作流程,并且会自动更新这些软件到任何JARVICE XE部署中。

HYPERHUB与JARVICE XE相结合为nimbix cloud提供支持,使用户能够在任何基础设施上以几乎无限的超级计算能力访问整个应用程序目录,除了已有的软件,hyperhub中没有的软件支持用户自定义安装,使用Jarvice的PushToCompute Tool 可以轻松设置应用程序。JARVICE提供了一个端到端的持续集成/持续部署(CI/CD)管道,用于编译、部署、测试和维护容器化云计算应用程序。这都是该平台的PushToCompute功能的一部分。

5e97e8f6-5996-11ed-a3b6-dac502259ad0.png

(4)JARVICE XE 优势

“开箱即用”的计算能力

JARVICE XE支持私有云、公有云、混合云和多云部署

JARVICE XE使企业IT部门可以轻松地将HPC添加到他们的服务组合中

JARVICE XE附带完整的 HPC 软件目录,该目录会自动更新最新版本(接管 IT 负担)

HK-Nimbix HyperHub 应用程序目录可帮助用户定义工作流程

能够将 SLURM 作业转换为低级“Pod”调度程序作业

通过容器灵活部署可扩展的 HPC 作业

租户隔离,没有客户端共享相同的资源

(5)HK-Nimbix 基础设施趋势

1)计算加速器

Nimbix在公有云中提供最广泛的FPGA和GPU功能目录 → 支持高级求解器以加快计算速度并降低客户成本.

2)更高密度的节点(内存、CPU 内核)

Nimbix计算节点具有物理内核(相对于“线程”或“VCPU”)

Nimbix计算节点的每个内核至少有8GB的RAM

>>各种可用的GB RAM节点和GPU节点

>>128GB、256GB和512GB RAM节点可用于16核

>>192GB、384GB和768GB RAM节点可用于20核

>>通过云供应商提供的业内最快结构中扩展到数千个内核

额外的GPU内存因类型而异,但最高可达 24GB/GPU

3)最快的互连

所有Nimbix计算节点在节点之间有56Gbps InfiniBand,在Spine上有100Gbps

RDMA用于节点之间的MPI,系统范围内的延迟<2µs

四、

案例分享

HK-Nimbix帮助IDEX Biometrics在一周内完成指纹传感器的设计:通过nimbix Cloud,IDEX可以使用相当于四个HPC工作站及其关联的并行计算能力,而无需自己维护基础设施,能够帮助IDEX公司加快新产品研发和上市的速度。

5eaae03c-5996-11ed-a3b6-dac502259ad0.png

《数据改变社会 BI助力发展》直播预告

直播讲师:肖晓容

直播时间:10月27日 周四20点

直播精彩内容预告:

1.大数据概述

大数据时代

数据的重要性

企业目前面临的数据难题

如何有效解决数据问题

2.BI软件的功能

数据集成

数据可视化

数据分析

移动端应用

共享与协作

……

3.案例解析

Hk-Omniscope COVID19模拟演示

Hk-Domo帮助艾默生为易变质产品供应链提供保障

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130561
  • 高性能计算
    +关注

    关注

    0

    文章

    67

    浏览量

    13296

原文标题:【虹科直播精彩回顾】高性能计算,让数据拥有无限可能!

文章出处:【微信号:Hongketeam,微信公众号:广州虹科电子科技有限公司】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以
    的头像 发表于 02-19 13:27 182次阅读
    什么是<b class='flag-5'>HPC</b><b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    台积电大幅上调SoIC产能规划,以满足未来AI、HPC的强劲需求

    近日,据消息人士透露,台积电已大幅上调其SoIC(系统整合单芯片)产能规划。到2024年底,月产能将从2023年底的约2000片跳增至5000~6000片,而原先预计今年将扩充至3000~4000片。到了2025年,产能目标再倍增,以满足未来AI和HPC高性能
    的头像 发表于 01-22 15:57 335次阅读

    FPGA在高性能计算中的优势及其用例都有哪些?

    近年来,现场可 编程 门阵列 ( FPGA ) 因其可定制性、并行处理和低延迟而成为高性能计算 (HPC) 的可行技术。 高性能计算 (
    的头像 发表于 12-09 12:15 450次阅读
    FPGA在<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>中的优势及其用例都有哪些?

    服务器硬盘通用基础知识

    简单来说,服务器就是在网络中为其他客户机提供服务的计算机;具有高性能、高可靠、高IO数据传输能力等特点,企业从基础的邮件、打印到核心应用如ERP、数据库等业务,再到我们所熟悉的互联网业务,创新大数据服务、天气预报HPC
    的头像 发表于 10-24 15:01 355次阅读
    服务器硬盘通用基础知识

    PICMG发布COM-HPC 1.2规范

    和10GbE等高速接口的访问。 COM-HPC高性能计算” 外形是几年前为支持PCIe Gen4的更强大的CPU(更高的TDP)推出的( COM Express 外形不能很好地处理PCIe Gen
    的头像 发表于 10-12 15:13 646次阅读
    PICMG发布COM-<b class='flag-5'>HPC</b> 1.2规范

    软通动力“信创医共体解决方案”通过鲲鹏技术认证并获鲲鹏应用创新大赛第三名

    赛道第三名 。该解决方案已全量适配openEuler操作系统和openGauss数据库,并且在性能、效率、易维护性等各个方面都有提升优化。 陕西区域决赛评委专家团由华为openEuler领域的操作系统研发工程师、HPC高性能
    的头像 发表于 09-14 22:10 507次阅读

    服务器是什么?服务器基础知识全解终极版

    服务器就是在网络中为其他客户机提供服务的计算机;具有高性能、高可靠、高IO数据传输能力等特点,企业从基础的邮件、打印到核心应用如ERP、数据库等业务,再到我们所熟悉的互联网业务,创新大数据服务、天气预报HPC
    发表于 09-05 09:50 635次阅读
    服务器是什么?服务器基础知识全解终极版

    FPGA在高性能计算中的优势及其用例都有哪些?

    近年来,现场可编程门阵列 (FPGA) 因其可定制性、并行处理和低延迟而成为高性能计算 (HPC) 的可行技术。
    发表于 08-21 09:05 497次阅读
    FPGA在<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>中的优势及其用例都有哪些?

    网络云存储服务器,数据库服务器|PetaExpress

    两类:一类是通过服务进行架构;另一类是通过软件或硬件设备进行架构。 传统系统采用紧耦合对称架构,旨在解决HPC高性能计算、超级计算)问题,并将其扩展到云存储,以满足快速的市场需求。
    的头像 发表于 07-27 14:43 345次阅读

    台积电或将获得大陆AI芯片订单,包含中兴微电子

          最近有消息称今年一季度以来,中国大陆的AI芯片设计公司正在扩大台积电7nm 工艺的芯片订单,而其中就包含中兴微电子。 据悉,大陆AI HPC(高性能计算)芯片供应商目前并未受到相关限制
    的头像 发表于 07-11 12:47 873次阅读

    台积电获更多中国大陆AI芯片供应商订单;全球5G专利排名:华为第一 小米进入前十

    芯片设计公司正在扩大台积电7纳米工艺的芯片订单。 报道称,中国大陆半导体产业不会因为美国的限制而陷入停滞,中国大陆芯片企业仍在寻求增长方式,包括进口替代和扩大对人工智能芯片的投资。消息人士称,中国大陆AI HPC高性能计算)芯
    的头像 发表于 07-10 17:50 786次阅读
    台积电获更多中国大陆AI芯片供应商订单;全球5G专利排名:华为第一 小米进入前十

    在AI浪潮的推动下,AMD再用Chiplet技术交出阶段性答卷!

    苏姿丰率先公布了Instinct MI300A,她称之为全球首个为AI和HPC高性能计算)打造的APU加速器,拥有多达13颗小芯片,总共包含1460亿个晶体管;
    的头像 发表于 06-20 16:29 492次阅读
    在AI浪潮的推动下,AMD再用Chiplet技术交出阶段性答卷!

    如何构建HPC高性能计算数据中心?

    计算机最初的主要用途是用于计算,随着计算任务的增加,海量的数据量使传统的计算机面临挑战!
    的头像 发表于 05-30 15:34 313次阅读
    如何构建<b class='flag-5'>HPC</b><b class='flag-5'>高性能</b><b class='flag-5'>计算</b>数据中心?

    如何构建HPC高性能计算数据中心?

    计算机最初的主要用途是用于计算,随着计算任务的增加,海量的数据量使传统的计算机面临挑战!
    的头像 发表于 05-26 14:31 617次阅读

    登顶!华为OceanStor Pacific存储达成IO500榜单全球第一

    倍 的绝对优势,得分位列 10 节点榜单榜首,问鼎全球。 IO500是HPC高性能计算)领域最具影响力的世界级存储排行榜,主要针对存储系统的性能进行评测与排名,综合考察了带宽
    的头像 发表于 05-26 13:15 517次阅读