0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

融合计算是如何提出来的

中科院半导体所 来源:软硬件融合 2024-12-10 09:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

融合计算是微观和宏观视角算力提升策略的总结,是三个维度融合(异构融合x软硬件融合x云边端融合)的统称,那么融合计算是如何提出来的?为什么融合计算有且仅有三个维度的融合?

性能和算力

1.1 性能的计算公式

5079478e-b483-11ef-93f3-92fbcf53809c.png

定性的分析,一个芯片的性能由三个维度组成:

维度一,指令复杂度。理论上,指令复杂度越高,性能越好。但实际上,需要考虑系统的通用性,以及目标工作任务的灵活性特征,来选择合适的处理器引擎。

维度二,运行频率。运行频率提升,主要是先进工艺,以及更复杂的流水线设计。

维度三,并行度。提高并行度比较好理解,并行也主要有同构并行、(两个处理器的)异构并行和(三个以上)更多异构融合的并行。

1.2 算力的计算公式

508dd352-b483-11ef-93f3-92fbcf53809c.png

算力和性能的区别在哪里?性能是微观的算力,算力是宏观的性能。那么算力和性能之间的联系是什么? 如上图所示,我们定性分析,可以在性能和算力之间构建一个关联的公式。从上述公式可以看到,宏观的总算力,由三个维度的参数组成:

维度一,单芯片性能。通过提升单芯片性能的方式,也就是Scale Up的方式提升整体算力。

维度二,芯片的数量。通过增加计算芯片(计算节点)的数量,也就是Scale Out的方式,通过提升规模来提升整体算力。

维度三,算力利用率。如果仅有标称算力,而无法达到很好的利用率,那也是徒劳。随着AI的发展,集群规模越来越扩大,算力利用率越来越成为评价一个算力系统能力的关键指标。

从微观到宏观

2.1 微观视角的算力提升

2.1.1 如何提升单芯片性能 融合提升单芯片的性能:

一方面是底层采用更先进的工艺,以及通过Chiplet封装支撑,从而实现更大的计算规模;

另一方面,则是系统架构和微架构方面的创新,来实现单芯片层次更高的性能,这也是算力提升最本质的做法。

计算架构的创新则最主要的就是:

从第一代基于CPU的同构通用计算;

以及第二代基于CPU+GPU的异构通用计算;

逐步的走向第三代基于CPUxGPUxDSAs的异构融合通用计算。

2.1.2 如何提升芯片的数量和落地规模 芯片的落地,不是简单的复制。国产算力芯片已经有好多家了,甚至一些公司的芯片都已经有三到四代了,但仍然销售不是很顺利。底层的原因在于:

生态的问题。国产芯片(相比NVIDIA CUDA)生态不够好。但生态问题如何解决,不在于微观的一家公司的一个架构和相应的私有生态如何构建和繁荣,而在于宏观的很多公司很多架构如何整合(将在加下来的宏观视角部分介绍)。

芯片需要足够多的通用性,需要能够覆盖更多的业务场景和更多的业务迭代。

此外,芯片需要有非常高的I/O能力,确保在更大的规模下仍能有非常高的东西向通信效率(不耽误计算,不影响计算效率),能够支持更大规模的集群计算。

2.1.3 如何提升芯片的算力利用率 要想提升算力芯片的利用率,那么:

一方面,芯片需要有很好的扩展性能力,支持资源切分、池化、和重组;

另一方面,开放架构,减少多元异构算力的架构数量,从而使得更多的算力能够汇集到统一的算力资源池,从而实现更大范围的算力共享,进而提升整体的算力利用率。

2.2 宏观视角的算力提升

2.2.1 如何提升单个节点的性能 从宏观角度,单节点的性能提升,则主要是如何把更多异构融合架构的计算能力充分的用起来:

首先,是需要一个更加综合的异构融合计算框架,既包括CPU的工具链,也有GPU、AI,以及其他如网络、存储、视频、安全等领域的加速计算框架,还需要这个异构融合计算框架,支持异构协同和跨异构应用迁移。

第二,则是更复杂的计算架构和算力调度。在通算时代,一个物理的计算机,通常具有四类资源:CPU、内存、网络和存储;在异构计算时代,则是CPU、内存、网络、存储和加速器。而在异构融合时代,则是CPU、内存、网络、存储,以及更多种不同领域的加速器。那么,如此复杂的计算架构模型,如何资源切分、池化和重组,以及如何同架构调度,以及实现跨架构调度,都是需要深入考虑的事情。

2.2.2 如何提升芯片的数量和落地的规模 宏观视角下,芯片的数量提升,主要是如下几个层次:

最基础的就是集群规模的扩大,这需要高性能网络,更高的带宽,更低的延迟。

接下来,就是跨集群管理和跨集群调度,这就需要更复杂的网络和更高层次的算力调度。

再接下来,就是要实现跨数据中心的算力整合,这也就是目前火热的算力网络关注的范畴,有非常大的技术挑战和商业上的挑战。

再接下俩,那就是要跨云边端,实现云边端融合计算,挑战会更大。

2.2.3 如何提升算力利用率 宏观视角看算力利用率提升,主要是两块,承上启下:

启下。承载计算的芯片类型越来越多,多元异构问题凸显,这是目前算力整合不得不面对的现实困难。芯片(或引擎)的类型有很多,每一张类型还有很多不同的架构,这些不同类型不同架构的芯片是一个个孤岛,如何把这些孤岛连成一体,是一个非常重要的事情。未来,开放计算架构会是一个不得不走的选项,逐渐的从目前各家芯片公司各自为政私有架构的模式,过渡到开放架构的模式,让芯片的架构逐渐收敛。

承上。相比芯片侧的问题,计算芯片所支撑的上层业务软件侧的问题相对较少。行业存在开源软件生态,这是目前绝大部分业务客户的共识,这也减少了很多底层硬件的适配难度。但这几年,这个问题有所恶化:随着AI发展,NVIDIA GPU和CUDA一家独大,大家不得不在NVIDIA的封闭体系下工作。这不利于行业的竞争,也不利于算力成本的下降。理想的情况是:行业形成开源开放的计算软硬件生态,开源软件定义开放硬件;算力中心,不对任何硬件平台有依赖,不需要为生态溢价付费,仅需要为功能和性能付费即可。

需要注意的是,宏观和微观,以及算力提升的三个维度,是彼此交叉关联的。这里的很多策略,可能会同时影响两个甚至三个维度,甚至“按下葫芦浮起瓢”也是有可能的。实际的算力优化工作,需要仔细分析应对。

融合计算

随着AI大模型以及AI+场景对算力的需求猛增,算力中心建设成本也水涨船高,算力网络(实现算力共享)逐渐流行。同时许多AI+终端的场景,算力需求猛增,从云端和边缘端“借”算力的云边端融合计算模式,成为了终端算力提升的一个重要方式。 算力系统相当复杂,算力提升成为了一个庞大的系统工程。立足于最核心的芯片硬件和相关软件,从微观到宏观,基于上面分析的算力提升的背景知识,提出了“融合计算”的概念。希望通过“融合计算”的全方位的整合优化,来实现算力最优的性能和成本。

50a3d9ae-b483-11ef-93f3-92fbcf53809c.png

融合计算,其实就是微观和宏观视角算力提升策略的总结,是三个维度融合(异构融合x软硬件融合x云边端融合)的统称:

X轴,芯片维度,异构融合,Scale Up,提升单芯片性能。通过异构融合计算,把各类异构算力的价值发挥到极致。

Y轴,计算堆栈维度,软硬件融合,提升算力利用率。通过核心的算力调度系统中间件,实现承上启下,向上对接开源软件,向下对接多元异构算力,实现多元异构算力的协同和融合,从而最大化算力资源的利用率。

Z轴,集群扩展维度,云边端融合,Scale Out,提升芯片数量。通过增加集群规模,同时实现跨算力中心、跨不同云运营商、跨云边端融合的计算。

融合计算和多算融合的关系

融合计算,是从宏观和微观的角度,实现更底层更本质的提升性能和降低成本。而通算、智算和超算,则要更上层一些,是计算面向不同业务要求所做的定向性能和成本的调整。

随着智算中心的发展,目前行业中出现了通算,智算和超算的融合的发展趋势。但实际的做法,有待商榷。把CPU通算集群、GPU智算集群,以及存储集群,以及超算集群,放置到一个算力中心里,就是多算融合吗?显然不是。

50c3c656-b483-11ef-93f3-92fbcf53809c.png

多算融合,必然是需要一套体系,能够统一通算、智算和超算,有统一的资源切分重组,有统一的资源池,有统一的算力调度,有统一的上层算力服务,才能称之为多算融合:

首先,是要构建统一的计算机模型。通算一般是CPU+标准网卡,而智算是CPU+GPU+高性能网卡,而超算则是CPU+GPU+高性能网卡+内存一致性加速,存储则是CPU+更多的存储I/O。不管咋样,可以通过我们前面讲到的计算模型来统一,不管是哪种计算,都是CPU+加速卡+内存+网络+存储的统一的计算模型。

然后是资源的池化。通过云计算的虚拟化和容器的机制,实现资源的切分、池化和重组,可以组合出符合要求的不同类型的计算实例。

目前,计算集群已经成为主流的计算方式。通过VPC,可以在公共算力服务的多租户场景为用户构建专属的通算的、智算的或超算的计算集群。

融合计算,是更底层更本地算力优化问题,它存在于软硬件协同层次,通过全方位的各种融合,实现算力的最佳效果:同算力条件下,成本更优;同成本下,算力更高。

融合计算,是云计算未来发展最大的创新方向,通过融合计算,夯实算力底座,支撑云计算继续往前发展。再以云计算为基,构建出面向通算、智算和超算等不同场景的算力服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    459096
  • 计算
    +关注

    关注

    2

    文章

    458

    浏览量

    39837
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16564

原文标题:融合计算的概念是如何提出来的?

文章出处:【微信号:bdtdsj,微信公众号:中科院半导体所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么要云网融合

    架构已不适应这些需求。云计算服务需要强大的网络能力来保证稳定运行和通信质量,而网络资源优化也需借鉴云计算理念。这些因素促进了“云网融合”趋势的发展。 什么是云网融合 “云网
    的头像 发表于 12-03 09:59 142次阅读

    Imagination Technologies:面向智能驾舱,打造高安全GPU与AI融合计算架构

    随着汽车智能化程度不断提高,电子架构正朝着集中化方向发展,智能座舱与ADAS等功能对GPU算力和AI推理能力提出更高要求,同时系统还需满足功能安全、长效周期、软件定义等多重挑战。2025年9月12日
    的头像 发表于 09-23 08:43 536次阅读
    Imagination Technologies:面向智能驾舱,打造高安全GPU与AI<b class='flag-5'>融合计算</b>架构

    Imagination亮相汽车芯片产业大会 深入解读高安全GPU+AI融合计算架构

    热门话题展开深度交流与探讨。Imagination技术总监艾克出席活动,发表了《驱动未来:面向智能驾舱的高安全GPU+AI融合计算架构》的主题演讲。艾克首先介绍了目
    的头像 发表于 09-12 18:10 811次阅读
    Imagination亮相汽车芯片产业大会 深入解读高安全GPU+AI<b class='flag-5'>融合计算</b>架构

    合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为代表的处理器架构之下,RISC-V在高性能计算领域的突破
    的头像 发表于 07-18 14:17 2368次阅读
    知<b class='flag-5'>合计算</b>:RISC-V架构创新,阿基米德系列剑指高性能<b class='flag-5'>计算</b>

    空间计算是如何运作的?它有哪些优势?

    空间计算将数字数据与物理世界实时融合,通过增强现实和虚拟现实头显或智能眼镜等设备、增强混合现实交互。
    的头像 发表于 07-02 09:14 919次阅读

    突破智能驾舱边界,Imagination如何构建高安全GPU+AI融合计算架构

    与发展趋势。在5月15日的专题论坛上,Imagination中国区产品总监郑魁着重分享了公司GPU与AI融合计算架构创新,及其在智能座舱领域的应用探索。同时,凭借
    的头像 发表于 05-16 09:38 759次阅读
    突破智能驾舱边界,Imagination如何构建高安全GPU+AI<b class='flag-5'>融合计算</b>架构

    融合计算突破界限,英特尔大小脑融合架构加速具身智能进化

    ,例如数据匮乏、硬件设计的挑战,落地确定性、安全性以及成本等问题。   为此,英特尔基于公司在AI领域的技术基础,正式发布了基于酷睿Ultra系列处理器的具身智能大小脑融合方案,通过大小脑融合的单系统架构解决当前双系统方案
    的头像 发表于 04-24 00:08 2039次阅读
    <b class='flag-5'>融合计算</b>突破界限,英特尔大小脑<b class='flag-5'>融合</b>架构加速具身智能进化

    曦智科技时隔八年再登《Nature》,光电混合计算架构首次公开

    英国伦敦时间4月9日,全球顶级学术期刊《自然》(Nature)刊载了曦智科技的光电混合计算成果:《超低延迟大规模集成光子加速器》(An integrated large-scale photonic
    发表于 04-10 09:50 1287次阅读
     曦智科技时隔八年再登《Nature》,光电混<b class='flag-5'>合计算</b>架构首次公开

    光电混合新范式:全球首款128x128矩阵规模光电混合计算卡正式发布

    电子发烧友网报道(文/吴子鹏)光电混合计算卡,作为融合光学与电子学技术的高性能计算设备,借助光信号与电信号的协同处理,打破了传统电子芯片的物理限制,为人工智能、科学计算等领域开创了全新
    的头像 发表于 04-01 00:17 3133次阅读
    光电混合新范式:全球首款128x128矩阵规模光电混<b class='flag-5'>合计算</b>卡正式发布

    曦智科技全球首发新一代光电混合计算

    算力技术在产品化和商业化进程中的重要突破。我们坚信,光电混合将会为人工智能、大语言模型、智能制造等领域带来算力革新。” 天枢是一款深度融合光芯片与电芯片各自优势特点,并采用了3D先进封装技术的可编程光电混合计算卡。该产
    发表于 03-25 15:43 477次阅读
    曦智科技全球首发新一代光电混<b class='flag-5'>合计算</b>卡

    STM32F1 xcube cryptolib ECDSA计算出来的摘要值和外部验证工具计算出来的签名值对不上怎么解决?

    STMF1 xcube cryptolib ECDSA签名,采用CMOX_ECC_CURVE_SECP256R1曲线、SHA256摘要算法,计算出来的摘要值和外部验证工具计算出来的签名值对不上,外部
    发表于 03-07 09:24

    海康威视推出文搜计算系列产品

    海康威视依托在安防领域的长期积累,将自研的多模态大模型和智能计算硬件平台相结合,在智算、智存、智搜、智用方面对产品进行全方位立体升级,实现多模态融合计算、跨模态搜索应用。经过大模型加持的智能计算产品,实现了从提供具体功能到提供开
    的头像 发表于 02-24 17:23 1288次阅读

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服务能力。两者结合,共同赋能企业决策、业务创新和效率提升。下面UU云小编将详细剖析大数据与
    的头像 发表于 02-20 14:48 1272次阅读

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元?

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元?
    的头像 发表于 01-17 18:48 1385次阅读
    中国信通院栗蔚:云<b class='flag-5'>计算</b>与AI加速<b class='flag-5'>融合</b>,如何开启智算时代新纪元?

    AD9826采集出来的数据有漂移和震荡,是什么原因导致的?

    分析一下,是什么原因导致震荡和漂移,请TI专家们给予指导和解答,有说明不清楚的,也请及时提出来,以便我补充。谢谢!
    发表于 12-24 07:57