0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU内存或GPU内存进行分组方式实战

Dbwd_Imgtec 来源:互联网 作者:佚名 2018-05-03 09:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CPU+GPU协同计算中,CPU和GPU的计算能力不同,静态地给CPU和GPU划分任务会导致CPU和GPU计算不同步,导致严重的负载不均衡,为了实现CPU和GPU的负载均衡,需要对CPU和GPU不同的划分方法。把每个节点上的所有CPU看成一个设备,每块GPU卡看成一个设备,对集群节点上的所有CPU设备和GPU设备分别编号,每个节点上有M块GPU卡,N个节点上共有N个CPU设备,编号为1,2,…,N;N个节点上共有M*N个GPU设备,编号为1,2,…,M*N。

设备编号之后就可以对设备进行分组,根据算法的要求,有些任务不能细分,一个CPU设备或GPU设备上可用的内存空间可能不能满足计算的内存要求,需要多设备数据划分、共同计算,这时需要根据CPU内存或GPU内存进行分组

1)根据CPU内存大小和计算对内存的要求可以计算得到一组内的CPU设备数目为GC个, GC=(Mcom+MemC-1)/MemC,其中一个节点的内存大小为MemC,每个计算任务需要的内存大小为Mcom。

所有的CPU设备分为N/GC个组,每个组计算同一个任务,组内的CPU设备再进行数据划分,数据划分采用静态的划分,因为组内的CPU设备计算能力一致;

2)根据GPU内存大小和计算对内存的要求可以计算得到一组内的GPU设备数目为GG个, GG=(Mcom+MemG-1)/Mem,其中,一个GPU设备的内存大小为MemG,每个计算任务需要的内存大小为Mcom。

所有的GPU设备分为M*N/GG个组,每个组计算同一个任务,组内的GPU设备再进行数据划分,数据划分采用静态划分的方法。

CPU和GPU设备分组之后,就可以把任务动态分划分给每个CPU组或GPU组,可以采用MPI通信进行划分,由主进程进行动态的发送任务编号给各个CPU组或GPU组内的组长,组长再把任务编号广播给组内的组员,然后组内的设备同时计算,计算完毕之后即可向主进程请求下一个任务,直到所有任务计算完毕为止。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222942
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134459

原文标题:CPU+GPU集群计算中的一种动态负载均衡设计方法

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    内存与数据处理优化艺术

    内存访问是程序运行的瓶颈之一。减少内存访问次数可以显著提高程序的运行速度。 在C语言中,指针是直接操作内存的利器。使用指针遍历数组不仅代码更简洁,而且效率更高。例如,用指针直接访问内存
    发表于 11-14 07:46

    行业资讯 I 火爆的“内存接口芯片”

    大模型训练与推理需求的爆发,点燃了AI数据中心的建设热潮。AI服务器的需求增长不仅掀起了GPU/ASIC算力芯片、光模块等组件的迭代狂潮,同时也推动了对更大容量、更高带宽系统主内存的需求。在此背景下
    的头像 发表于 10-31 16:28 2606次阅读
    行业资讯 I 火爆的“<b class='flag-5'>内存</b>接口芯片”

    WebGL/Canvas 内存泄露分析

    在构建高性能、长周期运行的 WebGL/Canvas 应用(如 3D 编辑器、数据可视化平台)时,内存管理是一个至关重要且极具挑战性的课题。 开发者通常面临的内存泄漏问题,其根源远比简单
    的头像 发表于 10-21 11:40 168次阅读
    WebGL/Canvas <b class='flag-5'>内存</b>泄露分析

    科普:什么AI 内存技术

    问题。 为什么 AI 内存很重要? 在 AI 模型训练和推理过程中,大量的数据需要从内存传输到处理器(如 GPU TPU)进行计算。传统
    的头像 发表于 09-03 15:44 723次阅读

    鸿蒙5开发宝藏案例分享---内存优化实战指南

    ,里面提供的工具和技巧简直太香了!很多案例和方法,在实际开发中真的能救命,避免应用卡顿、崩溃,还能让设备续航更持久。 今天就来跟大家好好分享这份宝藏,结合官方内容和我的理解,整理成这篇实战性超强的内存优化
    发表于 06-12 17:15

    golang内存分配

    作者:钱文 Go 的分配采用了类似 tcmalloc 的结构.特点: 使用一小块一小块的连续内存页, 进行分配某个范围大小的内存需求. 比如某个连续 8KB 专门用于分配 17-24 字节,以此减少
    的头像 发表于 03-31 15:00 384次阅读
    golang<b class='flag-5'>内存</b>分配

    使用OpenVINO™进行推理时的内存泄漏怎么解决?

    使用 OpenVINO™ 进行推理时,内存会随着时间的推移而增加,并导致程序崩溃。
    发表于 03-06 08:29

    英伟达开发新型内存模组SOCAMM,年底量产

    据韩媒近日报道,英伟达已在内部成功研发出一种新型内存模组,命名为SOCAMM。这一创新成果不仅标志着英伟达在内存技术领域的又一次突破,也预示着其在商业化应用上的新进展。 据报道,英伟达目前正与全球三
    的头像 发表于 02-19 11:41 1196次阅读

    三大内存原厂将于2025年停产DDR3/DDR4

    据报道,业内人士透露,全球三大DRAM内存制造商——三星电子、SK海力士和美光,有望在2025年内正式停产已有多年历史的DDR3和DDR4两代内存。 随着技术的不断进步和消费级平台的更新换代
    的头像 发表于 02-19 11:11 3198次阅读

    hyper 内存,Hyper内存:如何监控与优化hyper-v虚拟机的内存使用

    在日常工作中,我们常常需要处理大量的文件和数据,这些重复性任务不仅耗时耗力,还容易因疲劳而导致错误。幸运的是,批量管理工具的出现为这一问题提供了高效的解决方案。今天就为大家介绍Hyper内存
    的头像 发表于 01-24 14:15 1676次阅读
    hyper <b class='flag-5'>内存</b>,Hyper<b class='flag-5'>内存</b>:如何监控与优化hyper-v虚拟机的<b class='flag-5'>内存</b>使用

    德明利DDR5内存助力AI PC时代存储性能与市场增长

    2024年作为AIPC元年伴随异构算力(CPU+GPU+NPU)需求高涨及新处理器平台推出DDR5内存以高速率、大容量低延迟与高带宽有效满足高性能算力要求加速本地AI大模型运行效率推动AIPC硬件端
    的头像 发表于 01-21 16:34 2261次阅读
    德明利DDR5<b class='flag-5'>内存</b>助力AI PC时代存储性能与市场增长

    国产DDR5内存上市,内存市场价格战一触即发

    随着国产DDR5内存的上市,内存市场的竞争态势即将迎来新的变化。DRAM内存作为半导体产业的明星产品,据市调机构Trendforce预估,2024年全球DRAM内存的产值将达到约907
    的头像 发表于 01-07 15:53 2282次阅读

    Triton编译器与GPU编程的结合应用

    优化,以及生成高效的并行执行计划。 GPU编程的挑战 GPU编程面临的主要挑战包括: 编程复杂性 :GPU编程需要对硬件架构有深入的理解,包括线程、块和网格的概念。 内存管理 :
    的头像 发表于 12-25 09:13 1316次阅读

    Flexus X 实例 CPU内存及磁盘性能实测与分析

    的网络带宽支持。最近华为云 828 B2B 企业节正在举办,Flexus X 实例的促销也非常给力,大家可以去看看。为了帮助用户更好地了解其性能表现,我们通过一系列详尽的测试,对 Flexus X 实例的各项性能进行了全面评测,包括 CPU 性能、
    的头像 发表于 12-24 17:35 870次阅读

    内存和微处理器的互联演变

    设计中,内存要求很简单,由用于操作的SRAM和满足非易失性存储要求的EPROM组成。在20世纪80年代初,内存和微处理器之间的关系变得显而易见。摩托罗拉的MC68000系列和类似CPU等产品推动了对高容量
    的头像 发表于 12-24 13:45 947次阅读