0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈GPU: 衡量计算效能的正确姿势(1)

Linux阅码场 来源:面包板社区 作者:Linux阅码场 2021-04-16 11:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

琢磨了好几天,也不知道公众号第一篇正式文章应该怎么写。现在很后悔在朋友圈高调公开公众号,还竟敢宣称有15年行业经验,大家不要信以为真,其实不过是一年经验重复了十几年而已。连知乎的小朋友都知道问问题的正确姿势,我真是有些汗颜。

言归正状,万事开头难,现在骑虎难下,也只好勉力为之。在这里想先介绍些今后文章经常会涉及的一些指标概念,希望能达成基本的共识,到时候交流起来会方便些。

Lateny和Throughput

1 延迟(latency),完成一个任务所需要的时间。

2.吞吐量(throughput),单位时间完成的任务量。

体系结构大神David.A.Patterson在他的著作《计算机组成和设计》用洗衣过程来做譬喻。洗衣过程由清洗,烘干,折叠,收纳四个环节组成,每个环节耗时30分钟,所以每次洗衣任务的latency是2个小时,没有优化以前,8个小时的完成4次洗衣任务,所以throughput只有0.5。

f85aacca-9e22-11eb-8b86-12bb97331649.png

经过流水线改造以后,效率得到改善,虽然每次洗衣还是花费2小时,但单位时间完成的任务量大大提升,4次洗衣任务只花了3.5个小时。

f8699bae-9e22-11eb-8b86-12bb97331649.png

我们可以把生活常识映射到处理器的流水线(Pipeline)设计,处理器的指令Pipeline通过实现指令级的并行(Instruction Level Parallelism)来提高throughput。这种ILP的优化对码农们就是免费的午餐,躺着程序性能就上去了。

f877aef6-9e22-11eb-8b86-12bb97331649.png

另外,如下图,我们也可以通过多核CPU或者内置很多计算单元的GPU来提高程序整体的性能(throughput),这种优化属于线程级并行(Thread Level Parallelism)。相比ILP,TLP对码农不太友好,不再供应免费的午餐,我们需要编写多线程程序,甚至通过专门的接口(CUDA/OpenCL)让CPU/GPU忙碌起来,才能得到性能的提升。

第一篇先写到这儿了,再长就没人看了,接下来会介绍其它几个重要概念。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247198
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11218

    浏览量

    222956
  • 吞吐量
    +关注

    关注

    0

    文章

    49

    浏览量

    12650
  • 延迟
    +关注

    关注

    1

    文章

    74

    浏览量

    13922

原文标题:GPU: 衡量计算效能的正确姿势(1)

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    绝缘子漏电起痕试验仪泄漏电流信号的小波变换分析及电弧能量计算

    手段;而基于该分析结果的电弧能量计算,则能量化电弧对绝缘子性能的影响,两者共同为试验结果的精准解读与绝缘子耐痕性能评估提供科学依据。​ 泄漏电流信号的小波变换分析,核心在于对信号的“分层解析与特征提取”。试
    的头像 发表于 10-15 09:43 173次阅读
    绝缘子漏电起痕试验仪泄漏电流信号的小波变换分析及电弧能<b class='flag-5'>量计算</b>

    如何选择合适的电池电量计

    最优的电池性能依赖于驱动电量计算法的高精度的电池模型。花费大量时间进行定制特征分析能够获得高精度电池性能、最大程度减小电池电量的(SOC)误差,以及正确预测电池何时接近空电量。
    发表于 07-10 14:23 0次下载

    如何计算孔板流量计和平衡流量计的流量?计算公式一样吗?

    平衡流量计与孔板流量计作为差压式流量计的典型代表,虽均基于压力差与流量的数学关系进行计算,但是平衡流量计
    的头像 发表于 07-09 13:54 556次阅读
    如何<b class='flag-5'>计算</b>孔板流<b class='flag-5'>量计</b>和平衡流<b class='flag-5'>量计</b>的流量?<b class='flag-5'>计算</b>公式一样吗?

    常见传动机构负载惯量计算方法及实例

    传动机构负载惯量计算方法 1. 丝杆传动机构 丝杆传动机构广泛应用于精密定位系统中。其负载惯量的计算需要考虑负载质量、丝杆导程、丝杆直径以及摩擦系数等因素。 假设负载质量为m,丝杆导程为Pb,丝杆直径为Db,负载移动速度为
    的头像 发表于 04-23 17:38 3246次阅读
    常见传动机构负载惯<b class='flag-5'>量计算</b>方法及实例

    浅谈电磁流量计的常见故障及排除方法

    电磁流量计作为常用的流量测量仪表,在使用过程中可能会遇到各种故障。以下是对电磁流量计常见故障及排除方法的浅谈: 一、仪表显示最小或无显示 当电磁流量计显示最小或无显示时,通常意味着传感
    的头像 发表于 04-20 17:56 1302次阅读

    GPU加速计算平台的优势

    传统的CPU虽然在日常计算任务中表现出色,但在面对大规模并行计算需求时,其性能往往捉襟见肘。而GPU加速计算平台凭借其独特的优势,吸引了行业内人士的广泛关注和应用。下面,AI部落小编为
    的头像 发表于 02-23 16:16 758次阅读

    GPU计算服务怎么样

    在当今数字化快速发展的时代,高性能计算需求日益增长。为满足这些需求,GPU计算服务应运而生。那么,GPU计算服务怎么样呢?接下来,AI部
    的头像 发表于 02-05 15:01 682次阅读

    调理电路的噪声余量计算如何计算

    调理电路的噪声余量计算 请问各位,在数据采集系统中,2Msps要达到12bit分辨率,选用14bit的ADC。前端调理电路的噪声理论余量如何计算。根据什么条件确定前端调理放大器的噪声指标。。。比如调理电路的总噪声不能够超过多少?该如何
    发表于 01-21 07:55

    算智算中心的算力如何衡量

    作为当下科技发展的重要基础设施,其算力的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智算中心算力衡量的详细阐述:一、算力的基本定义与单位1、算力的定义算力
    的头像 发表于 01-16 14:03 4214次阅读
    算智算中心的算力如何<b class='flag-5'>衡量</b>?

    电磁流量计正确调试步骤

    电磁流量计在自来水、生活用水、制药等行业有着非常多的应用,但是很多用户们采购后根据专业复杂的说明书并不能正确的调试好产品并使用它。经过我司售后部门的统计。百分之七十及以上的客户朋友们收到货后都会致电
    的头像 发表于 01-12 09:19 2722次阅读

    UPS容量计算步骤和注意事项

    UPS(不间断电源)容量的计算是一个复杂的过程,需要考虑多个因素,包括负载功率、备用时间、效率以及负载特性等。
    的头像 发表于 12-25 10:15 2628次阅读

    芯原发布新一代Vitality架构GPU IP系列

    上实现了显著提升,并支持多核扩展,为用户提供更加出色的性能体验。该架构集成了诸多先进功能,如一个可配置的张量计算核心(Tensor Core)AI加速器,以及一个容量高达32MB至64MB的三级(L3)缓存,这些配置共同保证了强大的处理能力和卓越的能效表现。 针对云游戏领域,Vitality架构
    的头像 发表于 12-24 10:55 1285次阅读

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 952次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25

    靶式流量计的工作原理 靶式流量计和涡街流量计比较

    位移可以计算出流量。 流体冲击 :流体流过靶板,对靶板施加力。 位移测量 :靶板的位移通过位移传感器(如差分电容式传感器)测量。 信号处理 :位移信号被转换成电信号,并通过电子电路处理。 流量计算 :根据位移和流体的
    的头像 发表于 12-11 16:49 1999次阅读