0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

处理器关了5个core为什么性能没有下降100%

Linux阅码场 来源:Linux阅码场 作者:宋宝华 2021-10-20 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

默认情况下是Intel I9,10核,每个核2个threads,共20个CPUs:

bc868ed6-3101-11ec-82a8-dac502259ad0.png

下面编译内核:

bcc458e2-3101-11ec-82a8-dac502259ad0.png

需要2分钟30秒左右。

再来一遍:

bcffe434-3101-11ec-82a8-dac502259ad0.png

这说明make clean, drop_caches后时间也差不多。

现在我们关闭smt,只保留10个CPU:

bd329bc2-3101-11ec-82a8-dac502259ad0.png

具体的关闭方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下10个CPU,下面来编译:

bd5da132-3101-11ec-82a8-dac502259ad0.png

时间2分51秒,相对于2分30秒,速度下降仅仅14%。

这说明超线程SMT对性能的提升绝对没有达到100%,甚至都没有达到20%。

我们现在重新开启超线程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control’

看一下哪个CPU和哪个CPU是thread sibling:

bd8d2d4e-3101-11ec-82a8-dac502259ad0.png

看起来CPU0和CPU10是一对,CPU1和CPU11是一对,依次类推。

刚才我们关闭SMT是把CPU10-CPU19全关了,只留下每对里面的1个CPU,也就是留下了CPU0-CPU9。

在开启SMT的时候(假设蓝色和红色是一个CORE里面的两个CPU):

bdb7342c-3101-11ec-82a8-dac502259ad0.png

在关闭SMT的时候,等于每对里面只留1个CPU:

bde7fc4c-3101-11ec-82a8-dac502259ad0.png

现在我们换一种关法,一对对关,只留下五对:

be0c1b18-3101-11ec-82a8-dac502259ad0.png

指令如下:

be49771a-3101-11ec-82a8-dac502259ad0.png

实现效果如下:

be8cbd2c-3101-11ec-82a8-dac502259ad0.png

再重新编译内核:

becfef3e-3101-11ec-82a8-dac502259ad0.png

现在耗时是3分10秒,想对于所有CPU全开,下降27%。相对于每个core里面只关一个线程,下降12%。

这就比较神奇了?为什么我关了5个core,性能没有下降100%呢?这至少说明一个问题,从5core到10core,Intel I9编译内核性能并没有线性地scale。只是从3分10秒,提升到2分30秒。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20391

    浏览量

    255693
  • intel
    +关注

    关注

    19

    文章

    3515

    浏览量

    191842

原文标题:这到底是为什么?「元芳,你怎么看?」

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HPM5E3YIVK单核32位RISC-V处理器

    HPM5E3YIVK单核32位RISC-V处理器HPM5E3YIVK是先楫半导体(HPMicro)HPM5E3Y/HPM5E00系列的高
    发表于 05-18 09:27

    性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析

    性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析 在当今的电子技术领域,高性能音频处理
    的头像 发表于 03-23 16:45 842次阅读

    ADSP - 21467/ADSP - 21469 SHARC处理器:高性能音频处理的理想之选

    ADSP - 21467/ADSP - 21469 SHARC处理器:高性能音频处理的理想之选 引言 在当今的电子领域,高性能音频处理需求日
    的头像 发表于 03-23 16:35 1054次阅读

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器 在电子设计领域,处理器性能和特性直接影响着
    的头像 发表于 03-23 16:35 1128次阅读

    ADSP - 21369 SHARC处理器:高性能音频处理的理想之选

    ADSP - 21369 SHARC处理器:高性能音频处理的理想之选 在电子工程领域,高性能处理器对于实现复杂的音频
    的头像 发表于 03-23 16:30 458次阅读

    深入剖析ADSP - 2136x SHARC处理器:高性能音频处理的理想之选

    深入剖析ADSP - 2136x SHARC处理器:高性能音频处理的理想之选 在当今电子技术飞速发展的时代,高性能处理器对于各类应用的重要性
    的头像 发表于 03-23 16:20 342次阅读

    ADSP1802 SHARC处理器:高性能音频处理的理想之选

    ADSP1802 SHARC处理器:高性能音频处理的理想之选 在电子工程领域,数字信号处理器(DSP)对于实现各种复杂的信号处理任务至关重要
    的头像 发表于 03-23 16:20 452次阅读

    探索MAX6316 - MAX6322:5引脚微处理器监控电路的卓越性能

    探索MAX6316 - MAX6322:5引脚微处理器监控电路的卓越性能 在数字系统的设计中,微处理器(µP)的稳定运行至关重要。为了确保µP在各种复杂的电源和运行环境下都能正常工作,
    的头像 发表于 02-25 15:10 304次阅读

    AMD锐龙AI嵌入式P100系列处理器产品简介

    AMD 锐龙 AI 嵌入式 P100 系列处理器代表了 AMD 在车规级(通过 AECQ 100 认证)和工业级(宽温)嵌入式处理器领域的下一阶段演进。该系列产品面向需要高
    的头像 发表于 01-23 09:19 2653次阅读
    AMD锐龙AI嵌入式P<b class='flag-5'>100</b>系列<b class='flag-5'>处理器</b>产品简介

    TDA7418:高性能3频段汽车音频处理器的深度剖析

    带来出色的音质表现。今天,我们就来深入了解一下TDA7418的各项特性和技术细节。 文件下载: TDA7418.pdf 一、TDA7418概述 TDA7418包含一性能音频处理器,配备了完全集成的3频段滤波
    的头像 发表于 12-28 15:50 1304次阅读

    TDA7419:高性能车载音频处理器的卓越之选

    了高性能音频处理器和完整的音频滤波,具备诸多出色的特性。下面,我们就来详细了解一下 TDA7419。 文件下载: TDA7419TR.pdf 产品特性一览 丰富的输入输出接口 输入方面 :拥有 4
    的头像 发表于 12-25 16:10 890次阅读

    MD5信息摘要算法实现二(基于蜂鸟E203协处理器

    处理器与E203内核连接,其中状态跳转使用卡洛图进行化简,assign语句实现。使用一32x6的寄存堆向MD5处理器传输数据,控制信号
    发表于 10-30 07:54

    云拼接处理器性能如何?

    性能方面表现卓越,以下从多个维度进行深入解析。 一、硬件设计:稳定与高效的基石 融大视觉的云拼接处理器采用嵌入式纯硬件设计,这一设计理念使其区别于依赖操作系统的软件方案。由于没有传统操作系统的复杂架构,系统完
    的头像 发表于 09-05 00:11 959次阅读

    德承新款工控机P2302系列全面搭载新一代 Intel® Meteor Lake-PS Core™ Ultra 7/5/3 处理器

    且仅 15W 低功耗的出色表现。 酷睿Ultra处理器 Intel处理器“酷睿Ultra”采用Meteor Lake平台,全新升级的Intel 4制造工艺。采用新的混合架构:性能核(P-Cor
    的头像 发表于 08-27 15:02 1333次阅读
    德承新款工控机P2302系列全面搭载新一代 Intel® Meteor Lake-PS <b class='flag-5'>Core</b>™ Ultra 7/<b class='flag-5'>5</b>/3 <b class='flag-5'>处理器</b>

    HPM5E31IGN单核 32 位 RISC-V 处理器

    处理器,凭借其卓越的性能和创新的设计理念,为工业控制、物联网和消费电子等领域提供了全新的解决方案。HPM5E31IGN采用精简指令集(RISC)设计,指令集架构完全开源,避免了传统ARM架构的授权费用
    发表于 05-29 09:23