0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

处理器关了5个core为什么性能没有下降100%

Linux阅码场 来源:Linux阅码场 作者:宋宝华 2021-10-20 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

默认情况下是Intel I9,10核,每个核2个threads,共20个CPUs:

bc868ed6-3101-11ec-82a8-dac502259ad0.png

下面编译内核:

bcc458e2-3101-11ec-82a8-dac502259ad0.png

需要2分钟30秒左右。

再来一遍:

bcffe434-3101-11ec-82a8-dac502259ad0.png

这说明make clean, drop_caches后时间也差不多。

现在我们关闭smt,只保留10个CPU:

bd329bc2-3101-11ec-82a8-dac502259ad0.png

具体的关闭方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下10个CPU,下面来编译:

bd5da132-3101-11ec-82a8-dac502259ad0.png

时间2分51秒,相对于2分30秒,速度下降仅仅14%。

这说明超线程SMT对性能的提升绝对没有达到100%,甚至都没有达到20%。

我们现在重新开启超线程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control’

看一下哪个CPU和哪个CPU是thread sibling:

bd8d2d4e-3101-11ec-82a8-dac502259ad0.png

看起来CPU0和CPU10是一对,CPU1和CPU11是一对,依次类推。

刚才我们关闭SMT是把CPU10-CPU19全关了,只留下每对里面的1个CPU,也就是留下了CPU0-CPU9。

在开启SMT的时候(假设蓝色和红色是一个CORE里面的两个CPU):

bdb7342c-3101-11ec-82a8-dac502259ad0.png

在关闭SMT的时候,等于每对里面只留1个CPU:

bde7fc4c-3101-11ec-82a8-dac502259ad0.png

现在我们换一种关法,一对对关,只留下五对:

be0c1b18-3101-11ec-82a8-dac502259ad0.png

指令如下:

be49771a-3101-11ec-82a8-dac502259ad0.png

实现效果如下:

be8cbd2c-3101-11ec-82a8-dac502259ad0.png

再重新编译内核:

becfef3e-3101-11ec-82a8-dac502259ad0.png

现在耗时是3分10秒,想对于所有CPU全开,下降27%。相对于每个core里面只关一个线程,下降12%。

这就比较神奇了?为什么我关了5个core,性能没有下降100%呢?这至少说明一个问题,从5core到10core,Intel I9编译内核性能并没有线性地scale。只是从3分10秒,提升到2分30秒。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247119
  • intel
    +关注

    关注

    19

    文章

    3506

    浏览量

    190563

原文标题:这到底是为什么?「元芳,你怎么看?」

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NICE协处理器接口信号解读--以demo为例

    处理器根据nice_req_valid信号和nice_req_inst信号进行译码,确定要执行的具体操作,如下图所示。 nice_req_rs1和nice_req_rs2是两源寄存的数值,demo
    发表于 10-31 08:01

    MD5信息摘要算法实现二(基于蜂鸟E203协处理器

    处理器与E203内核连接,其中状态跳转使用卡洛图进行化简,assign语句实现。使用一32x6的寄存堆向MD5处理器传输数据,控制信号
    发表于 10-30 07:54

    云拼接处理器性能如何?

    性能方面表现卓越,以下从多个维度进行深入解析。 一、硬件设计:稳定与高效的基石 融大视觉的云拼接处理器采用嵌入式纯硬件设计,这一设计理念使其区别于依赖操作系统的软件方案。由于没有传统操作系统的复杂架构,系统完
    的头像 发表于 09-05 00:11 553次阅读

    德承新款工控机P2302系列全面搭载新一代 Intel® Meteor Lake-PS Core™ Ultra 7/5/3 处理器

    且仅 15W 低功耗的出色表现。 酷睿Ultra处理器 Intel处理器“酷睿Ultra”采用Meteor Lake平台,全新升级的Intel 4制造工艺。采用新的混合架构:性能核(P-Cor
    的头像 发表于 08-27 15:02 649次阅读
    德承新款工控机P2302系列全面搭载新一代 Intel® Meteor Lake-PS <b class='flag-5'>Core</b>™ Ultra 7/<b class='flag-5'>5</b>/3 <b class='flag-5'>处理器</b>

    HPM5E31IGN单核 32 位 RISC-V 处理器

    处理器,凭借其卓越的性能和创新的设计理念,为工业控制、物联网和消费电子等领域提供了全新的解决方案。HPM5E31IGN采用精简指令集(RISC)设计,指令集架构完全开源,避免了传统ARM架构的授权费用
    发表于 05-29 09:23

    集特台式机GPC-100:搭载海光3350处理器,国芯替代的办公新选择

    在信息技术国产化浪潮下,国产处理器与计算机产品的崛起为行业提供了自主可控的新选择。集特智能推出的GPC-100台式机,搭载国产海光3350处理器,凭借高性能、安全可靠的特点,成为企业及
    的头像 发表于 02-14 10:42 1823次阅读

    PX5性能八核处理器深度解析

    PX5是一款集高性能与低功耗于一体的八核处理器,专为满足现代多媒体、智能设备及嵌入式系统的需求而设计。其主要特性如下: 强劲核心性能: PX5
    的头像 发表于 02-10 17:26 1501次阅读

    RK3399Pro处理器:高性能与AI加速的完美结合

    RK3399Pro是一款高性能处理器,专为需要强大计算能力和人工智能加速的应用场景而设计。其主要特性如下: 高性能CPU核心:搭载双核Cortex-A72处理器,主频高达1.8GHz,
    的头像 发表于 02-07 18:11 1390次阅读

    常见处理器故障及解决方法

    处理器(CPU)是计算机的核心部件,负责执行程序指令和处理数据。处理器故障可能会导致计算机性能下降、死机、重启等问题。以下是一些常见的
    的头像 发表于 02-07 09:17 2499次阅读

    处理器超频技巧与注意事项

    随着科技的发展,处理器性能越来越强大,但有时我们仍希望获得更高的性能。超频是一种提高处理器性能的方法,但需要谨慎操作以避免潜在风险。 超频
    的头像 发表于 02-07 09:16 1871次阅读

    低功耗处理器的优势分析

    就考虑到能耗问题,通过优化架构、工艺和软件来降低功耗的处理器。它们通常采用先进的制造工艺,如FinFET或GAAFET技术,以及高效的电源管理技术,以实现在保持性能的同时减少能耗。 低功耗处理器的优势 1. 节能和环保 减少能源
    的头像 发表于 02-07 09:14 1788次阅读

    量子处理器的作用_量子处理器的优缺点

    。量子比特可以同时处于0和1的状态,这种量子叠加特性使得量子处理器能够同时处理大量信息。此外,量子比特之间的量子纠缠特性允许一量子比特的状态无论距离多远都能立即影响另一量子比特的状
    的头像 发表于 01-27 13:44 1509次阅读

    量子处理器是什么_量子处理器原理

    量子处理器(QPU)是量子计算机的核心部件,它利用量子力学原理进行高速数学和逻辑运算、存储及处理量子信息。以下是对量子处理器的详细介绍:
    的头像 发表于 01-27 11:53 1773次阅读

    Ampere®发布新版AmpereOne®处理器,强化AI与云计算性能

    Ampere®公司近期推出了其旗舰产品AmpereOne®处理器的新版本,这一新版本处理器配备了12内存通道,进一步提升了性能。这一举动与Ampere在去年
    的头像 发表于 01-09 18:09 1327次阅读

    盛显科技:解决投影融合处理器性能评估标准

    投影融合处理器是一种专门为多个投影仪协同工作设计的硬件设备,它能够消除不同投影仪之间的边缘重叠、色彩不匹配、亮度不一致等问题,从而实现更加逼真、高清晰度的投影效果。以下是对投影融合处理器性能评估
    的头像 发表于 12-26 15:26 728次阅读
    盛显科技:解决投影融合<b class='flag-5'>处理器</b>的<b class='flag-5'>性能</b>评估标准