0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

处理器关了5个core为什么性能没有下降100%

Linux阅码场 来源:Linux阅码场 作者:宋宝华 2021-10-20 11:28 次阅读

默认情况下是Intel I9,10核,每个核2个threads,共20个CPUs:

bc868ed6-3101-11ec-82a8-dac502259ad0.png

下面编译内核:

bcc458e2-3101-11ec-82a8-dac502259ad0.png

需要2分钟30秒左右。

再来一遍:

bcffe434-3101-11ec-82a8-dac502259ad0.png

这说明make clean, drop_caches后时间也差不多。

现在我们关闭smt,只保留10个CPU:

bd329bc2-3101-11ec-82a8-dac502259ad0.png

具体的关闭方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下10个CPU,下面来编译:

bd5da132-3101-11ec-82a8-dac502259ad0.png

时间2分51秒,相对于2分30秒,速度下降仅仅14%。

这说明超线程SMT对性能的提升绝对没有达到100%,甚至都没有达到20%。

我们现在重新开启超线程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control’

看一下哪个CPU和哪个CPU是thread sibling:

bd8d2d4e-3101-11ec-82a8-dac502259ad0.png

看起来CPU0和CPU10是一对,CPU1和CPU11是一对,依次类推。

刚才我们关闭SMT是把CPU10-CPU19全关了,只留下每对里面的1个CPU,也就是留下了CPU0-CPU9。

在开启SMT的时候(假设蓝色和红色是一个CORE里面的两个CPU):

bdb7342c-3101-11ec-82a8-dac502259ad0.png

在关闭SMT的时候,等于每对里面只留1个CPU:

bde7fc4c-3101-11ec-82a8-dac502259ad0.png

现在我们换一种关法,一对对关,只留下五对:

be0c1b18-3101-11ec-82a8-dac502259ad0.png

指令如下:

be49771a-3101-11ec-82a8-dac502259ad0.png

实现效果如下:

be8cbd2c-3101-11ec-82a8-dac502259ad0.png

再重新编译内核:

becfef3e-3101-11ec-82a8-dac502259ad0.png

现在耗时是3分10秒,想对于所有CPU全开,下降27%。相对于每个core里面只关一个线程,下降12%。

这就比较神奇了?为什么我关了5个core,性能没有下降100%呢?这至少说明一个问题,从5core到10core,Intel I9编译内核性能并没有线性地scale。只是从3分10秒,提升到2分30秒。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18250

    浏览量

    222043
  • intel
    +关注

    关注

    19

    文章

    3451

    浏览量

    184769

原文标题:这到底是为什么?「元芳,你怎么看?」

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    国产兆芯主板GM9-6002采用KX-U6780A处理器#兆芯处理器

    处理器主板
    国产计算机小秦
    发布于 :2024年04月13日 13:58:31

    国产GPU搭配国产处理器平台主机

    处理器gpu
    GITSTAR 集特工控
    发布于 :2024年03月27日 14:11:32

    支持Intel Core i5/i7的高性能三防加固平板|亿道三防onerugged

    大家好!今天我要向大家推荐一款真正强悍的三防加固平板电脑,它支持Intel Core i5/i7高性能处理器,给你带来无与伦比的高性能体验。是不是心动了呢?那就让我为你揭开这款亿道三防
    的头像 发表于 02-25 16:29 144次阅读

    TC38xx和TC37xx变体之间的AURIX处理器中的Core0是否相同?

    我想确认一下 TC38xx 和 TC37xx 变体之间的 AURIX 处理器中的 Core0 是否相同。
    发表于 01-26 06:33

    如何提高处理器性能

    提高处理器主频可以提高处理器性能,但是到一定程度就不能再提高了,我们需要通过双核,或者多核来提高处理器性能
    的头像 发表于 01-24 09:59 680次阅读
    如何提高<b class='flag-5'>处理器</b>的<b class='flag-5'>性能</b>

    如何为 ADAS 处理器提供超过 100A 的电流

    如何为 ADAS 处理器提供超过 100A 的电流
    的头像 发表于 11-24 14:54 189次阅读
    如何为 ADAS <b class='flag-5'>处理器</b>提供超过 <b class='flag-5'>100</b>A 的电流

    lpc54608的性能怎么样,属于什么级别的处理器

    lpc54608的性能怎么样,属于什么级别的处理器
    发表于 11-07 07:35

    青稞处理器资料分享

    至中断函数执行,进一步减小中断响应延迟。 3.两线和单线调试接口 区别于RISC-V经典的4线JTAG调试接口,青稞处理器率先引入两线甚至单线的DTM接口,只需两甚至一I/O即可实现对处理
    发表于 10-11 10:42

    基于第13代Intel Core处理器的模块

    凌华科技发布基于第13代Intel Core处理器的模块,可在 65W 功耗下提供最高 i9、24 核和 36MB 缓存,该模块支持 1 x16 PCIe Gen5,并具有多达 16 个性能核心以及 8 个能效核心,非常适合测量
    发表于 08-15 11:34 425次阅读

    请问E203 Core和NICE协处理器的主频各是多少?

    请问E203 Core和 NICE协处理器的主频各是多少?
    发表于 08-12 08:06

    GAUDIR HL-2000处理器介绍

    GAUDIRHL-2000是一款先进的Al和DeepLearning Training处理器,利用专门构建的体系结构,提供卓越的性能、可扩展性、电源效率和成本节约。Gaudi HL-205夹层卡
    发表于 08-04 07:23

    ARM922T处理器技术参考手册

    以作为可以嵌入到更复杂的设备中的独立核心来提供。独立核心有一简单的总线接口,允许您设计自己的缓存和周围的内存系统。ARM9TDMI系列微处理器同时支持32位ARM和16位Thumb指令集,使您能够在
    发表于 08-02 15:44

    ARM920T处理器技术参考手册

    高速缓存体系结构处理器,适用于全内存管理、高性能和低功耗至关重要的多程序应用。此设计中的独立指令和数据缓存大小分别为16KB,具有8字线长度。ARM920T处理器实现了一增强的ARM
    发表于 08-02 13:05

    ARM926EJ-S处理器技术参考手册

    32位ARM和16位Thumb指令集,使您能够在高性能和高代码密度之间进行权衡。ARM926EJ-S处理器包括高效执行Java字节码的功能,提供类似JIT的Java性能,但没有相关的代
    发表于 08-02 10:09

    S32K144EVB-Q100无法生成处理器专家代码怎么解决?

    我正在使用 S32K144EVB-Q100 板。 从示例中为 freeRTOS 创建新项目。 但是无法生成处理器导出代码和构建错误。
    发表于 05-16 07:30