0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ntel I9的多核scalability是真的吗

Linux阅码场 来源:Linux阅码场 作者:宋宝华 2021-10-20 11:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨天我们用Intel I9的10核,每个核2个threads的机器跑了内核的编译:

超线程SMT究竟可以快多少?

今天,我换一台机器,采用AMD Ryzen。

默认情况16核,每个核2个threads,共32个CPUs:

8d9e0e28-3101-11ec-82a8-dac502259ad0.png

下面编译内核:

8df6755e-3101-11ec-82a8-dac502259ad0.png

大约需要53秒。记得昨天用Intel I9 10核20线程需要2分钟30秒左右。

再来一遍:

8e5dca56-3101-11ec-82a8-dac502259ad0.png

这说明make clean, drop_caches后时间也差不多。51秒,53秒左右的正常抖动范围。

现在我们关闭smt,只保留16个CPU:

8eda8b0e-3101-11ec-82a8-dac502259ad0.png

具体的关闭方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下16个CPU,下面来编译:

8f52ff44-3101-11ec-82a8-dac502259ad0.png

时间57秒,相对于51、53秒,速度下降不到10%。

这说明超线程SMT对编译内核这个workload的性能的提升绝对没有达到100%,甚至都没有达到10%。

我们现在重新开启超线程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control

看一下哪个CPU和哪个CPU是thread sibling:

8fd104d4-3101-11ec-82a8-dac502259ad0.png

看起来CPU0和CPU16是一对,CPU1和CPU17是一对,依次类推。

刚才我们关闭SMT是把CPU16-CPU31全关了,只留下每对里面的1个CPU,也就是留下了CPU0-CPU15。

在开启SMT的时候(假设蓝色和红色是一个CORE里面的两个CPU):

9085d2f6-3101-11ec-82a8-dac502259ad0.png

在关闭SMT的时候,等于每对里面只留1个CPU:

现在我们换一种关法,一对对关,只留下8对,也就是8个core:

指令如下:

918b663e-3101-11ec-82a8-dac502259ad0.png

实现效果如下:

92315648-3101-11ec-82a8-dac502259ad0.png

再重新编译内核:

926acc0c-3101-11ec-82a8-dac502259ad0.png

现在耗时是1分21秒,相对于所有CPU全开,下降了很多,时间增大了59%,当然没有达到2倍。

再想想昨天的Intel I9,关闭5个完整核耗时是3分10秒,全开10核是2分30秒,Intel一半核工作和所有核同时工作的差距远不如AMD那么明显。

所以可以看出,就内核编译这个workload而言,AMD的16core相对于8core,性能的scale会更加成正比。当然AMD开关SMT,对内核编译这个workload而言,影响小于10%,而Intel I9的影响有14%。

很多童鞋昨天留言,说编译内核有一定的IO bound,另外提到link阶段是单线程,还有的童鞋说是Intel Turbo的影响,这些我们都认为是有一定道理的。但是,我始终坚信,profiling是检验猜想的唯一标准,后面有空再写一篇文章来profiling一些究竟是为什么。

这到底是为什么?牙膏厂的多核scalability究竟是不是骗纸?还是按摩店的部分核没有Intel部分核的威猛模式?「元芳,你怎么看?」

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139019
  • 内核
    +关注

    关注

    4

    文章

    1436

    浏览量

    42490
  • intel
    +关注

    关注

    19

    文章

    3506

    浏览量

    190564

原文标题:这到底是为什么?牙膏厂的多核scalability究竟是不是骗纸?还是按摩店的部分核没有Intel部分核的威猛模式?「元芳,你怎么看?」

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    文章,小编就将以飞凌嵌入式的OKMX8MP-C开发板为例,为大家介绍多核异构处理器M核程序的启动配置、程序编写和实时仿真的过程。
    的头像 发表于 08-13 09:05 3631次阅读
    【老法师】<b class='flag-5'>多核</b>异构处理器中M核程序的启动、编写和仿真

    多个i.MXRT共享一颗Flash启动的方法与实践(上)

    有些客户应用会采用多颗 i.MXRT 芯片设计一主多从的硬件架构(目的不一,或仿多核 MCU 系统、或拓展 GPIO 数量),因为 i.MXRT 片内无非易失性存储器,这时候为整个系统配置合适的启动设备保证每个
    的头像 发表于 06-05 10:01 1004次阅读
    多个<b class='flag-5'>i</b>.MXRT共享一颗Flash启动的方法与实践(上)

    热成像仪为何都在疯狂卷多核处理器?“多核大战”背后的真相你知道吗?

    热成像仪进入“多核”时代,这不是噱头,而是需求在变。 从黑夜中识别生命体,到复杂地形中实现热源追踪,过去主要用于军事和工业的热成像仪,如今正越来越多地进入民用市场。而随着使用场景的复杂化,“看得见
    的头像 发表于 04-27 15:41 563次阅读

    MGMF184L1D9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MGMF184L1D9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 02-19 19:09
    MGMF184L1D<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    SEGGER SystemView支持多核行为的观察和验证

    2025年2月,SEGGER宣布其实时软件验证和可视化工具SystemView增加了多核支持,将其功能扩展到单个芯片上具有多个CPU内核的系统。
    的头像 发表于 02-07 11:24 1067次阅读
    SEGGER SystemView支持<b class='flag-5'>多核</b>行为的观察和验证

    MDMF304L1C9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MDMF304L1C9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 02-06 19:09
    MDMF304L1C<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    MDMF304A1H9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MDMF304A1H9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 02-05 19:00
    MDMF304A1H<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    MDMF304A1G9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MDMF304A1G9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 01-23 18:55
    MDMF304A1G<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    阿里云ECS g9i全球邀测启动

    今日,在备受瞩目的阿里云国际开发者大会上,阿里云正式向全球用户推出了其第9代企业级实例——ECS g9i,并开启了邀测活动。这一新品的发布,标志着阿里云在高性能计算领域再次迈出了坚实的一步。 ECS
    的头像 发表于 01-22 15:14 838次阅读

    集特工控机主板H110芯片组,支持6~9th Gen LGA1151 i9/i7/i5/i3/处理器

    工控机
    GITSTAR 集特工控
    发布于 :2025年01月20日 15:09:18

    MDMF304A1D9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MDMF304A1D9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 01-17 18:51
    MDMF304A1D<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    QorIQ®T1042多核处理器

    和NOR闪存的集成闪存控制器–具备12位双数据速率的显示接口模块(DIU)–TDM接口–四个GPIO控制器,兼容多达109个通用型I/O信号–两个8通道DMA模块–多核可编程中断控制器(MPIC
    发表于 01-10 08:48

    MHMF084L1T9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MHMF084L1T9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 12-19 18:53
    MHMF084L1T<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    MHMF084A1V9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MHMF084A1V9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 12-13 18:56
    MHMF084A1V<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下

    MHMF084A1A9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动- 松下

    电子发烧友网为你提供Panasonic(Panasonic)MHMF084A1A9M-MINAS A6 系列 Block动作应用说明资料 -I/F启动-相关产品参数、数据手册,更有
    发表于 12-09 18:54
    MHMF084A1A<b class='flag-5'>9</b>M-MINAS A6 系列 Block动作应用说明资料 -<b class='flag-5'>I</b>/F启动- 松下