0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对测量多核性能的追求

星星科技指导员 来源:嵌入式计算设计 作者:Debbie Greenstreet, 2022-06-14 14:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

虽然嵌入式市场中多核处理器的可用性并不是什么新鲜事,但今天的软件工程师可以找到各种同质设备以及复杂的异构片上系统 (SoC) 作为他们设计的选项。这种高水平的多核集成提供了许多好处,包括更小、更低成本、更低功耗和更高性能的最终产品。

在工具和框架领域取得了进步,一些产品增加了编程范式,以帮助缓解围绕这种复杂性的开发挑战。然而,如果软件架构师不能最大化多核处理器设备中每个计算元素的处理能力,那么高度集成的多核 SoC 所提供的价值就会被打折扣。

软件工程师通过确定特定多核设备上的功能的标准方法来寻求完整的多核权利。虽然市场上有比较简单的、通常是单核处理器的性能的标准基准,但它还没有这些标准的基准或方法来比较复杂 SoC 的多核性能(或多核权利),这使得软件架构师很难为他们的设计选择最好的处理器。

基准测试挑战

在处理器简单且计算性能是唯一关注点的时代,对 CPU 性能进行基准测试相对容易。随着处理器架构的发展,基准测试挑战也随之而来。根据 Merriam-Webster 的说法,基准的定义之一是“作为衡量或判断他人的标准的东西”。换句话说,基准测试不是绝对的,而是相对的活动。当处理器架构的优势和劣势存在显着差异时,其中存在根本挑战:知道如何规范这些差异以制定既公平又准确的衡量标准。在实践中,这个问题很少得到解决,最终用户会留下难以以直接方式比较的措施。

迄今为止,传统的基准测试已经很好地服务于嵌入式处理器市场,尽管其方式有限。这些基准测试易于理解且范围有限,可在不考虑整体系统复杂性的情况下测量 CPU 的整数或浮点计算能力。有时,作为此类基准测试的测试工具执行的软件内核是单一功能,可以通过使用内在指令或其他专门功能轻松优化,这会使收益难以在真正的客户应用程序中转化。因此,传统的基准值为嵌入式处理工程师在选择设备时提供了第一次通过的指标,并与潜在供应商合作。

然而,当今先进的 SoC 需要更全面的基准测试来揭示真正的性能和功能以及任何隐藏的瓶颈。由于单个芯片上集成了如此多的功能,因此对现实生活中的用例进行建模和测量变得越来越困难。因此,业界已经朝着针对特定应用领域(例如 Java 加速、Android 性能或 Web 浏览性能)的基准迈进。这种方法与综合基准测试不同,适用于具有明确定义的应用程序段的处理器,并为用户提供了对预期性能的相当准确的评估。

多核复杂性

对于部署在医疗成像、工业自动化、关键任务系统、通信基础设施和高性能计算等各种应用中的新一代嵌入式多核处理器而言,问题并不那么简单。架构复杂性与复杂的软件实现相结合,使问题更加复杂。SoC 架构内所有处理元件和系统总线的内部连接会影响设备的计算性能,并使其更难以测量和评估。

通过多核实现,多个线程可以在不同的内核上并行执行,而不仅仅是在单个内核上执行多任务。并行路径数量和调度可能性的增加使得建模应用程序行为和测量性能变得更加困难。

此外,多核系统引入了另一个维度:可扩展性,或者说随着使用越来越多的内核,架构的可扩展性如何。可扩展性不仅在为当前应用程序选择合适的架构方面很重要,而且在规划未来增长或产品组合扩展方面也很重要。众所周知的行业事实是,应用程序加速不会与内核数量成比例地线性增加,因为性能在某些时候会下降,并且在某些情况下实际上会随着内核数量的增加而降低。这主要是由于内核数量增加所遇到的访问瓶颈,以及额外的同步需求。加速还取决于软件的分区方式以及它可以在多大程度上利用增加的并行性。

但是假设理想的软件实现,关于多核设备架构仍有很多话要说(见图 1)。高性能设备结合了多项创新技术,可有效地在系统中移动数据,从而使内核保持忙碌,而不会在访问停顿上浪费时间。高带宽芯片级互连和专用加速器创建了处理引擎孤岛,这些引擎以最少的核心干预工作,并且不会造成内存瓶颈。类似地,具有内置直接内存访问 (DMA) 的链式硬件队列充当迷你装配线,减轻中断的核心并安排这些处理任务。

图 1: Texas Instruments 的 KeyStone 多核 SoC 架构使用数据包 DMA 通信路径在所有 SoC 处理元件和 I/O 上并行调度任务,从而提供可扩展性。

poYBAGKoLJmAB3gQAANw08WV8c8681.png

构建块以获得更好的基准

随着芯片供应商采用截然不同的方法来提高多核效率,因此更需要设计可用于测量和比较可扩展性和性能的多核基准。这些基准测试应该易于移植,以便它们可以在裸机或常用操作系统上运行。由于增加了复杂性和复杂性,因此遵循模块化方法非常重要,这样可以使用基本构建块创建复杂的工作负载。在最低级别,基准测试应该包含可以参数化以改变计算与内存访问比率的处理内核。来自不同应用领域的代表性算法可用于创建其中一些内核。

内核也应该是可配置的,这样它们就可以在不同级别的资源争用下并行运行在不同的内核上。然后可以将这些内核的组合编织成复杂的工作负载拓扑,模拟各种特定于应用程序的场景。随着行业和多核应用程序的发展,可以设计更多工作负载并将其添加到现有基准测试的全部内容中。这些基准的输出应该是一个易于比较的分数,它反映了在特定数量的核心上完成给定工作负载所花费的时间。

毫无疑问,多核处理器支持新功能,并极大地改善了现有嵌入式产品的性能、功耗和成本。正如本期《嵌入式计算设计》中的文章所反映的,这个市场保持着兴奋和前景。令人着迷的是,虽然业界利用了部分多核基准测试机制,但没有主流的、市场接受的多核基准测试策略到位,尤其是在这样一个注重成本的经济时代。在做出最终选择之前,工程师和管理人员经常面临在多台设备上实施自己耗时的基准测试工作的艰巨任务。

很难不问为什么在多核市场上有如此聪明和创新的工程师会出现这种情况。也许这个以多核为特色的特别版将呼吁采取行动,以建立一个可行的、市场接受的多核基准测试策略,这不仅有利于使用此类设备的嵌入式工程师,也有利于多核 SoC 制造商。

作者:Debbie Greenstreet,Atul Verma

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20154

    浏览量

    247368
  • soc
    soc
    +关注

    关注

    38

    文章

    4517

    浏览量

    227672
  • 操作系统
    +关注

    关注

    37

    文章

    7330

    浏览量

    128663
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    移植RTThread多核如何开始(ZYNQ US 64位 A53)?

    想请教一下各位前辈如何移植RTThread到多核平台上,需要注意的问题和学习路线。
    发表于 09-22 07:25

    三坐标测量机结构材料对性能的影响

    三坐标测量机结构材料对测量精度、性能有很大影响,随着各种新型材料的研究、开发和应用,三坐标测量机结构材料种类越来越多。目前三坐标测量机主流结
    发表于 08-28 13:46 0次下载

    强强联手!爱丁堡大学与算能破局:RISC-V进军高性能计算,SG2044多核性能飙涨近5倍

    在RISC-V架构的普及浪潮中,嵌入式领域的成功早已众人皆知,但高性能计算(HPC)始终是其难以突破的“高地”。算能SOPHONSG2044的出现打破了僵局,其64核高性能CPU不仅在爱丁堡大学
    的头像 发表于 08-26 16:31 1393次阅读
    强强联手!爱丁堡大学与算能破局:RISC-V进军高<b class='flag-5'>性能</b>计算,SG2044<b class='flag-5'>多核</b><b class='flag-5'>性能</b>飙涨近5倍

    测试测量仪器对SMA公头的性能要求​

    对测试测量仪器而言,SMA 公头是 “数据入口”,性能直接决定结果可信度。德索从材料到工艺的全流程把控,让每个公头都成为精准测量的第一道保障。选择德索,就是给测试数据上了一道 “保险栓”。
    的头像 发表于 08-22 17:04 579次阅读
    测试<b class='flag-5'>测量</b>仪器对SMA公头的<b class='flag-5'>性能</b>要求​

    【上海晶珩睿莓1开发板试用体验】4、Coremark性能测试

    ,但组合能反映分支预测、缓存访问和整数算术的综合影响。 可扩展:支持单线程模式和基于官方 multicore harness 的多线程测试,用于测量多核总体吞吐量。 评分标准 CoreMark 的原始
    发表于 08-18 22:18

    三坐标测量机结构材料对性能的影响

    三坐标测量机结构材料对测量精度、性能有很大影响,随着各种新型材料的研究、开发和应用,三坐标测量机结构材料种类越来越多。目前三坐标测量机主流结
    的头像 发表于 08-13 14:25 1073次阅读
    三坐标<b class='flag-5'>测量</b>机结构材料对<b class='flag-5'>性能</b>的影响

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    有很多研究单片机的小伙伴在面对多核异构处理器时,可能会对多核的启动流程感到困惑——因为不熟悉GCC编程和GDB调试,所以也无法确定多核异构处理器的程序是否能像单片机那样方便地编写和仿真。本篇
    的头像 发表于 08-13 09:05 3661次阅读
    【老法师】<b class='flag-5'>多核</b>异构处理器中M核程序的启动、编写和仿真

    四探针法丨导电薄膜薄层电阻的精确测量性能验证与创新应用

    薄层电阻(SheetResistance,Rs)是表征导电薄膜性能的关键参数,直接影响柔性电子、透明电极及半导体器件的性能。四探针法以其高精度和可靠性成为标准测量技术,尤其适用于纳米级薄膜表征。本文
    的头像 发表于 07-22 09:52 857次阅读
    四探针法丨导电薄膜薄层电阻的精确<b class='flag-5'>测量</b>、<b class='flag-5'>性能</b>验证与创新应用

    噪声的测量方法详细干货

    随着近几年电路集成规模和信号频率的日益提高以及对低功耗的追求,导致信号环境日趋复杂,相对应测量小信号的精度要求不断提高,测量仪器的噪声大小成为重要的参数指标。而噪声是幅值很低的信号,观测需要有效的方法,本期介绍噪声的
    的头像 发表于 06-19 09:19 916次阅读
    噪声的<b class='flag-5'>测量</b>方法详细干货

    睿擎多核 SMP 开发:极简开发,超强性能——睿擎派开发板0元试用

    在工业控制、边缘计算等场景中,MPU多核架构的性能潜力常因开发复杂度难以释放。实时任务(如运动控制、高速采集)与计算密集型任务(如UI交互、网络通信、协议解析)混合运行,导致以下问题:实时性劣化
    的头像 发表于 05-29 17:04 1157次阅读
    睿擎<b class='flag-5'>多核</b> SMP 开发:极简开发,超强<b class='flag-5'>性能</b>——睿擎派开发板0元试用

    热成像仪为何都在疯狂卷多核处理器?“多核大战”背后的真相你知道吗?

    热成像仪进入“多核”时代,这不是噱头,而是需求在变。 从黑夜中识别生命体,到复杂地形中实现热源追踪,过去主要用于军事和工业的热成像仪,如今正越来越多地进入民用市场。而随着使用场景的复杂化,“看得见
    的头像 发表于 04-27 15:41 571次阅读

    一款高性能Wi-Fi+BLE无线模组产品

    超低功耗、超高性能,Wi-Fi 6双频物联网模块;多核处理器解决方案,支持BLE+Wi-Fi双透传
    发表于 04-21 13:50

    RK3399处理器:高性能多核异构计算平台

    RK3399是一款高性能多核异构计算平台,集成了强大的CPU、GPU以及丰富的多媒体和接口功能。其独特的双Cortex-A72+四Cortex-A53大小核CPU结构,使得RK3399在处理复杂
    的头像 发表于 02-08 18:04 2407次阅读

    SEGGER SystemView支持多核行为的观察和验证

    2025年2月,SEGGER宣布其实时软件验证和可视化工具SystemView增加了多核支持,将其功能扩展到单个芯片上具有多个CPU内核的系统。
    的头像 发表于 02-07 11:24 1079次阅读
    SEGGER SystemView支持<b class='flag-5'>多核</b>行为的观察和验证

    QorIQ®T1042多核处理器

    QorIQ®T1042多核处理器T1042 QorIQ高级多核处理器综合了数据网络、电信/数据通讯、无线网络基础设施和国防军事/航天工程应用所需要的性能卓越数据线路加速及网络和外围总线接口
    发表于 01-10 08:48