0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探究一种新的可配置处理器的异构多核线程级动态调度模型

电子工程师 来源:中国集成电路 作者:胡泊 付宇卓 2021-04-27 18:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文针对基于可配置处理器的异构多核结构,提出一种新的线程级动态调度模型。此类异构多核系统中每个核分别针对某一应用做指令集扩展,调度器通过线程、处理器核以及指令集间的映射关系,动态调度线程至适合的处理器核,从而在没有大幅增加芯片面积的前提下,达到与每个核都

1.概述

多核处理器从结构上可以分为同构多核和异构多核两类。同构多核使用多个相同的处理核,通过并行处理提高系统性能;异构多核使用多个不同的处理核,增加并行性的同时还可针对特定应用做硬件加速,因此具有更好的加速比。不过,由于异构多核的核间指令集存在差异,动态调度较难实现。

本文针对基于可配置处理器的异构多核结构,提出一种新的线程级动态调度模型。此类异构多核系统中每个核分别针对某一应用做指令集扩展,调度器通过线程、处理器核以及指令集间的映射关系,动态调度线程至适合的处理器核,从而在没有大幅增加芯片面积的前提下,达到与每个核都具有全扩展指令集相近似的加速比,此外该模型还可以有效减少编程模型的复杂度。

2.新模型的数学描述

2.1 现有异构多核分析

同构多核核间无差异,因此动态调度容易实现,而异构多核动态调度可行与否取决于指令集结构设计。现有异构多核指令集结构设计大致可分为三类:

● 指令集完全不同

此类设计中,设计者选择不同功能导向的处理器核组成异构多核系统,每一种核针对某一类处理都具有较强功能,核之间的指令集存在巨大差异,因此动态调度在此类设计中无法实现,只能通过静态调度的方式完成任务指派[3]。

● 指令集完全相同

此类设计中,设计者选取具有相同指令集但硬件配置上有所不同的处理器核,组成异构多核系统[2]。

● 指令集部分相同

此类设计中,处理核心是一组可配置处理器,所有的处理核心具有一个公共的指令集,每个核心都可以根据应用增加一些扩展指令,以增强对应用某一方面的处理能力[4]。

2.2. 新模型的数学描述

本文提出的调度模型即针对基于可配置处理器的异构多核。该模型成立基于以下假设,每个核的指令集配置完成于芯片设计阶段,芯片一旦生产,任意一个核的指令集配置都不可修改。实际上,动态可配置指令集对芯片面积及功耗都会带来巨大消耗,因此现在市场上绝大部分可配置处理器都符合上述假设。为描述简单起见,下文中一个处理器核被称为core。

首先定义模型中使用的三个集合。

集合 C= {Xi|Xi是系统中某个core}

集合 I={Yi|Yi是系统中某种指令集}

集合 T={Zi|Zi是系统中某个线程}

对于上述集合,存在映射关系

f :C→∪Ii,Ii.I且Ii≠φ,即任意一个core必然存在一个I的非空子集Im与之对应,其实际意义表示该core可以运行集合Im所包含的指令。根据模型的成立条件,core的指令集在系统运行时不可修改,因此不同core对应的Im可能相同,但是每个core仅对应一个Im,故f是单射,即XIi∈C,Im.I,且Im ≠φ,f(Xi)=Im (式1)类似的。

还存在映射关系g:T→∪Ii,Ii.I且Ii≠φ,即任意一个线程必然存在一个I的非空子集In与之对应,其实际意义表示该线程必须运行在具有指令集In 的处理器上。任意一个时刻每个线程仅有一个In与之对应,此外不同的线程对应的In可能相同,故g也是单射,即Zi∈T,In.I,且In≠φ,g(Zi)=In (式2)根据上述公式,对任意的Xi,可以得到一个Im,任意的Zi,可以得到一个In,则公式(3)成立。

这是模型中的调度函数,当线程所需指令集是core指令集的子集,match(Im,In)值为1,表示线程Zi可以运行在处理器核Xi上。

3. 模型实现

上述模型可以有多种实现方式,本文参考位图的思想完成其中一种实现。

3.1. 三个集合的确定

考虑常用多核规模,32 种指令集已可满足指令集种类数量要求,因此该实现将无符号二进制32位整数的每一位对应一种指令集,其最低有效位为20,记为ISA1,最高有效位为231,记为ISA32,若可以运行指令集ISAm,则该无符号整数的第m位为1,故集合I在基于位图的实现中定义为I={ISAm无符号整数第m-1位为1,1≤m≤32}。

任意I中几个元素,对其依次做或运算(OR)得到一个新整数,该整数即可表示由这几个元素构成的I的子集。系统中所有的core具有公共指令集,将此指令集记为ISA1。

系统中每个core具有一个唯一编号,因此集合C= {0, 1, ……, n.1},n为系统中core的数量。

此外,根据线程的定义,不同的线程不能具有相同的线程句柄,因此T={所有线程句柄}。

3.2. 三个公式的实现

定义一个二维的无符号整数数组cpu_isa_map,数组每行第一个元素为core的编号,第二个元素为I的一个非空子集,表示该core可以运行的所有指令集,最后一行用于循环结束,第一个元素为无穷大(0xFFFFFFFF),第二个元素为空集。以core的编号对该数组遍历查询即可实现公式1。图1为该数组的一个例子。

POSIX线程标准中,每个线程具有pthread_attr_t结构体类型的属性参数,为了兼容POSIX标准,扩展该结构体,添加一个无符号整数变量runnable_isa,表示该线程可以运行的指令集集合。创建线程时需要显示设置runnable_isa,如果没有设置,该变量默认值为公共指令集ISA1,这样就实现了公式2。

对于公式3,首先根据调度器当前运行的core编号查询cpu_isa_map获得core支持的指令集core_isa,然后遍历线程调度器的就绪线程队列,将每个线程的runnable_isa属性与core_isa做与操作(AND),若结果不为0且runnable小于等于core_isa,则说明该core的指令集配置满足线程所需的运行要求。

即match(Im,In)为1,线程可以被运行,如果所有线程均无法运行在该核上,则返回空指针。图2为此算法实现,其中HEAD(state)为获得就绪线程队列的头指针,该队列尾指针的next指针为空指针。至此,模型已经全部实现完毕。

4. 实验结果

本文使用基于Xtensa处理器组成的异构多核系统,以Motion-JPEG作为测试程序对该模型进行实验分析。

4.1. 实验平台简介

Xtensa处理器是Tensilica公司推出的一种可配置处理器,该处理器除了具有一组固定的指令集之外,还可以通过TIE功能扩展指令集以加速程序运行。Tensilica公司提供了该处理器基于SystemC的仿真模型。本文的实验平台是由3个Xtensa处理器仿真模型组成的异构多核系统,分别记为core0,core1,core2。

本文节选自:中国集成电路

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20152

    浏览量

    247331
  • 仿真模型
    +关注

    关注

    1

    文章

    31

    浏览量

    12768
  • 多核处理器
    +关注

    关注

    0

    文章

    110

    浏览量

    20624
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    文了解Mojo编程语言

    Mojo 是一种由 Modular AI 公司开发的编程语言,旨在将 Python 的易用性与 C 语言的高性能相结合,特别适合人工智能(AI)、高性能计算(HPC)和系统编程场景。以下是关于
    发表于 11-07 05:59

    低优先线程无法调度怎么解决?

    1,设置了3,5,6,8几个优先,设备在现场正常运行了年多后,显示、前端、后端这3个低优先线程异常了,表现为屏幕不动,前端采集数据没有变化等,其他高优先
    发表于 09-25 07:33

    rtth studio中nano 如何创建动态线程

    有没有大佬,可以说下为什么静态线程可以正常使用,动态线程怎么也使用不了。 具体需要什么配置才能使用动态
    发表于 09-11 06:01

    【HZ-T536开发板免费体验】—— linux创建线程

    的执行任务成为单线程。多线程是程序中包含多个执行流,在个程序中可以同时运行多个不同的线程来执行不同的任务。 多线程提高了CPU的使用卤率。
    发表于 09-01 21:31

    rtt studio中nano 如何创建动态线程

    有没有大佬,可以说下为什么静态线程可以正常使用,动态线程怎么也使用不了。 具体需要什么配置才能使用动态
    发表于 08-22 06:19

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    文章,小编就将以飞凌嵌入式的OKMX8MP-C开发板为例,为大家介绍多核异构处理器M核程序的启动配置、程序编写和实时仿真的过程。
    的头像 发表于 08-13 09:05 3656次阅读
    【老法师】<b class='flag-5'>多核</b><b class='flag-5'>异构</b><b class='flag-5'>处理器</b>中M核程序的启动、编写和仿真

    商汤大装置发布基于DeepLink的异构混合调度方案

    调度复杂、跨域训练稳定性不足等行业挑战,全面提升异构集群的协同效率与运行可靠性,加速国产AI算力从“可用”迈向“好用”,为大模型训练提供强大而高效的支撑能力。
    的头像 发表于 08-05 10:01 885次阅读

    一种集成FPGA和DSP芯粒的异构系统封装

    将多个异构芯粒集成在起进行封装是一种具有广阔前景且成本效益高的策略,它能够构建出既灵活又可扩展的系统,并且能有效加速多样化的工作负载。
    的头像 发表于 07-03 09:23 1584次阅读
    <b class='flag-5'>一种</b>集成FPGA和DSP芯粒的<b class='flag-5'>异构</b>系统<b class='flag-5'>级</b>封装

    深度剖析 RT-Thread 线程调度流程

    RT-Thread调度线程的主要流程分如下:rtthread_startup:RTT的启动函数,主要负责板驱动,调度
    的头像 发表于 06-25 18:24 1450次阅读
    深度剖析 RT-Thread <b class='flag-5'>线程</b><b class='flag-5'>调度</b>流程

    米尔瑞芯微多核异构低功耗RK3506核心板重磅发布

    近日,米尔电子发布MYC-YR3506核心板和开发板,基于国产新一代入门级工业处理器瑞芯微RK3506,这款芯片采用三核Cortex-A7+单核Cortex-M0多核异构设计,不仅拥有
    发表于 05-16 17:20

    Nordic新代旗舰芯片nRF54H20深度解析

    异构架构​​的芯片集成了: ​​双Cortex-M33内核​​(主频320MHz,性能达nRF5340的2倍) ​​RISC-V协处理器集群​​(专为实时任务优化) ​​超大存储配置​​:2MB
    发表于 04-26 23:25

    多核异构,智控未来!IC610重新定义工业智能化

    //新能源车爆火的当下,工业自动化需求也在不断升级。生产线智能调度,光储充设备即时检测与汇总信息流快速处理,显示屏动态反馈设备状态……每个环节都需要
    的头像 发表于 02-27 16:14 944次阅读
    <b class='flag-5'>多核</b><b class='flag-5'>异构</b>,智控未来!IC610重新定义工业智能化

    端侧 AI 音频处理器:集成音频处理与 AI 计算能力的创新芯片

    对人工智能应用日益增长的需求。   集成音频处理与 AI 计算能力 端侧 AI 音频处理器的组成结构通常较为复杂,常采用多核异构架构,将不同类型的
    的头像 发表于 02-16 00:13 3084次阅读

    RK3399处理器:高性能多核异构计算平台

    RK3399是款高性能的多核异构计算平台,集成了强大的CPU、GPU以及丰富的多媒体和接口功能。其独特的双Cortex-A72+四Cortex-A53大小核CPU结构,使得RK3399在处理
    的头像 发表于 02-08 18:04 2405次阅读

    QorIQ®T1042多核处理器

    QorIQ®T1042多核处理器T1042 QorIQ高级多核处理器综合了数据网络、电信/数据通讯、无线网络基础设施和国防军事/航天工程应用所需要的性能卓越数据线路加速及网络和外围总线
    发表于 01-10 08:48