有一种管理CPU快速存取内存的新流程,耗能减少高达72%

IEEE电气电子工程师学会 2018-06-13 08:34 次阅读

━━━ ━━━    

有一种管理CPU快速存取内存的新流程,使速度提升了两倍之多,耗能减少高达72%。据这种流程的设计师称,实现这类卓越成果需要改变计算机中控制这一关键内存的部件:直接布线至CPU电路进行控制若交由操作系统处理,速度就可大幅提升。

CPU将高速内存缓存作为一种数字暂存区域。缓存主要是保存CPU可能很快用到的指令或是需要处理的数据,是CPU的工作台。从智能手机到服务器,几乎每一个CPU都是用其电路中内置的算法管理进出缓存的比特流的。

但是麻省理工学院的两位研究人员说,随着计算机和便携设备的内存和CPU核数不断增多,完全由CPU来管理缓存也越来越不现实。他们说,操作系统最好能分担这项工作。

这种想法本身并不是全新的概念。在IBM的一些Cell处理器以及索尼的PlayStation 3(基于Cell技术)中,应用程序和操作系统内核就参与了低级CPU内存管理。麻省理工学院的Jigsaw技术的特别之处在于其中立的方法,软件无需太多控制便能配置芯片上的一些内存缓存,从而避免编程成为内存管理的噩梦。

麻省理工学院计算机科学及人工智能实验室助理教授、Jigsaw发明者之一丹尼尔•桑切斯(Daniel Sanchez)说:“几年前,人人都在抱怨,说虽然推出了PlayStation 3,但没有人能把程序编好。”

通常由CPU硬件控制所有的芯片缓存,但这些缓存必须承担任何一项能想象到的工作,从单纯的浮点数运算(对缓存而言是一个小负担)到计算机存储器组的密集搜索和查询(可能会超越它们的极限)。此外,CPU对其所开展的工作类型并无深刻的认识。这意味着利用与图谱搜索(对存储数据之间关系进行的占用内存的搜索)一样的缓存资源就可进行自成一体、包含复杂方程式的数值模拟,几乎不需要访问内存。

因此桑切斯和他的研究生南森•贝克曼(Nathan Beckmann)想,为什么不让操作系统减小缓存规模,进行纯计算,并扩充其设置进行图谱搜索呢?

他们说,第一步是将CPU占用空间的约1%分给一个可实时监控每个核心中缓存活动的简单硬件。有了硬件缓存监视器,Jigsaw就具备了充当CPU缓存空中交通管制员所需的独立监视能力。

桑切斯和贝克曼说,然后最多需要给操作系统内核再增加几千行代码即可。考虑到之前Linux内核提供了1500万行代码,而非官方的数字称,苹果和微软的内核则比这个数字还多几千万行,所以增加几千行并不多。

桑切斯说,Jigsaw其中一个更为突出的特别之处是嵌入操作系统的一个软件模块,研究人员称其为Peekahead。这种模块是根据十多年前北京的计算机科学家们开发的Lookahead缓存改造而成的。Peekahead能预测内核在未来时钟周期内要进行的工作,据此计算最佳CPU缓存配置。

桑切斯说:“如果交由软件管理,那么就必须要注意开销了。”他说设计不当的缓存管理系统可能会将缓存缩小到最佳规模,每秒重复多次,但这样会给CPU造成负担。需要大量CPU时间的CPU效率算法的意义何在?他说:“精确解非常昂贵。所以我们必须找到一个快速完成工作的方法,以保证开销不会超过收益。”

总部位于加利福尼亚山景城的半导体咨询公司林利集团的林利•格温耐普(Linley Gwennap)说,他对Jigsaw印象深刻,但要注意晶圆厂还未完全作好准备。“一般来说,问题是,在一种处理器上奏效的方案,在另一种具有不同硬件设计的处理器上可能不起作用。”他说道,“处理器一有变化,就不得不重新设计软件,客户们对此不太喜欢。”

桑切斯反驳说,软件应用和实用程序不会受到Jigsaw的影响。他说:“只有操作系统代码需要熟悉硬件知识,如缓存不同部分的拓扑结构。”

密歇根大学计算机科学助理教授杰森•玛尔斯(Jason Mars)说,作为概念验证手段,Jigsaw很有效,但他说芯片制造商在他们认为适当之处可能进行调整。

“这项工作的奇妙之处与软硬件之间的协同设计有关。”玛尔斯说,“以往的大部分工作都偏向一个方向。预期在硬件中完成的工作较多,相对灵活性较少。Jigsaw确实创建了一套涵盖了硬件和软件的全面体系。”

原文标题:缓存机:众核处理器要求软件具备灵活性,以最大限度地利用板载内存

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

安谋酝酿反攻 破天荒公布CPU IP蓝图

芯片设计IP授权业者安谋(ARM)破天荒公布未来2年CPU IP产品蓝图,包括锁定5G随时连网行动装....

的头像 DIGITIMES 发表于 08-21 09:57 84次 阅读
安谋酝酿反攻 破天荒公布CPU IP蓝图

ARM首次公布了其到2020年为止的CPU规划图!

在2020年 ARM 将推出基于7nm和5nm工艺的“Herculues”核心,其性能相比于“Dei....

的头像 电子技术应用ChinaAET 发表于 08-21 09:55 76次 阅读
ARM首次公布了其到2020年为止的CPU规划图!

科技精选:ARM首次公布CPU规划图、三星电子在华销售占比逾三成、Apple Store被暂时关闭

根据外媒 iCulture 的报道,由于 iPad 电池爆炸并向空气中释放潜在的有害物质,苹果位于阿....

的头像 TechSugar 发表于 08-21 08:41 137次 阅读
科技精选:ARM首次公布CPU规划图、三星电子在华销售占比逾三成、Apple Store被暂时关闭

最强Android CPU评选 麒麟960/骁龙821/Exynos 8890对比评测

今年年底是安卓旗舰机器集体高潮的一个岁末,华为Mate 9携麒麟960率先杀出,之后高通将一大波骁龙....

的头像 39度创意研究所 发表于 08-20 10:15 369次 阅读
最强Android CPU评选 麒麟960/骁龙821/Exynos 8890对比评测

深度分析Linux内存使用方法

一提到内存管理,我们头脑中闪出的两个概念,就是虚拟内存,与物理内存。这两个概念主要来自于linux内....

的头像 嵌入式ARM 发表于 08-20 09:00 409次 阅读
深度分析Linux内存使用方法

iPhone 也要做屏下指纹?

• 苹果涉嫌对雅虎日本实施反竞争行为,正接受调查 • 设备资讯:三星可折叠手机、坚果 R1 512....

的头像 爱范儿 发表于 08-18 10:44 428次 阅读
iPhone 也要做屏下指纹?

51单片机CPU结构各部件的原理详细分析

一、 51单片机串行口工作原理 MCS-51系列单片机片内有一个串行I/O端口,通过引脚RXD(P....

的头像 玩转单片机 发表于 08-18 10:39 206次 阅读
51单片机CPU结构各部件的原理详细分析

外媒曝苹果正研发基于ARM架构的笔记本CPU,或将弃用Intel处理器

昨日,ARM公布了到2020年的架构路线图,虽然都是基于Cortex A76优化,但是通过每代至少提....

发表于 08-18 10:15 103次 阅读
外媒曝苹果正研发基于ARM架构的笔记本CPU,或将弃用Intel处理器

ARM史上第一次公开发布了一份CPU规划路线图

ARM首次公布了一份5/7nm CPU规划路线图。ARM称计算性能每一代都可以提升超过15%,并表示....

的头像 电子发烧友网工程师 发表于 08-18 08:42 237次 阅读
ARM史上第一次公开发布了一份CPU规划路线图

近日新闻:三星或关闭天津工厂;联电停止研发12nm以下工艺

这一周,半导体行业重磅新闻颇多,三星因成本原因考虑关闭天津工厂,联电神奇的宣布停止12nm以下工艺研....

的头像 电子发烧友网工程师 发表于 08-18 08:38 826次 阅读
近日新闻:三星或关闭天津工厂;联电停止研发12nm以下工艺

华为硬件工程师手册详细资料免费下载

产品硬件项目的开发,首先是要明确硬件总体需求情况,如CPU 处理能力、存储容量及速度,I/O 端口的....

发表于 08-17 17:24 87次 阅读
华为硬件工程师手册详细资料免费下载

通过CP343-1模块实现S7-300之间的以太网通讯设计方案

2套S7-300系统由PS307电源、CPU314C-2DP、CPU314C-2PTP、CP343-....

发表于 08-17 15:57 38次 阅读
通过CP343-1模块实现S7-300之间的以太网通讯设计方案

英特尔CPU新漏洞“预兆”(L1TF)

以色列创新局、以色列经济产业部和国家网络局8月14日证实,以色列推出了一项旨在加强以色列网络产品的专....

的头像 E安全 发表于 08-17 14:59 412次 阅读
英特尔CPU新漏洞“预兆”(L1TF)

9代酷睿遭曝光,最高可超频至5.0GHz

Intel今年底之前有望更新多个平台的CPU产品,包括普通桌面级的“Core 9000”(9代酷睿?....

发表于 08-17 10:51 82次 阅读
9代酷睿遭曝光,最高可超频至5.0GHz

Arm首次公布CPU路线图:每年提升15% 超越低压版i5

Arm此前刚刚在6月初发布了新一代高性能CPU核心Cortex-A76,可搭配10nm、7nm工艺,....

的头像 章鹰 发表于 08-17 10:38 1180次 阅读
Arm首次公布CPU路线图:每年提升15% 超越低压版i5

探讨高阶综合完成产品前端设计、验证、优化、性能评估的方法和流程

Fmul64的SC设计总体框图如图2所示,sc_main()是SystemC设计的top文件,连接....

的头像 电子技术应用ChinaAET 发表于 08-17 10:05 247次 阅读
探讨高阶综合完成产品前端设计、验证、优化、性能评估的方法和流程

ARM首次公布CPU规划路线图,展示其未来两代CPU发展方向

昨天,ARM史上第一次公开发布了一份CPU规划路线图,展示了未来两代CPU IP的性能和功耗规划,一....

发表于 08-17 10:01 68次 阅读
ARM首次公布CPU规划路线图,展示其未来两代CPU发展方向

NVIDIA推出最新系列Quadro GTX显卡,专为数字动画师和开发人员而设计

新的GPU将是现有的NVIDIA GeForce GTX 1080的继承者。早期的预测是,新卡将贴上....

发表于 08-17 09:50 174次 阅读
NVIDIA推出最新系列Quadro GTX显卡,专为数字动画师和开发人员而设计

TM4C123x使用知识点:当使用cpu复位重新启动ccs程序时出现假中断情况的解决

在CCS中使用cpu复位的时候,外围设备不会复位,从而导致当中断启用时产生虚假中断。有两个解决方案 1.总是使用系统复位而不是...

发表于 08-17 06:04 34次 阅读
TM4C123x使用知识点:当使用cpu复位重新启动ccs程序时出现假中断情况的解决

Intel披露一种新的CPU安全漏洞

和年初的Meltdown(熔断)和Spectre(幽灵)漏洞类似,Intel披露了一种新的CPU安全....

的头像 EETOP 发表于 08-16 17:32 545次 阅读
Intel披露一种新的CPU安全漏洞

893-DCB系列智能前端在PLC控制系统中的应用

该方案的关键是把PLC中央处理单元从繁杂的IO运算处理中解放出来,必须有高效的手段保障现场测控网络和....

发表于 08-16 17:04 570次 阅读
893-DCB系列智能前端在PLC控制系统中的应用

英特尔计划以傲腾 + QLC产品组合重塑内存和存储行业

英特尔提出将以傲腾 + QLC 这一产品组合重塑内存和存储行业的愿景。通过将傲腾™ 和英特尔® QL....

发表于 08-16 15:49 80次 阅读
英特尔计划以傲腾 + QLC产品组合重塑内存和存储行业

华为云工业云、游戏云与云服务器C3ne分别获得可信云行业云奖、技术创新奖三项大奖

基于华为云16大类120+云服务,华为云工业云联合业界400+生态伙伴一起,为全球客户提供高性能、高....

的头像 CTI论坛 发表于 08-16 15:43 678次 阅读
华为云工业云、游戏云与云服务器C3ne分别获得可信云行业云奖、技术创新奖三项大奖

麒麟980处理器已开始生产,CPU、GPU和NPU的性能都会有质的飞跃提升

日前,从台湾产业链曝光的消息称,台积电已经正式开始试生产麒麟980处理器了,由于7nm工艺制程目前的....

发表于 08-16 11:26 198次 阅读
麒麟980处理器已开始生产,CPU、GPU和NPU的性能都会有质的飞跃提升

请问无效操作和指令陷阱这个在软件上是怎么配置的?

您好,《安全手册》里说“Cortex-R4F CPU 包括针对无效操作的诊断和可被用作安全机制的指令。很多此类陷阱在复位后不启用且...

发表于 08-16 07:02 40次 阅读
请问无效操作和指令陷阱这个在软件上是怎么配置的?

AMD新一代处理器对英特尔垄断地位发起冲击

Mercury Research公司的半导体研究人员们正在对数据进行整理,旨在反映AMD新一代处理器....

的头像 ICChina 发表于 08-15 17:48 802次 阅读
AMD新一代处理器对英特尔垄断地位发起冲击

苏州国芯科技完成股权变更,国家集成电路产业投资基金股份有限公司入股

今年5月,国芯历经5年开发的汽车电子车身控制芯片CCFC2002BC向国内某汽车电子厂商交付第一批2....

的头像 EETOP 发表于 08-15 17:35 901次 阅读
苏州国芯科技完成股权变更,国家集成电路产业投资基金股份有限公司入股

为什么说现代CPU架构并不适用于AI?

关于人工智能(AI)的报导一直不绝于耳。过去几年来,几乎每个月(有时甚至是每周)都会有一款现有或新创....

的头像 面包板社区 发表于 08-15 16:15 593次 阅读
为什么说现代CPU架构并不适用于AI?

服务器硬盘发生故障前会有哪些表现?

服务器硬盘作为服务器的核心数据仓库,所有用户数据以及软件都存在于此,它的稳定与安全与否直接决定着服务....

的头像 存储界 发表于 08-15 15:23 149次 阅读
服务器硬盘发生故障前会有哪些表现?

西门子SMART系列PLC在血液透析水处理设备中的应用设计

衡量透析用水处理产品优劣的标准是其能否为血液透析提供优质的纯化水。其本身作为一种医疗设备,功能的完备....

发表于 08-15 14:40 59次 阅读
西门子SMART系列PLC在血液透析水处理设备中的应用设计

现代CPU架构并不适用于AI,如何调整软体和硬体?

关于人工智能(AI)的报导一直不绝于耳。过去几年来,几乎每个月(有时甚至是每周)都会有一款现有或新创....

的头像 Imagination Tech 发表于 08-15 11:46 1171次 阅读
现代CPU架构并不适用于AI,如何调整软体和硬体?

海为N型PLC,对丝杠长时间工作后的精度和重复性验证设计

控制器采用海为N系列运动型CPU型号为N16S2T,该CPU提供4路200KHz的高速脉冲输入和4路....

发表于 08-15 11:46 117次 阅读
海为N型PLC,对丝杠长时间工作后的精度和重复性验证设计

multi-tap的FlexHtree自动化时钟树综合流程

传统单一的H-tree多用于Mesh、Fishbone时钟结构的前级驱动,或者部分对clock s....

的头像 电子技术应用ChinaAET 发表于 08-15 10:01 186次 阅读
multi-tap的FlexHtree自动化时钟树综合流程

采用CPU通信功能同步AGV和车体传送带的控制,三大解决方案介绍

可以利用综合控制盘的可编程控制器和各AGV上搭载的可编程控制器相互交换信息,将各AGV速度与车体传送....

发表于 08-15 09:05 150次 阅读
采用CPU通信功能同步AGV和车体传送带的控制,三大解决方案介绍

通过导入Absocoder简单实现传送带生产线的同步监视的三大解决方案

Absocoder为绝对方式。即使发生电源切断和偶发干扰,也可正确检测位置,提高生产线的可靠性。此外....

发表于 08-15 08:52 55次 阅读
通过导入Absocoder简单实现传送带生产线的同步监视的三大解决方案

二级缓存的简单配置教程详解 浅谈二级缓存之功效

缓存是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速度很快。L1Cache(一级....

发表于 08-14 15:28 76次 阅读
二级缓存的简单配置教程详解 浅谈二级缓存之功效

AMD的新服务器体系结构和设计

Intel故意限制单个CPU核心数、内存数和PCIe等接口数,通过双CPU服务器增加CPU销售额。而....

的头像 ssdfans 发表于 08-14 15:10 373次 阅读
AMD的新服务器体系结构和设计

二级缓存速度如何 二级缓存最大多少

缓存大小也是CPU的重要指标之一,且缓存的结构和大小对CPU速度的影响大,CPU内缓存的运行频率极高....

发表于 08-14 15:01 42次 阅读
二级缓存速度如何 二级缓存最大多少

amd二级缓存多少比较好 如何选择范围

CPU在缓存中找到有用的数据被称为命中,当缓存中没有CPU所需的数据时(这时称为未命中),CPU才访....

发表于 08-14 14:38 40次 阅读
amd二级缓存多少比较好 如何选择范围

电脑内存条和液态硬盘的区别

硬盘与内存的区别是很大的,这里只谈最主要的三点:一、内存是计算机的工作场所,硬盘用来存放暂时不用的信....

发表于 08-14 11:48 98次 阅读
 电脑内存条和液态硬盘的区别

二级缓存怎么清理或者关闭二级缓存的办法介绍

CPU缓存(Cache Memory)位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快....

发表于 08-14 11:38 51次 阅读
二级缓存怎么清理或者关闭二级缓存的办法介绍

游戏安装固态硬盘还是液态硬盘比较好

其实限制游戏的更多的是进入游戏后的画质和音效,但是硬盘是存储介质,而画质音效的关系不是很大,所以对于....

发表于 08-14 11:29 110次 阅读
游戏安装固态硬盘还是液态硬盘比较好

如何检测cpu二级缓存是否损坏 详解二级缓存对CPU性能影响

综上所述,在CPU性能方面,并非只从二级缓存容量上作对比就可以得到准确的答案,实际上还要考虑到缓存的....

发表于 08-14 10:39 84次 阅读
如何检测cpu二级缓存是否损坏 详解二级缓存对CPU性能影响

换个液态硬盘多少钱 液态硬盘能扩内存吗

一般的液态硬盘120G也就100多块钱吧,不过现在液态硬盘的容量随便都是1-2T,当然一般都在500....

发表于 08-14 10:36 90次 阅读
换个液态硬盘多少钱 液态硬盘能扩内存吗

怎样启用CPU的二级缓存 如何查看二级缓存的参数

提到二级缓存容量的差距,还得从两大CPU巨头对一级缓存的理解说起。对,没看错,就是平常曝光率远逊于二....

的头像 沈丹 发表于 08-14 10:20 209次 阅读
怎样启用CPU的二级缓存 如何查看二级缓存的参数

CPU 2级缓存3m和6m区别是什么 对运行速度有影响吗

CPU缓存越高代表的是CPU档次越高而不是主频越低,部分高端CPU才使用到3级缓存。

发表于 08-14 10:06 154次 阅读
CPU 2级缓存3m和6m区别是什么 对运行速度有影响吗

cpu二级缓存越大越好吗 现在一般都是多大

CPU缓存(Cache Memory)位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快....

发表于 08-14 09:40 69次 阅读
cpu二级缓存越大越好吗 现在一般都是多大

ARM Cortex-M4中断优先级和嵌套

我前面提到一句,M4虽然指令集是向下兼容M0+的,但是在中断优先级管理上是有区别的,由于M4的中断源....

的头像 电子技术应用ChinaAET 发表于 08-14 09:29 716次 阅读
ARM Cortex-M4中断优先级和嵌套

一级缓存、二级缓存、三级缓存区别是什么 详解它们的区分方法

一级缓存(Level 1 Cache)简称L1 Cache,位于CPU内核的旁边,是与CPU结合最为....

发表于 08-14 09:27 76次 阅读
一级缓存、二级缓存、三级缓存区别是什么 详解它们的区分方法

Go语言在多线程领域编程、跨异构平台及编程难易程度的优势

Go语言的异构平台移植也非常简单,仅需要应用程序的源码,在异构平台上直接编译即可,且编译后的二进制....

的头像 电子技术应用ChinaAET 发表于 08-14 09:25 244次 阅读
Go语言在多线程领域编程、跨异构平台及编程难易程度的优势

二级缓存是什么意思 为什么要分一二三级缓存

CPU缓存(Cache Memory)位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快....

发表于 08-14 08:56 67次 阅读
二级缓存是什么意思 为什么要分一二三级缓存

国产CPU的发展现状分析

目前,主要的CPU架构有四种:ARM、X86、MIPS、Power。其中ARM/MIPS/Power....

的头像 Linuxer 发表于 08-13 17:25 395次 阅读
国产CPU的发展现状分析

SSM2518,I2S不输出数据的情况下,测量OUT R/L的输出端,发现输出窄方波脉冲,请问这种情况是否正常?

CPU上电后通过I2C配置SSM2518,I2S不输出数据的情况下,测量OUT R/L的输出端,发现输出波形如下图所示,有比较窄...

发表于 08-13 08:31 60次 阅读
SSM2518,I2S不输出数据的情况下,测量OUT R/L的输出端,发现输出窄方波脉冲,请问这种情况是否正常?

请问怎么计算RM48L952 CPU使用率?

再裸机跑的情况下怎么计算RM48L952 CPU的使用率? 我需要对此芯片做测试和评估.......

发表于 08-13 06:25 46次 阅读
请问怎么计算RM48L952 CPU使用率?

我有一个关于计算机体系结构的问题?cpu就一个同步振荡脉冲吗?

为什么不同的cpu主频不一样,有哪些影响因素?cpu就一个同步振荡脉冲吗? ...

发表于 08-10 22:22 102次 阅读
我有一个关于计算机体系结构的问题?cpu就一个同步振荡脉冲吗?

单片机的五个特点

(1)高集成度,体积小,高可靠性 单片机将各功能部件集成在一块晶体芯片上,集成度很高,体积自然也是最小的。芯片本身是按工...

发表于 08-10 09:05 182次 阅读
单片机的五个特点

AD7177-2输出速率200Hz,CPU定时器也是5ms的,请问会不会存在不匹配的问题?

        使用AD7177-2,四个通道轮训采集,采样率200Hz,相当于每个通道50Hz,ad芯片配置成连...

发表于 08-10 08:37 91次 阅读
AD7177-2输出速率200Hz,CPU定时器也是5ms的,请问会不会存在不匹配的问题?

aducm360:进入低功耗无法唤醒 请问是什么原因?

如图,cpu进入低功耗后,想用串口或外部中断唤醒CPU,那么将35和39引脚分别配置外外部中断2和外部中断4,   Ei...

发表于 08-09 07:22 128次 阅读
aducm360:进入低功耗无法唤醒 请问是什么原因?

AD7177-2 多通道采样问题,请问3片AD7177-2共12路数据采集CPU怎么处理比较好?

        前面也发过相关帖子,关于多片AD7177-2多通道采样的问题。      &nbs...

发表于 08-09 06:44 70次 阅读
AD7177-2 多通道采样问题,请问3片AD7177-2共12路数据采集CPU怎么处理比较好?

超干货!不同系统查看CPU速度的具体步骤这里全都有!

CPU速度决定了进程执行任务的速度。由于多核处理器的出现,CPU速度比过去更快。尽管如此,在购买新程序时检查CPU速度可...

发表于 08-08 15:59 67次 阅读
超干货!不同系统查看CPU速度的具体步骤这里全都有!