有一种管理CPU快速存取内存的新流程,耗能减少高达72%

IEEE电气电子工程师学会 2018-06-13 08:34 次阅读

━━━ ━━━    

有一种管理CPU快速存取内存的新流程,使速度提升了两倍之多,耗能减少高达72%。据这种流程的设计师称,实现这类卓越成果需要改变计算机中控制这一关键内存的部件:直接布线至CPU电路进行控制若交由操作系统处理,速度就可大幅提升。

CPU将高速内存缓存作为一种数字暂存区域。缓存主要是保存CPU可能很快用到的指令或是需要处理的数据,是CPU的工作台。从智能手机到服务器,几乎每一个CPU都是用其电路中内置的算法管理进出缓存的比特流的。

但是麻省理工学院的两位研究人员说,随着计算机和便携设备的内存和CPU核数不断增多,完全由CPU来管理缓存也越来越不现实。他们说,操作系统最好能分担这项工作。

这种想法本身并不是全新的概念。在IBM的一些Cell处理器以及索尼的PlayStation 3(基于Cell技术)中,应用程序和操作系统内核就参与了低级CPU内存管理。麻省理工学院的Jigsaw技术的特别之处在于其中立的方法,软件无需太多控制便能配置芯片上的一些内存缓存,从而避免编程成为内存管理的噩梦。

麻省理工学院计算机科学及人工智能实验室助理教授、Jigsaw发明者之一丹尼尔•桑切斯(Daniel Sanchez)说:“几年前,人人都在抱怨,说虽然推出了PlayStation 3,但没有人能把程序编好。”

通常由CPU硬件控制所有的芯片缓存,但这些缓存必须承担任何一项能想象到的工作,从单纯的浮点数运算(对缓存而言是一个小负担)到计算机存储器组的密集搜索和查询(可能会超越它们的极限)。此外,CPU对其所开展的工作类型并无深刻的认识。这意味着利用与图谱搜索(对存储数据之间关系进行的占用内存的搜索)一样的缓存资源就可进行自成一体、包含复杂方程式的数值模拟,几乎不需要访问内存。

因此桑切斯和他的研究生南森•贝克曼(Nathan Beckmann)想,为什么不让操作系统减小缓存规模,进行纯计算,并扩充其设置进行图谱搜索呢?

他们说,第一步是将CPU占用空间的约1%分给一个可实时监控每个核心中缓存活动的简单硬件。有了硬件缓存监视器,Jigsaw就具备了充当CPU缓存空中交通管制员所需的独立监视能力。

桑切斯和贝克曼说,然后最多需要给操作系统内核再增加几千行代码即可。考虑到之前Linux内核提供了1500万行代码,而非官方的数字称,苹果和微软的内核则比这个数字还多几千万行,所以增加几千行并不多。

桑切斯说,Jigsaw其中一个更为突出的特别之处是嵌入操作系统的一个软件模块,研究人员称其为Peekahead。这种模块是根据十多年前北京的计算机科学家们开发的Lookahead缓存改造而成的。Peekahead能预测内核在未来时钟周期内要进行的工作,据此计算最佳CPU缓存配置。

桑切斯说:“如果交由软件管理,那么就必须要注意开销了。”他说设计不当的缓存管理系统可能会将缓存缩小到最佳规模,每秒重复多次,但这样会给CPU造成负担。需要大量CPU时间的CPU效率算法的意义何在?他说:“精确解非常昂贵。所以我们必须找到一个快速完成工作的方法,以保证开销不会超过收益。”

总部位于加利福尼亚山景城的半导体咨询公司林利集团的林利•格温耐普(Linley Gwennap)说,他对Jigsaw印象深刻,但要注意晶圆厂还未完全作好准备。“一般来说,问题是,在一种处理器上奏效的方案,在另一种具有不同硬件设计的处理器上可能不起作用。”他说道,“处理器一有变化,就不得不重新设计软件,客户们对此不太喜欢。”

桑切斯反驳说,软件应用和实用程序不会受到Jigsaw的影响。他说:“只有操作系统代码需要熟悉硬件知识,如缓存不同部分的拓扑结构。”

密歇根大学计算机科学助理教授杰森•玛尔斯(Jason Mars)说,作为概念验证手段,Jigsaw很有效,但他说芯片制造商在他们认为适当之处可能进行调整。

“这项工作的奇妙之处与软硬件之间的协同设计有关。”玛尔斯说,“以往的大部分工作都偏向一个方向。预期在硬件中完成的工作较多,相对灵活性较少。Jigsaw确实创建了一套涵盖了硬件和软件的全面体系。”

热门推荐

原文标题:缓存机:众核处理器要求软件具备灵活性,以最大限度地利用板载内存

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

FPGA成为数据中心发展的趋势及重要性

用AI防鲨鱼、用AI学写中国书法、用AI预测人类死亡时间、用AI审判罪犯……在人工智能方兴未艾的今天....

的头像 电子发烧友网工程师 发表于 06-18 07:16 140次 阅读
FPGA成为数据中心发展的趋势及重要性

闪存存储在企业中为何如此受到欢迎?

时至今日,貌似整个存储行业都在谈论全闪存存储,无论是厂商还是用户,但凡提到有关存储的相关话题,必须离....

的头像 存储界 发表于 06-17 15:34 40次 阅读
闪存存储在企业中为何如此受到欢迎?

这种可编程衰减器最高可支持8×8输入输出的矩阵结构

可编程衰减器位于基站和终端之间,通过对射频信号的衰减控制,实现对无线信号的模拟,从而实现对测试场景的....

发表于 06-17 14:02 32次 阅读
这种可编程衰减器最高可支持8×8输入输出的矩阵结构

最新的AMD的CPU路线图曝光,并确认了Zen 5的存在

HardOCP更新了一张最新的AMD的CPU路线图,主要涉及服务器芯片EPYC(霄龙)。

发表于 06-15 11:27 123次 阅读
最新的AMD的CPU路线图曝光,并确认了Zen 5的存在

英特尔首款独立显卡产品将于2020年到来

据外媒报道,英特尔CEO科再奇上周在分析师大会证实,将进军独立显示芯片(Discrete GPU)市....

的头像 芯智讯 发表于 06-15 10:48 524次 阅读
英特尔首款独立显卡产品将于2020年到来

i9 8950HK 是否能上4.8GHz?

8代酷睿游戏本最强的CPU是i9 8950HK,默认高频、不锁倍频、12MB 三级缓存都是她的旗舰特....

的头像 39度创意研究所 发表于 06-15 09:45 147次 阅读
i9 8950HK 是否能上4.8GHz?

如何使用RT-Thread MicroPython搭建一个Web服务器

在网页中展示加速度计和磁力计的例程中,下面的代码完成了这些数据的返回功能,可以参考 WebServe....

的头像 电子发烧友网 发表于 06-15 09:11 713次 阅读
如何使用RT-Thread MicroPython搭建一个Web服务器

请问如何在程序中启用CPU自检?

发表于 06-15 07:57 271次 阅读
请问如何在程序中启用CPU自检?

PCIe SSD推出了新的硬件形式:SFF-8639,又称U.2

目前有很多服务器厂商都发布了有很多U.2 SSD盘位的服务器,有的是少数U.2 SSD和多数SATA....

的头像 ssdfans 发表于 06-14 14:48 265次 阅读
PCIe SSD推出了新的硬件形式:SFF-8639,又称U.2

美光内存工厂故障产能下降,全球DRAM供不应求状况再次加深

据Digitimes报道,本来价格情况要转好,然而美光在台湾的子工厂(原瑞晶Rexchip)于3月2....

发表于 06-14 11:56 64次 阅读
美光内存工厂故障产能下降,全球DRAM供不应求状况再次加深

Linux内存配置:overcommit的设置

使用版本管理工具的工程师都熟悉commit的含义,就是向代码仓库提交自己更新的意思,对于这个场景,实....

的头像 Linuxer 发表于 06-14 11:45 150次 阅读
Linux内存配置:overcommit的设置

Rowhammer黑客技术现已可以远程突破Android手机,只需要2分钟就可以完全控制你的设备

在过去几年中,安全研究人员对一种名为Rowhammer的黑客技术并没有太过重视,该技术允许攻击者通过....

的头像 39度创意研究所 发表于 06-14 09:45 308次 阅读
Rowhammer黑客技术现已可以远程突破Android手机,只需要2分钟就可以完全控制你的设备

内存市场竞争激烈,NAND/DRAM降价将会非常缓慢

根据Gartner的报告显示,在过去的2017年中,三星已经成功取代英特尔,抢下了全球最大芯片制造....

发表于 06-14 09:36 63次 阅读
内存市场竞争激烈,NAND/DRAM降价将会非常缓慢

Skylaking服务器升级 支持Optane缓存和GPU

Hitachi Vantara利用Skylake处理器升级了更多服务器,并增加支持Optane SS....

的头像 存储界 发表于 06-14 09:13 142次 阅读
Skylaking服务器升级 支持Optane缓存和GPU

SDRAM模块功能的详细中文资料概述免费下载

SDRAM 与 Flash 不同,它不具有掉电保持数据的特性,但其存取速度大大高于 Flash 存储....

发表于 06-14 08:00 19次 阅读
SDRAM模块功能的详细中文资料概述免费下载

往CPU1TOCPU2RAM写一组数据,CPU2来读,请问如何来判断这一组数据读时已写完?

发表于 06-14 04:20 36次 阅读
往CPU1TOCPU2RAM写一组数据,CPU2来读,请问如何来判断这一组数据读时已写完?

2018年第一季度中国X86服务器出货量暴增,出货量为666,938台,同比增长32.6%

IDC认为, 搭载Intel最新Skylake CPU的X86架构已经获得众多互联网用户及传统企业用....

的头像 DIGITIMES 发表于 06-13 14:44 2816次 阅读
2018年第一季度中国X86服务器出货量暴增,出货量为666,938台,同比增长32.6%

科再奇:下半年,AMD将在服务器CPU市场从Intel手中直接挖走份额

在消费级桌面,AMD CPU预计年底前的份额可以摸到20%,未来几年将逐步增加。

发表于 06-13 11:38 68次 阅读
科再奇:下半年,AMD将在服务器CPU市场从Intel手中直接挖走份额

“顶点”使用了4608个计算服务器 2021年左右将有E级机问世

美国能源部下属橡树岭国家实验室6月8日正式宣布,已研发出被命名为“顶点”的超级计算机。

的头像 人工智能学家 发表于 06-13 09:41 275次 阅读
“顶点”使用了4608个计算服务器 2021年左右将有E级机问世

怎样让手机电量续航,减少CPU功耗和发热的方法议论

智能手机在生活中的作用越来越大,用户对性能的要求也自然水涨船高,但智能手机与传统的PC最大的区别就是....

发表于 06-13 09:40 94次 阅读
怎样让手机电量续航,减少CPU功耗和发热的方法议论

请问EpwmXBar 只能在CPU1里配置吗?

发表于 06-13 09:06 23次 阅读
请问EpwmXBar 只能在CPU1里配置吗?

请问内存不够,应该怎么修改?

发表于 06-13 02:12 20次 阅读
请问内存不够,应该怎么修改?

请问如何配置,才能使一个子函数既能被主cpu调用,又能被cla 调用?

发表于 06-13 01:14 32次 阅读
请问如何配置,才能使一个子函数既能被主cpu调用,又能被cla 调用?

“内核战争”爆发 英特尔与AMD互怼

自从AMD在2017年发布Ryzen处理器系列以来,英特尔和AMD似乎始终处于“内核战争”之中。显然....

的头像 芯资本 发表于 06-12 17:11 751次 阅读
“内核战争”爆发 英特尔与AMD互怼

不科学的iOS12 苹果如何让它在iPhone上跑得更快

事实证明,苹果确实在 iOS 12的优化上下了很大的工夫,在提升性能和速度的同时、也减少了内存的消耗....

的头像 iPhone频道 发表于 06-12 15:59 1342次 阅读
不科学的iOS12 苹果如何让它在iPhone上跑得更快

ETA3451高频同步降压变换器的详细英文数据手册

ETA3451是一种新型的高频同步降压变换器,它结合了电压模式控制和恒时间控制的优点。它的自适应常数....

发表于 06-12 08:00 27次 阅读
ETA3451高频同步降压变换器的详细英文数据手册

SKW92A 2X2 MIMO无线局域网模块的详细数据说明的资料概述

SKW92A模块包括802.11n MAC和基带、2.4GHz无线电和FEM、580MHz MIPS....

发表于 06-12 08:00 18次 阅读
SKW92A 2X2 MIMO无线局域网模块的详细数据说明的资料概述

AMD在CPU和GPU领域双管齐下,直接向死对头Intel和NVIDIA开火

虽然说AMD和NVIDIA两家公司生产的显卡在挖矿热潮下都不愁卖,但是两家企业在GPU方面的竞争也是....

的头像 芯师爷 发表于 06-11 14:56 1254次 阅读
AMD在CPU和GPU领域双管齐下,直接向死对头Intel和NVIDIA开火

Prowli恶意软件感染了9000多家公司网络上逾4万台服务器和设备

以色列网络安全公司 GuardiCore 的安全团队发现,网络犯罪分子设法组建了一个庞大僵尸网络“P....

的头像 E安全 发表于 06-11 09:44 361次 阅读
Prowli恶意软件感染了9000多家公司网络上逾4万台服务器和设备

当把8086、i7-8086K两颗相距40年的CPU放在一起时,画面美哭

1978年6月8日,Intel发布第一款16位处理器、第一款x86架构处理器8086,制造工艺为3.....

发表于 06-11 09:37 180次 阅读
当把8086、i7-8086K两颗相距40年的CPU放在一起时,画面美哭

STM32中DMA模块的使用

DMA_Mode_Normal,正常模式,当一次DMA数据传输完后,停止DMA传送,对于上例而言,就....

的头像 21ic电子网 发表于 06-11 08:49 357次 阅读
STM32中DMA模块的使用

Arm宣布推出全新的高端客户解决方案

Arm近日宣布推出全新的高端客户解决方案套件,包含了Arm计算和多媒体IP,不仅能够为智能手机领域的....

的头像 TechSugar 发表于 06-10 09:50 751次 阅读
Arm宣布推出全新的高端客户解决方案

AMD表示二代‘线程撕裂者’处理器的具体发售时间在今年的8月

目前在国内售卖的MateBook D是15.6寸,配置是8代酷睿i5+MX 150独显,所以价格方面....

的头像 科技美学 发表于 06-08 16:26 2217次 阅读
AMD表示二代‘线程撕裂者’处理器的具体发售时间在今年的8月

阿里巴巴发布“绿色科技报告”

阿里巴巴首次对外发布“绿色科技报告”,揭秘数据中心大脑、液冷服务器、自然风冷、智能物流等多项节能科技....

的头像 人工智能 发表于 06-08 14:41 458次 阅读
阿里巴巴发布“绿色科技报告”

存储芯片行业何时会用上EUV工艺?

美光CEO Sanjay Mehrotra日前在参加伯恩斯坦年度战略决策会上回答了有关的工艺问题,....

的头像 ICChina 发表于 06-08 14:29 419次 阅读
存储芯片行业何时会用上EUV工艺?

以色列知名家谱网站服务遭遇网络安全事件,导致9200多名用户的账户数据泄露

尽管双因素验证非常普遍,但 MyHeritage 公司尚未这样进行保护,此次事件后该公司做出承诺将会....

的头像 E安全 发表于 06-08 14:18 409次 阅读
以色列知名家谱网站服务遭遇网络安全事件,导致9200多名用户的账户数据泄露

KV-7500的介绍和KV-7500编程及记录功能的详细资料概述

KV-7500 是可编程控制器,简称“PLC”。PLC 在内部配备有微型计算机(CPU:中央运算装置....

发表于 06-08 08:00 81次 阅读
KV-7500的介绍和KV-7500编程及记录功能的详细资料概述

Intel发布28核处理器,为解决散热问题竟用上一台Hailea HC-1000B压缩机

AMD今天发布了32核64线程的第二代Threadripper处理器,Q3季度上市,不论核心数还是进....

发表于 06-07 14:59 608次 阅读
Intel发布28核处理器,为解决散热问题竟用上一台Hailea HC-1000B压缩机

声卡是怎么工作的?

说到声卡,应该90后的朋友大多都不会有深入的了解,也许概念就只停留在知道它是让电脑发出声音的一个部分....

的头像 MIX音频汇 发表于 06-07 14:46 393次 阅读
声卡是怎么工作的?

下代 PS5 主机将使用 AMD 的 Ryzen 处理器?

在 AMD Ryzen 处理器还没发布前,AMD 是以半客制化处理器业务,尤其以 Sony、微软的游....

的头像 39度创意研究所 发表于 06-07 14:46 314次 阅读
下代 PS5 主机将使用 AMD 的 Ryzen 处理器?

一项名为“GPU Turbo”的革命性图形处理加速技术

据介绍,该技术借鉴汽车领域涡轮增压的核心技术原理,对系统底层传统的图形处理框架进行重构,从而打通软硬....

的头像 华为EMUI 发表于 06-07 14:30 1957次 阅读
一项名为“GPU Turbo”的革命性图形处理加速技术

紫光展锐是中国芯片行业的领导者之一,肩负着振兴中国芯片产业的重大使命

紫光展锐高级副总裁John Rowland 先生表示:“作为中国本土的芯片公司,我们正在朝着世界顶级....

的头像 罗德与施瓦茨资讯 发表于 06-07 11:30 1042次 阅读
紫光展锐是中国芯片行业的领导者之一,肩负着振兴中国芯片产业的重大使命

中国芯硅谷——IC PARK

6月30日,IC PARK正式交付,中国“芯硅谷”呼之欲出,在IC行业同样是一件大事。北京兆芯、兆易....

的头像 中关村集成电路设计园 发表于 06-07 09:23 420次 阅读
中国芯硅谷——IC PARK

7个让你电脑降温加速的小技巧

电脑作为一种无论前台还是后台都能够运行程序的计算设备,只要启动应用不关闭,它们还是会缓缓的消耗系统 ....

的头像 科技美学 发表于 06-06 17:13 697次 阅读
7个让你电脑降温加速的小技巧

ARM新核心性能大幅提升,新核心或有助于ARM阵营攻击Intel

在服务器芯片市场,ARM阵营取得的成果较为有限,多个开发ARM服务器芯片的企业均已受挫,高通原本计划....

的头像 柏颖漫谈 发表于 06-05 15:29 386次 阅读
ARM新核心性能大幅提升,新核心或有助于ARM阵营攻击Intel

韩国业界正努力朝向存储器中心的运算迈进

全球服务器大厂慧与科技也携手三星、SK海力士、美光(Micron)、超微(AMD)、安谋(ARM)及....

的头像 DIGITIMES 发表于 06-05 15:14 461次 阅读
韩国业界正努力朝向存储器中心的运算迈进

负载均衡是怎么工作的?

由于DNS这个分层的系统中有缓存,用户端的机器也有缓存,如果某个机器出故障,域名解析仍然会返回那个出....

的头像 Linuxer 发表于 06-05 14:41 258次 阅读
负载均衡是怎么工作的?

自主CPU生态好不好应当具体情况具体分析

中国国家超级计算无锡中心副主任、清华大学副教授付昊桓介绍,新加坡国家超算中心在2016年参观完之后,....

的头像 科工力量 发表于 06-05 14:25 456次 阅读
自主CPU生态好不好应当具体情况具体分析

ARM推出的Cortex-A76被描述为一种“完全从零打造的全新架构”,到底有多厉害?

一提到当前的旗舰手机处理器,大家首先都会想到高通骁龙、三星Exynos、华为海思——不过,如果你对相....

发表于 06-05 09:20 313次 阅读
ARM推出的Cortex-A76被描述为一种“完全从零打造的全新架构”,到底有多厉害?

Intel核显开始发力,不比独显差多少

Intel靠着买CPU送GPU变身全球第一大GPU厂商,70%的份额比AMD、NVIDIA两家加起来....

发表于 06-05 08:17 167次 阅读
Intel核显开始发力,不比独显差多少

关于高并发和秒杀系统基本的概念的建立

拒绝假的分布式尤其重要,比如:前端服务器是可以独立存在的,但是都依赖集中的一个数据库或者缓存系统,那....

的头像 C语言专家集中营 发表于 06-04 17:10 215次 阅读
关于高并发和秒杀系统基本的概念的建立

中国服务器CPU的现状,Arm架构服务器CPU的启动

作为一家商业公司,Arm对中国的市场规模和地位也是不容忽视的。相反,为了进一步扩大用户群,吸引和鼓励....

的头像 嵌入式资讯精选 发表于 06-04 14:36 843次 阅读
中国服务器CPU的现状,Arm架构服务器CPU的启动

Arm即将于6月下旬左右在北京发布全新的CPU内核Cortex-A76

去年12月5日,高通在夏威夷举行了2017年度骁龙技术峰会。高通不仅公布了新的骁龙845平台,还联合....

的头像 芯智讯 发表于 06-04 14:25 1073次 阅读
Arm即将于6月下旬左右在北京发布全新的CPU内核Cortex-A76

手机cpu和电脑cpu的性能比较_影响CPU性能的因素盘点

本文首先介绍了手机cpu和电脑cpu的性能比较,其次介绍了影响cpu的性能因素有哪些,具体的跟随小编....

发表于 06-04 11:14 330次 阅读
手机cpu和电脑cpu的性能比较_影响CPU性能的因素盘点

外部用的是sp_336e串口三合一芯片,CPU出去的只是TTL电平,至于转成232还是485和内核本身没有什么关系?

发表于 06-04 11:00 85次 阅读
外部用的是sp_336e串口三合一芯片,CPU出去的只是TTL电平,至于转成232还是485和内核本身没有什么关系?

手机cpu型号比较_如何判断手机CPU的好坏

如今的社会高速发展,人们秀玉 高科 技的需求量越来越大,对于高科技的技术要求也越来越高。因此,手机市....

发表于 06-04 10:59 244次 阅读
手机cpu型号比较_如何判断手机CPU的好坏

可以使用TPS65217A芯片供电ZCZ封装的CPU吗?如何选择AM335X电源管理芯片?

发表于 06-04 06:51 140次 阅读
可以使用TPS65217A芯片供电ZCZ封装的CPU吗?如何选择AM335X电源管理芯片?

请问AM3354驱动加载时卡住,偶尔系统崩溃是什么原因?SmartReflex 这个技术难度是有bug?还是说cpu间存在体制差异?

发表于 06-04 03:43 132次 阅读
请问AM3354驱动加载时卡住,偶尔系统崩溃是什么原因?SmartReflex 这个技术难度是有bug?还是说cpu间存在体制差异?

怎么搭建MQTT服务器?

发表于 06-01 15:04 199次 阅读
怎么搭建MQTT服务器?

ccs5与HVmtrpfckit目标板的连接仿真问题,程序无法运行,也无法用DEBUG和下载程序,请问这是什么原因?

发表于 05-31 09:41 172次 阅读
ccs5与HVmtrpfckit目标板的连接仿真问题,程序无法运行,也无法用DEBUG和下载程序,请问这是什么原因?