侵权投诉

CPU一级缓存与二级缓存深度分析

Imagination Tech 2018-04-16 10:52 次阅读

CPU缓存:通过优化的的读取机制,可以使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。

总的来说,CPU读取数据的顺序是先缓存后内存。

CPU内核集成的缓存称为一级缓存(L1 cache),而外部的称为二级缓存(L2 Cache);后来随着生产技术的不断提高,最终二级缓存也被挪进了CPU当中。通常一级缓存中还分数据缓存(Data Cache, D-Cache)和指令缓存(Instruction Cache, I-Cache)。二者分别用来存放数据和执行这些数据的指令,而且两者可以同时被CPU访问,减少了争用Cache所造成的冲突,提高了CPU效能。

CPU的一级缓存通常都是静态RAM,速度非常的快,但是静态RAM集成度低(存储相同的数据,静态RAM的体积是动态RAM的6倍),而且价格也相对较为昂贵(同容量的静态RAM是动态RAM的四倍)。

扩大静态RAM作为缓存是一个不太合算的做法,但是为了提高系统的性能和速度又必须要扩大缓存,这就有了一个折中的方法:在不扩大原来的静态RAM缓存容量的情况下,仅仅增加一些高速动态RAM做为L2级缓存。高速动态RAM速度要比常规动态RAM快,但比原来的静态RAM缓存慢,而且成本也较为适中。一级缓存和二级缓存中的内容都是内存中访问频率高的数据的复制品(映射),它们的存在都是为了减少高速CPU对慢速内存的访问。

二级缓存是CPU性能表现的关键之一,在CPU核心不变化的情况下,增加二级缓存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二级缓存上存在差异,由此可见二级缓存对CPU的重要性。

CPU在缓存中找到有用的数据被称为命中,当缓存中没有CPU所需的数据时(这时称为未命中),CPU才访问内存。从理论上讲,在一颗拥有二级缓存的CPU中,读取一级缓存的命中率为80%。也就是说CPU一级缓存中找到的有用数据占数据总量的80%,剩下的20%从二级缓存中读取。由于不能准确预测将要执行的数据,读取二级缓存的命中率也在80%左右(从二级缓存读到有用的数据占总数据的16%)。那么还有的数据就不得不从内存调用,但这已经是一个相当小的比例了。

目前的较高端CPU中,还会带有三级缓存,它是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率,从某种意义上说,预取效率的提高,大大降低了生产成本却提供了非常接近理想状态的性能。除非某天生产技术变得非常强,否则内存仍会存在,缓存的性能递增特性也仍会保留。

原文标题:讲一讲CPU的一级缓存与二级缓存

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

如何正确使用示波器的通道耦合方式选择交流?

通过示波器测试电源纹波时,只有采取正确的测量方法,才能得到准确的测量数值。如何正确使用示波器测试电源....
发表于 08-07 16:26 72次 阅读
如何正确使用示波器的通道耦合方式选择交流?

第三代锐龙桌面处理器采用7nm的Zen 2内核,CPU核心数量将提升至8个

Renoir的内核架构图早就放出来了,所以我们可以知道它有8个Zen 2核心,8MB L3缓存,核显....
发表于 08-07 15:49 25次 阅读
第三代锐龙桌面处理器采用7nm的Zen 2内核,CPU核心数量将提升至8个

英特尔技术专家推出从原型到生产加速智能边缘的解决方案

针对边缘计算中,不同应用场景对算力需求灵活,并且会使用不同神经网络模型的特点,英特尔AI计算盒参考设....
发表于 08-07 11:56 360次 阅读
英特尔技术专家推出从原型到生产加速智能边缘的解决方案

英特尔傲腾持久内存进一步加速AI与数据分析,加速推动产业智能化变革

除了CPU,英特尔还提供了GPU、FPGA、专用AI芯片等丰富的硬件产品,并与业界生态伙伴一起开发软....
发表于 08-07 11:47 534次 阅读
英特尔傲腾持久内存进一步加速AI与数据分析,加速推动产业智能化变革

AM600系列中型PLC的用户手册免费下载

AM600系列中型PLC属于汇川技术自主开发的首款中型PLC。凭借十余载的工控设备沉淀,打造出坚固可....
发表于 08-07 08:00 30次 阅读
AM600系列中型PLC的用户手册免费下载

mcu的应用场景_mcu的基本组成

工业控制应用中采用MCU时,系统性能改善和更加节能是两个主要好处。传统意义上,建立空调系统采用简单的....
发表于 08-06 10:58 72次 阅读
mcu的应用场景_mcu的基本组成

德国XMG公司称将在2020年第三季度面临AMD严重的CPU短缺

德国XMG公司表示,订购锐龙7 4800H级笔记本电脑的客户可以选择用锐龙5 4600G进行更换,并....
的头像 我快闭嘴 发表于 08-06 09:50 445次 阅读
德国XMG公司称将在2020年第三季度面临AMD严重的CPU短缺

AMD将正式推出全新的Zen 3架构的处理器

AMD的Zen架构CPU已经推出了有三代,包括Zen、Zen+以及Zen 2,而在今年年末,AMD也....
的头像 我快闭嘴 发表于 08-06 09:17 569次 阅读
AMD将正式推出全新的Zen 3架构的处理器

一体成型电感顺势登上了历史的舞台

一体成型电感又叫功率电感,它的出现归功于电脑主板技术的发展和电源技术的发展:CPU主频越来越高,因此....
的头像 韬略科技EMC 发表于 08-05 17:16 89次 阅读
一体成型电感顺势登上了历史的舞台

一个小型嵌入式操作系统设计:精髓都有了!

上面定义一个 32 位变量,每一位代表一个任务,0 表示挂起状态,1 表示就绪状态。它记录了各任务的....
的头像 电子工程技术 发表于 08-05 17:06 146次 阅读
一个小型嵌入式操作系统设计:精髓都有了!

为了满足远程协同应用日益增长的需求,浪潮极大地提升VDI性能

如何确保超聚合基础设施(HCI)在支持庞大的虚拟桌面负载的同时保障用户的使用体验,成为深信服重点关注....
发表于 08-05 16:33 227次 阅读
为了满足远程协同应用日益增长的需求,浪潮极大地提升VDI性能

中国如何发展自己的芯片 来看中国科学院大学一生一芯计划

一、酝酿 2018年11月8日,乌镇,世界互联网大会,经过9个月筹备工作,中国开发指令生态(RISC....
的头像 电子发烧友网 发表于 08-05 15:40 1498次 阅读
中国如何发展自己的芯片 来看中国科学院大学一生一芯计划

电子工程师成长之教训系列故事(上)终身受用的启发

勤奋真的很重要,特别是年轻人,不轻言放弃,遇事有钻研精神是技术上能有所成就的基本要求。只有亲身经历过....
的头像 电子发烧友网 发表于 08-05 14:52 180次 阅读
电子工程师成长之教训系列故事(上)终身受用的启发

芯片中可以有100多亿个晶体管,究竟是如何安上去的呢?

这是CPU的截面视图,可以清晰的看到层状的CPU结构,芯片内部采用的是层级排列方式,这个CPU大概是....
的头像 微波射频网 发表于 08-05 11:10 263次 阅读
芯片中可以有100多亿个晶体管,究竟是如何安上去的呢?

卡西欧CT一360电子琴原理及维修实例的详细资料说明

CT-360电子 琴 是 CT-350电 子 琴 的改 进型 . 它 保 留了 CT-350的 全 ....
发表于 08-05 08:00 133次 阅读
卡西欧CT一360电子琴原理及维修实例的详细资料说明

要弄懂多线程,这就要牵涉到多进程?

举个例子来说,在Linux上面每一个享有资源的个体称为task_struct,实际上和我们说的进程是....
的头像 玩转单片机 发表于 08-04 17:20 136次 阅读
要弄懂多线程,这就要牵涉到多进程?

将DSP的Flash里面的函数转移到RAM中

意思是到FLASH去下载InitFlash(),下载到SECURE_RAM,然后要到SECURE_R....
的头像 玩转单片机 发表于 08-04 17:10 122次 阅读
将DSP的Flash里面的函数转移到RAM中

4X4键盘控制的嵌入式软件开发实验报告详细说明

用户设计行列键盘接口, 一般常采用三种方法读取键值。一种是中断式, 另两种是扫描法和反转法。中断式在....
发表于 08-04 16:30 36次 阅读
4X4键盘控制的嵌入式软件开发实验报告详细说明

请问新手买那块RAM开发板好呢?

新手买那块RAM开发板好呢 谢谢
发表于 08-04 08:03 0次 阅读
请问新手买那块RAM开发板好呢?

存储技术的入门教程详细说明

 哈哈,没错,我们现在处于信息时代,每天都在和电脑、手机打交道。我们的工作和生活,已经完全离不开视频....
发表于 08-04 08:00 46次 阅读
存储技术的入门教程详细说明

使用FPGA实现CPU设计的毕业论文总结

从CPU的总体结构到局部功能的实现采用了自顶向下的设计方法和模块化的设计思想,利用Xilinx 公司....
发表于 08-03 17:58 73次 阅读
使用FPGA实现CPU设计的毕业论文总结

带你梳理一下操作系统中都出现过哪些算法

进程和线程在调度时候出现过很多算法,这些算法的设计背景是当一个计算机是多道程序设计系统时,会频繁的有....
的头像 算法与数据结构 发表于 08-03 16:55 157次 阅读
带你梳理一下操作系统中都出现过哪些算法

减少包头处理开销最直接的方法:减少数据包数量

增大Maximum Transmission Unit (MTU)。在数据量一定的情况下,使用大MT....
的头像 Linuxer 发表于 08-03 16:20 131次 阅读
减少包头处理开销最直接的方法:减少数据包数量

论Linux的页迁移(Page Migration)

其他的CoW的场景有KSM(Kernel same-page merging)。KSM会扫描多个进程....
的头像 Linuxer 发表于 08-03 15:52 180次 阅读
论Linux的页迁移(Page Migration)

华为华为硬件工程师手册最全版本电子教材免费下载

产品硬件项目的开发,首先是要明确硬件总体需求情况,如 CPU 处理能力、存储容量及速度,I/O 端口....
发表于 08-03 08:00 67次 阅读
华为华为硬件工程师手册最全版本电子教材免费下载

香橙派PC Plus电脑开发板获取CPU温度的三种方法

下文将给大家介绍在PC Plus获取CPU温度的三种方法:1、shell操作     先通过shell操作热身一下,登录系统之后使...
发表于 07-31 17:48 1819次 阅读
香橙派PC Plus电脑开发板获取CPU温度的三种方法

宁畅定制液冷方案让服务器倍享清凉

互联网的快速发展,使人们对网络、云端以及各类大数据处理诉求不断增加,随之而来的是对服务器产品性能的更....
的头像 西西 发表于 07-31 14:13 278次 阅读
宁畅定制液冷方案让服务器倍享清凉

使用GreenPAK进行温度到频率转换

通常,传感器将测得的物理值转换为模拟信号,温度传感器也不例外。而为了由CPU或计算机进行处理,必须将....
的头像 Dialog半导体公司 发表于 07-31 09:29 535次 阅读
使用GreenPAK进行温度到频率转换

请问如何解决CPU与EDMA读写EMIF总线冲突的问题?

各位大侠工程师你们好: 项目简单的介绍:         我使用的C6424采用EDMA 给EMIF-B...
发表于 07-30 17:10 0次 阅读
请问如何解决CPU与EDMA读写EMIF总线冲突的问题?

嵌入式微处理器的选择原则_嵌入式微处理器的特点

嵌入式微处理器是由通用计算机中的CPU演变而来的。它的特征是具有32位以上的处理器,具有较高的性能,....
发表于 07-30 15:24 108次 阅读
嵌入式微处理器的选择原则_嵌入式微处理器的特点

英特尔基于7nm的CPU产品将比他们计划的晚了大约半年

英特尔还指出:“主要驱动因素是英特尔7纳米工艺的产量,根据最新数据,现在该趋势要比该公司的内部目标低....
的头像 倩倩 发表于 07-29 16:08 450次 阅读
英特尔基于7nm的CPU产品将比他们计划的晚了大约半年

行业变局回望 英特尔暴跌16% 台积电涨9.4%

一场大变局正在半导体行业上演,英特尔暴跌16%,台积电涨9.4%,还有还有很大大手笔的收购,更有中芯....
发表于 07-29 11:51 354次 阅读
行业变局回望 英特尔暴跌16% 台积电涨9.4%

电脑新玩法:程序员用CPU烤肉 全新电脑被当废品捡走卖了3块

疫情逐步恢复后,互联网创业公司业务量猛增,很多程序员又开启了“996”模式。熬夜加班的日子难免枯燥,....
的头像 39度创意研究所 发表于 07-29 10:35 3192次 阅读
电脑新玩法:程序员用CPU烤肉 全新电脑被当废品捡走卖了3块

小米M2007J1SC手机已经以出色的成绩出现在AnTuTu基准测试中

M2007J1SC在AnTuTu的CPU和GPU测试中分别得分182,883和292,704。在内存....
的头像 倩倩 发表于 07-29 09:49 328次 阅读
小米M2007J1SC手机已经以出色的成绩出现在AnTuTu基准测试中

电脑打开网页很慢怎么办的解决办法

电脑配置太低是导致打开网页速度过慢的一个根本的原因。我们可以查看自己电脑配置来确定是否是因为配置过低....
的头像 倩倩 发表于 07-29 09:42 683次 阅读
电脑打开网页很慢怎么办的解决办法

单片机有哪些种类详细介绍

ATMEL公司的AVR单片机,是增强型RISC内载Flash的单片机,芯片上的Flash存储器附在用....
发表于 07-28 17:43 111次 阅读
单片机有哪些种类详细介绍

单片机有哪些种类详细介绍

ATMEL公司的AVR单片机,是增强型RISC内载Flash的单片机,芯片上的Flash存储器附在用....
发表于 07-28 17:43 79次 阅读
单片机有哪些种类详细介绍

英特尔宣布其7纳米CPU至少延迟了六个月

据英特尔称:“该公司基于7nm的CPU产品的时间相对于先前的预期大约偏移了六个月。主要驱动因素是英特....
的头像 倩倩 发表于 07-28 15:01 719次 阅读
英特尔宣布其7纳米CPU至少延迟了六个月

只读存储器和随机存储器的区别

只读存储器和随机存储器区别:作用不同、特点不同
发表于 07-27 15:09 57次 阅读
只读存储器和随机存储器的区别

NPU比普通的CPU有什么优势?

这些ASIC有一种特殊的架构设计,使它们能够更快地执行机器学习模型,而不是将数据卸载到服务器,然后等....
发表于 07-27 11:12 566次 阅读
NPU比普通的CPU有什么优势?

Zynq构建SoC系统深度学习教程之PL与CPU通过DDR3进行数据交互

 通过之前的学习,CPU可以读写DDR3了,PL端的Master IP也可以读写DDR3了,那二者就....
发表于 07-27 08:00 48次 阅读
Zynq构建SoC系统深度学习教程之PL与CPU通过DDR3进行数据交互

内存受限系统之软件开发PDF电子书免费下载

PDA软件市场不但巨大,而且持续成长。五年之内,全世界将有大量人口使用精明时髦,可上网的移动电话。每....
发表于 07-27 08:00 17次 阅读
内存受限系统之软件开发PDF电子书免费下载

麒麟990性能实测:CPU、GPU以及AI算力

 本次测试使用荣耀V30 PRO作为测试机器,同时加入了麒麟980、高通骁龙855 Plus、苹果A....
的头像 39度创意研究所 发表于 07-26 12:29 1599次 阅读
麒麟990性能实测:CPU、GPU以及AI算力

飞腾发布高可扩展芯片腾云S2500 开启多路服务新时代

作为芯片研发“国家队”的核心成员和新基建的重要力量,飞腾公司已经形成完整的多样化算力产品谱系,为从端....
发表于 07-26 11:59 586次 阅读
飞腾发布高可扩展芯片腾云S2500  开启多路服务新时代

F28x_usDelay 函数在FLAH里起动没问题,在RAM里不可以的原因?

我用TI这个工程:ti\controlSUITE\development_kits\TMDSIDDK_v2.0\IDDK_PM_Servo_F2837x_v2_00_00_00(...
发表于 07-25 09:09 0次 阅读
F28x_usDelay 函数在FLAH里起动没问题,在RAM里不可以的原因?

新基建推动国产CPU从跟跑到并跑,飞腾重磅发布腾云S2500

飞腾新一代高可扩展多路服务器芯片腾云S2500正式亮相,该款多路服务器芯片采用16纳米工艺,主频2.....
的头像 牵手一起梦 发表于 07-24 16:33 407次 阅读
新基建推动国产CPU从跟跑到并跑,飞腾重磅发布腾云S2500

如何看待TMS推出高利用率RamSan闪存阵列

许多竞争对手如Violin Memory之前曾批评TMS RamSan闪存SAN阵列不能提供企业运行....
发表于 07-24 15:13 90次 阅读
如何看待TMS推出高利用率RamSan闪存阵列

基于UC7420芯片实现大坝安全监测系统的设计

随着科学技术的发展,人们不断把目光投向水利综合自动化的实现,这一新课题已得到广泛的研究,少部分水库综....
发表于 07-24 14:35 119次 阅读
基于UC7420芯片实现大坝安全监测系统的设计

未来国产服务器CPU产业将如何发展?

那么,中国的服务器CPU产业目前的发展状况如何?从市场角度来看,随着大数据、云计算的快速发展,服务器....
的头像 我快闭嘴 发表于 07-24 14:28 1135次 阅读
未来国产服务器CPU产业将如何发展?

服务器的基本配置_服务器的配置怎么看

本文主要阐述了服务器的基本配置及服务器的配置的查看方法。
的头像 电子魔法师 发表于 07-24 10:16 601次 阅读
服务器的基本配置_服务器的配置怎么看

PlayStation 5游戏机的设计上,索尼选择了一些大胆的选择

对于控制台,这当然是不寻常的。例如,微软选择在其Xbox Series X上设置固定频率,并且最近就....
的头像 倩倩 发表于 07-23 16:48 533次 阅读
PlayStation 5游戏机的设计上,索尼选择了一些大胆的选择

基于可编程逻辑芯片和CPU实现数字锁相环频率合成器的设计

数字锁相环频率合成系统的工作原理是:锁相环对高稳定度的基准频率(通常由晶体振荡器直接或经分频后提供)....
发表于 07-23 16:47 206次 阅读
基于可编程逻辑芯片和CPU实现数字锁相环频率合成器的设计

新的泄漏可能为Pixel 4a提供更多有关5G的证据

它是G025E,这特别有趣,因为编号G025J,G025N和G025M是联邦通信委员会(FCC)批准....
的头像 倩倩 发表于 07-23 14:31 449次 阅读
新的泄漏可能为Pixel 4a提供更多有关5G的证据

2020年中国半导体产业发展趋势如何?

2019年,行业寒冬成为业界经常谈论的话题。根据WSTS的数据,2019年全球半导体产业市场增速从2....
的头像 我快闭嘴 发表于 07-23 09:59 2466次 阅读
2020年中国半导体产业发展趋势如何?

CPU如何通过PCI Express访问板上的系统?

你好, 我目前正在研究Kintex 7 KC705开发板上的项目。 我需要做的是通过使用电路板的PCI Express功能从Linux操作系统...
发表于 07-20 14:44 0次 阅读
CPU如何通过PCI Express访问板上的系统?

请问CPU不满载的时候晶体管在干什么?

在学习单片机的过程中,我们会在程序最后使用while(1),让单片机瞎跑。这时候单片机的CPU使用率是不是100%呢?   &...
发表于 07-19 08:07 0次 阅读
请问CPU不满载的时候晶体管在干什么?

分布式RAM和Block RAM之间究竟有什么区别?

您好! 分布式RAM和Block RAM之间究竟有什么区别? 两者都只是芯片内存,对吧? 但我不知道两者之间的区别。 和..下一...
发表于 07-19 06:37 0次 阅读
分布式RAM和Block RAM之间究竟有什么区别?

程序写入FLASH后不运行怎么办?

写了一个F2812的程序,在RAM里仿真都是好的,运行正常; 但是在烧入FLASH后,程序就不运行了(编译没有错误); 怀疑...
发表于 07-18 17:35 0次 阅读
程序写入FLASH后不运行怎么办?

SW1621主芯片设计案例解析

  1、 风道由下向上,为保证良好的通风、散热效果,布局时将PCIE卡槽与DIMM条平行放置;   对发热较大的芯片增加散...
发表于 07-16 11:40 101次 阅读
SW1621主芯片设计案例解析

VR单板设计案例分析

  1、 CPU和PMU放在表层,规划在一个屏蔽罩内;电池给PMU供电的模块放在底层,如图:      2、 根据芯片的出线...
发表于 07-16 11:34 101次 阅读
VR单板设计案例分析

TMS320VC5501 定点数字信号处理器

TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
发表于 10-09 14:55 249次 阅读
TMS320VC5501 定点数字信号处理器