【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

CPU和GPU的简介和差别

传感器技术 2018-04-06 12:08 次阅读

NVIDIA 近日宣布,NVIDIA® Tesla® AI 超级计算机平台将为最新一期的全球最节能高性能计算 (HPC) 系统 Green500 榜单中排名前 13 的系统提供动力支持。所有这 13 台计算机均使用 NVIDIA Tesla P100 数据中心 GPU 加速器,其中便包括基于 NVIDIA DGX-1™ AI 超级计算机的四个系统。

NVIDIA还公布一些性能数据,这些数据表明,相比两年前发布的 Kepler 架构,NVIDIA Tesla GPU 已将 HPC 应用程序的性能提升 3 倍之多。这大大超越摩尔定律对于性能提升的预测,甚至在其近些年开始减速之前便已如此。

CPU和GPU的简介和差别

很多人有这样的疑问,现在像挖矿、破解密码甚至超级计算等领域,越来越多地需要用的是 GPU 而不是 CPU,是不是CPU被GPU取代的一天就要到来了?

CPU和GPU简介

什么是CPU

中央处理器(英文Central Processing Unit,CPU)是一台计算机的运算核心和控制核心。CPU、内部存储器和输入/输出设备是电子计算机三大核心部件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU由运算器、控制器和寄存器及实现它们之间联系的数据、控制及状态的总线构成。差不多所有的CPU的运作原理可分为四个阶段:提取(Fetch)、解码(Decode)、执行(Execute)和写回(Writeback)。 CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码,并执行指令。所谓的计算机的可编程性主要是指对CPU的编程。

CPU和GPU的简介和差别

CPU的功能

计算机求解问题是通过执行程序来实现的。程序是由指令构成的序列,执行程序就是按指令序列逐条执行指令。一旦把程序装入主存储器(简称主存)中,就可以由CPU自动完成从主存取指令和执行指令的任务。

CPU具有以下4个方面的基本功能:

1、指令顺序控制

这是指控制程序中指令的执行顺序。程序中的各指令之间是有严格顺序的,必须严格按

程序规定的顺序执行,才能保证计算机工作的正确性。

2、操作控制

一条指令的功能往往是由计算机中的部件执行一序列的操作来实现的。CPU要根据指令的功能,产生相应的操作控制信号,发给相应的部件,从而控制这些部件按指令的要求进行动作。

3、时间控制

时间控制就是对各种操作实施时间上的定时。在一条指令的执行过程中,在什么时间做什么操作均应受到严格的控制。只有这样,计算机才能有条不紊地自动工作。

4、数据加工

即对数据进行算术运算和逻辑运算,或进行其他的信息处理。CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码。它把指令分解成一系列的微操作,然后发出各种控制命令,执行微操作系列,从而完成一条指令的执行。指令是计算机规定执行操作的类型和操作数的基本命令。指令是由一个字节或者多个字节组成,其中包括操作码字段、一个或多个有关操作数地址的字段以及一些表征机器状态的状态字以及特征码。有的指令中也直接包含操作数本身。

什么是GPU

(Graphic Processing Unit)图形处理芯片。是显示卡的“心脏”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。现在市场上的显卡大多采用nVIDIA和ATI两家公司的图形处理芯片。

CPU和GPU的简介和差别

今天,GPU已经不再局限于3D图形处理了,GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性能,如此强悍的“新星”难免会让CPU厂商老大英特尔为未来而紧张, NVIDIA和英特尔也经常为CPU和GPU谁更重要而展开口水战。

GPU通用计算方面的标准目前有 OPEN CL、CUDA、ATI STREAM。其中,OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景,AMD-ATI、NVIDIA现在的产品都支持OPEN CL。

1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年 4月 ATi发布了 Mach32 图形卡集成了图形加速功能,1998年 4月 ATi被IDC评选为图形芯片工业的市场领导者,但那时候这种芯片还没有GPU的称号,很长的一段时间ATI都是把图形处理器称为VPU,直到AMD收购ATI之后其图形芯片才正式采用GPU的名字。NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU的概念。从此NV显卡的芯就用这个新名字GPU来称呼。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。

CPU与GPU的区别

CPU和GPU大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。

于是CPU和GPU就呈现出非常不同的架构(示意图):

CPU和GPU的简介和差别

图片来自nVidia CUDA文档。其中绿色的是计算单元,橙红色的是存储单元,橙黄色的是控制单元。

GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是CPU很小的一部分

CPU和GPU的简介和差别

从上图可以看出:Registers: GPU > CPU 多寄存器可以支持非常多的Thread,thread需要用到register,thread数目大,register也必须得跟着很大才行。

SIMD Unit(单指令多数据流,以同步方式,在同一时间内执行同一条指令): GPU > CPU。

CPU 基于低延时的设计:

CPU和GPU的简介和差别

CPU有强大的ALU(算术运算单元),它可以在很少的时钟周期内完成算术计算。

当今的CPU可以达到64bit 双精度。执行双精度浮点源算的加法和乘法只需要1~3个时钟周期。

CPU的时钟周期的频率是非常高的,达到1.532~3gigahertz(千兆HZ, 10的9次方)。大的缓存也可以降低延时。保存很多的数据放在缓存里面,当需要访问的这些数据,只要在之前访问过的,如今直接在缓存里面取即可。

复杂的逻辑控制单元。当程序含有多个分支的时候,它通过提供分支预测的能力来降低延时。

数据转发。 当一些指令依赖前面的指令结果时,数据转发的逻辑控制单元决定这些指令在pipeline中的位置并且尽可能快的转发一个指令的结果给后续的指令。这些动作需要很多的对比电路单元和转发电路单元。

GPU是基于大的吞吐量设计:

CPU和GPU的简介和差别

GPU的特点是有很多的ALU和很少的cache. 缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。

GPU的控制单元(左边黄色区域块)可以把多个的访问合并成少的访问。

GPU的虽然有dram延时,却有非常多的ALU和非常多的thread. 为啦平衡内存延时的问题,我们可以中充分利用多的ALU的特性达到一个非常大的吞吐量的效果。尽可能多的分配多的Threads.通常来看GPU ALU会有非常重的pipeline就是因为这样。

所以与CPU擅长逻辑控制,串行的运算。和通用类型数据运算不同,GPU擅长的是大规模并发计算,这也正是密码破解等所需要的。所以GPU除了图像处理,也越来越多的参与到计算当中来。

GPU的工作大部分就是这样,计算量大,但没什么技术含量,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已。而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?GPU就是这样,用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性,是互相独立的。很多涉及到大量计算的问题基本都有这种特性,比如你说的破解密码,挖矿和很多图形学的计算。这些计算可以分解为多个相同的简单小任务,每个任务就可以分给一个小学生去做。但还有一些任务涉及到“流”的问题。比如你去相亲,双方看着顺眼才能继续发展。总不能你这边还没见面呢,那边找人把证都给领了。这种比较复杂的问题都是CPU来做的。

总而言之,CPU和GPU因为最初用来处理的任务就不同,所以设计上有不小的区别。而某些任务和GPU最初用来解决的问题比较相似,所以用GPU来算了。GPU的运算速度取决于雇了多少小学生,CPU的运算速度取决于请了多么厉害的教授。教授处理复杂任务的能力是碾压小学生的,但是对于没那么复杂的任务,还是顶不住人多。当然现在的GPU也能做一些稍微复杂的工作了,相当于升级成初中生高中生的水平。但还需要CPU来把数据喂到嘴边才能开始干活,究竟还是靠CPU来管的。

就目前的计算机架构,GPU只能称作是小众

GPU作为后来者,出现的太晚了,计算机架构已经定型,不太可能撼动 Intel 的霸主地位,而且Intel 一定会借着先天优势打压其他竞争对手。

为什么GPU只能算作是小众。在计算机上运行的程序从性能的角度来说大致可分为三类:1、 I/O intensive;2、 Memory intensive 以及3、Compute-intensive。

1、I/O intensive的程序其性能瓶颈是I/O,也就是说程序运行的大部分时间花在了硬盘读写/网络通信上,而I/O处在计算机体系结构金字塔的最底层,速度非常慢。最近炒的很火的big data 讨论的就是这一类应用程序。几百TB 甚至到PB级别的数据往哪搁,只能放在硬盘上。一台机器容量太小CPU太少怎么办,搞几百台甚至上千台机器用网线连起来分布处理。所以这块全是I/O, 现在大的互联网公司不多搞几个上千节点的集群肯定撑不住。

2、Memory intensive的程序其性能瓶颈在内存访问,程序中有大量的随机访问内存的操作,但是基本没有I/O, 这类程序已经比第一类程序快一个数量级了,但是和寄存器的速度还是没法比。目前大部分应用程序都属于这类。个人电脑里装的的各种软件基本就是这类,如果有点I/O, 立刻就会非常得卡。

以上提到的这两类程序的应用最广泛,涵盖了大部分有用的计算机软件,但遗憾的是GPU在这两块毫无用处, GPU只有在计算密集型的程序有些作用。I/O是瓶颈的程序,花在计算的时间可以忽略不计,再怎么用GPU加速也没用。 含有大量内存随机访问的程序也不适合在GPU上执行,大量的随机访问甚至可以使GPU的行为由并行变为串行。

什么类型的程序适合在GPU上运行

1、计算密集型的程序

所谓计算密集型(Compute-intensive)的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。

2、易于并行的程序

GPU其实是一种SIMD(Single Instruction Multiple Data)架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。

GPU和 CPU  谁也替代不了谁

如果形象点理解,GPU就像一群蚂蚁,这些蚂蚁都做着同样的事,而CPU就像一只猴子,这只猴子做着各种不同的事。

CPU和GPU它们的目的不同,且有不同侧重点,也有着不同的性能特性,在某些工作中CPU执行得更快,另一工作中或许GPU能更好。

当你需要对大量数据做同样的事情时,GPU更合适,当你需要对同一数据做很多事情时,CPU正好。

可以预见在未来,随着CPU进一步强化处理数据块的能力,我们将看到CPU和GPU架构之间的融合,而且随着制造技术的进步和芯片的缩小,GPU也可以承担更复杂的指令。CPU与GPU间的分工虽然还是大有不同,但彼此间的交集无疑会更多。

原文标题:GPU这么牛掰!我们还需要CPU吗?

文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

如何正确区分和安装CPU

中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台....
的头像 发烧友学院 发表于 01-16 17:21 29次 阅读
如何正确区分和安装CPU

Keil实例教程之Keil工程文件的建立设置与目标文件的获得

单片机开发中除必要的硬件外,同样离不开软件,我们写的汇编语言源程序要变为CPU可以执行的机器码有两种....
发表于 01-16 11:43 12次 阅读
Keil实例教程之Keil工程文件的建立设置与目标文件的获得

GPU如何加快软件应用程序的运行速度

理解 GPU 和 CPU 之间区别的一种简单方式是比较它们如何处理任务。CPU 由专为顺序串行处理而....
的头像 电子发烧友网工程师 发表于 01-15 17:47 242次 阅读
GPU如何加快软件应用程序的运行速度

如何选择合适的单片机常用单片机介绍

单片微型计算机简称单片机,是典型的嵌入式微控制器,它不是完成某一个逻辑功能的芯片,而是把一个计算机系....
发表于 01-15 17:18 50次 阅读
如何选择合适的单片机常用单片机介绍

AMD的新款高端显卡Radeon VII,全球首个7纳米GPU售价699美元

Radeon VII 采用经过调整的 Vega 20 架构,它是 Vega 64 中 Vega 10....
的头像 电子发烧友网工程师 发表于 01-15 16:16 211次 阅读
AMD的新款高端显卡Radeon VII,全球首个7纳米GPU售价699美元

超微7纳米CPU、GPU大军后段封装订单由三强分食

熟悉委外封测代工(OSAT)业者透露,除了晶圆代工非台积电操刀莫属外,超微绝地反攻的7纳米CPU、G....
的头像 DIGITIMES 发表于 01-15 14:30 169次 阅读
超微7纳米CPU、GPU大军后段封装订单由三强分食

C6000的CPU执行指令是流水线方式的,不会产生冲突吗?

C6000的CPU执行指令是流水线方式的,每个时钟可以同时执行8个指令,这样一来,不会产生冲突吗? 比如第一条指令,赋值给一个...
发表于 01-15 10:27 77次 阅读
C6000的CPU执行指令是流水线方式的,不会产生冲突吗?

怎么生成任意,稳定的频率

这就是问题:我需要产生一个517 OCH 517kHz信号,正弦或平方。要做到这一点,最简单的方法就是用计时器来划分时钟。这需要零...
发表于 01-15 06:57 19次 阅读
怎么生成任意,稳定的频率

VS1003接功放噪声很大

CPU用STM32F103RC,驱动程序用原子哥的,功放用TI TPA3125 附原理图: ...
发表于 01-15 03:00 33次 阅读
VS1003接功放噪声很大

为什么除了CPU还需要显卡

为什么除了CPU还需要显卡?这个看情况而定。因为并不是所有cpu都需要显卡。部分cpu内集成显卡,由....
的头像 发烧友学院 发表于 01-14 15:01 112次 阅读
为什么除了CPU还需要显卡

请问C6678调试的最优建议的电脑配置如何?

我现在使用的HP电脑配置为 Intel i7-7700 CPU 3.60GHz,64位操作系统,8GB内存,在8核仿真模式下经常出现load .out文...
发表于 01-14 14:34 114次 阅读
请问C6678调试的最优建议的电脑配置如何?

AMD只用7nm的的中端样品就达成了媲美i9-9900K的多核性能

AMD本周在CES 2019上正是官宣了第三代Ryzen锐龙处理器,基于7nm Zen 2架构打造,....
发表于 01-14 10:42 117次 阅读
AMD只用7nm的的中端样品就达成了媲美i9-9900K的多核性能

Intel除了CPU还将进军其他领域

如果你还以为Intel的主业是CPU处理器,那就大错特错了,因为现在他们在这个领域投入的精力真的是越....
发表于 01-14 10:38 72次 阅读
Intel除了CPU还将进军其他领域

ARM和华为在1月初给我们带来哪些新品发布?

2019年注定是不平静的一年,科技届刚刚迎来CES2019的多家产品发布,但是没有在CES展上亮相的....
发表于 01-14 10:08 746次 阅读
ARM和华为在1月初给我们带来哪些新品发布?

QY-RK3288嵌入式主板硬件说明书中文版资料免费下载

启扬智能QY-RK3299主板硬件说明书,主板介绍了主板资源、硬件接口以及其功能、主板性能、尺寸结构....
发表于 01-14 08:00 19次 阅读
QY-RK3288嵌入式主板硬件说明书中文版资料免费下载

如何设计低功耗的单片机便携式系统详细设计方法说明

针对单片机便携式系统功耗要求低的特点,比较仝面的介绍了将单片机便携式系统如何设计成低功耗系统.主要从....
发表于 01-14 08:00 29次 阅读
如何设计低功耗的单片机便携式系统详细设计方法说明

苹果手机如何拆胶详细方法说明

苹果拆胶方法:1.用小嘴风枪200度加热IC边沿,用镊子(不能太尖)轻轻去掉黑胶,注意不要去掉小电阻....
发表于 01-14 08:00 36次 阅读
苹果手机如何拆胶详细方法说明

刷机报错代码参照表资料免费下载

本文档的主要内容详细介绍的是刷机报错代码参照表资料免费下载 刷到三分之一报错-1,基带电源供电输出....
发表于 01-14 08:00 23次 阅读
刷机报错代码参照表资料免费下载

嵌入式实时操作系统Percepio新版本有什么改动

Percepio赶在寒假之前发布了Tracealyzer 4.2.9,新版本有了一些改进,并对发现的....
的头像 嵌入式资讯精选 发表于 01-13 10:22 335次 阅读
嵌入式实时操作系统Percepio新版本有什么改动

给电脑配风扇时要注意什么

在安装CPU散热器时,需要注意防止“假安装”现象的现出。“假安装”即看上去是安好,但实际上CPU的表....
的头像 发烧友学院 发表于 01-12 11:22 291次 阅读
给电脑配风扇时要注意什么

AMD发布全球第一款基于7nm工艺GPU核心的游戏显卡

CES 2019展会上,AMD CEO苏姿丰博士受邀发表主题演讲,不负众望放出重磅大招:全球第一款基....
发表于 01-12 11:09 141次 阅读
AMD发布全球第一款基于7nm工艺GPU核心的游戏显卡

群雄角逐5G基带芯片市场

随着5G网络的即将商用,手机芯片厂商纷纷抢先推出了自家的5G芯片。手机芯片可以分为射频芯片、基带调制....
的头像 电子工程技术 发表于 01-11 10:09 770次 阅读
群雄角逐5G基带芯片市场

AMD发布全球首款7纳米GPU,高端游戏市场狙击英伟达

这个消息看起来很有意思,其实从技术上讲,AMD并没有发布任何新的GPU,(新显卡仍然沿用与上一代旗舰....
的头像 新智元 发表于 01-11 09:04 378次 阅读
AMD发布全球首款7纳米GPU,高端游戏市场狙击英伟达

i.MX6Q处理器上电后CPU不起来

上电后CPU不起来,测量了CPU的供电正常,还有什么原因引起CPU不能正常工作???麻烦大神给一波解答。...
发表于 01-10 16:17 166次 阅读
i.MX6Q处理器上电后CPU不起来

英特尔的10nm芯片终于挤出来了

在CES主题演讲中,英特尔的Gregory Bryant展示了该公司的“首批10nmSoC”,这是一....
的头像 中国半导体论坛 发表于 01-10 15:55 683次 阅读
英特尔的10nm芯片终于挤出来了

请问EDMA3能访问全部8G DDR3空间吗?

6678手册上说能支持最大8G空间,设置XMPAXL1切换,cpu能够访问其余DDR3空间, 但是使用EDMA读写,不论和空间怎么...
发表于 01-10 11:34 113次 阅读
请问EDMA3能访问全部8G DDR3空间吗?

性能10倍于GPU:英特尔推出全新Nervana AI处理器

当地时间1月7日,英特尔在CES2019展会上发布了Nervana系列神经网络处理器的最新型号NNP....
发表于 01-10 10:16 246次 阅读
性能10倍于GPU:英特尔推出全新Nervana AI处理器

为什么GPU在各个企业的服务器中随处可见

选择NVIDIA vGPU解决方案为AI、富媒体、混合云和其他应用程序带来操作、成本和生产效率优势。
的头像 英伟达NVIDIA企业解决方案 发表于 01-09 16:47 384次 阅读
为什么GPU在各个企业的服务器中随处可见

请问raw os究竟可以多小?可以多快?

由于raw os 针对市场是目前中低端的cpu,所谓的中低端cpu 一般以arm 9 划分,arm9 级别的或者类似速度的cpu 为中端cpu, 以上的比如...
发表于 01-09 16:13 59次 阅读
请问raw os究竟可以多小?可以多快?

1ms定时器中断

嗨,我需要做一个打断,每一个女士都要使用一个32 MZ的V1.40xC32编译器,而HAMONY V2.03B是CPU负载中最简单的解决...
发表于 01-09 14:54 74次 阅读
1ms定时器中断

当嵌入式GPU邂逅人工智能 Imagination中国市场份额不断增加

2018年罗永浩的跨年演讲里面有这样一段话,“过去赶风口随大流的方法已经行不通了,人们必须学会用新的....
发表于 01-09 14:31 192次 阅读
当嵌入式GPU邂逅人工智能 Imagination中国市场份额不断增加

verilog代码编译错误

嗨, 我正在尝试为我的一个assignmnet编写一个简单的cpu电路的verilog代码。 我尝试过几个程序,但在尝试使用设计时遇到了编译...
发表于 01-09 10:33 43次 阅读
verilog代码编译错误

华为首款Arm架构服务器CPU鲲鹏920,业界最高性能Arm架构服务器CPU

TaiShan系列服务器主要面向大数据、分布式存储和ARM原生应用等场景,发挥ARM架构在多核、高能....
的头像 芯智讯 发表于 01-09 09:39 692次 阅读
华为首款Arm架构服务器CPU鲲鹏920,业界最高性能Arm架构服务器CPU

STM32L4开机不启动

大家好!我最近遇到一个奇怪现象。测试2块板子,出现了相同状态,没敢继续测了。 电路板已经测试过几个月,一直正常运行,这两天...
发表于 01-09 09:08 147次 阅读
STM32L4开机不启动

微机原理与接口技术教程之计算机基本知识的详细资料概述

本文档的主要内容详细介绍的是微机原理与接口教程之计算机基本知识的详细资料概述主要内容包括了:计算机的....
发表于 01-09 08:00 62次 阅读
微机原理与接口技术教程之计算机基本知识的详细资料概述

微机原理与接口技术教程之8086系统结构的资料概述

本文档的主要内容详细介绍的是微机原理与接口技术教程之8086系统结构的资料概述主要内容包括了:1.8....
发表于 01-09 08:00 34次 阅读
微机原理与接口技术教程之8086系统结构的资料概述

华为三星苹果高通的差异,买IP做集成不宜包装为掌握核心科技

事实上,作为老牌通信企业,在IC设计上,本身就有不少华为的强项,华为强势的领域是基带,在基带技术上,....
的头像 科工力量 发表于 01-08 17:24 919次 阅读
华为三星苹果高通的差异,买IP做集成不宜包装为掌握核心科技

英特尔CPU的历史

1968年,戈登·摩尔和罗伯特·诺伊斯在硅谷创办了英特尔公司。1969年,凭借首批106名员工,英特....
的头像 发烧友学院 发表于 01-08 16:11 509次 阅读
英特尔CPU的历史

GPU如何加速人工智能或机器学习的计算速度

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放....
的头像 Imagination Tech 发表于 01-08 15:01 373次 阅读
GPU如何加速人工智能或机器学习的计算速度

采用QT+OpenGL ES方案进行开发硬件平台

从特斯拉Model S问世,到最近的小鹏汽车G3的上市,在新能源汽车、智能互联网高速发展的背景下,越....
的头像 周立功单片机 发表于 01-08 13:43 1428次 阅读
采用QT+OpenGL ES方案进行开发硬件平台

正则表达式里很难发现的几大问题分析

我们可以看到所有的堆栈都指向了一个名为 validateUrl 的方法,这样的报错信息在堆栈中一共超....
发表于 01-07 17:19 154次 阅读
正则表达式里很难发现的几大问题分析

后摩尔定律时代 芯片发展新趋势

很长一段时间以来,摩尔定律和它的最终结局一直就像房间里的大象,不容忽视。英特尔联合创始人戈登·摩尔在....
的头像 人工智能学家 发表于 01-07 16:34 525次 阅读
后摩尔定律时代 芯片发展新趋势

从物连网到物联网 打造智慧平安的绿色新城

中国物联网产业规模和设备数量正处于高质量增长黄金期,物联网对数字经济、产业转型升级、节能减排、社会“....
的头像 司南物联 发表于 01-07 15:15 525次 阅读
从物连网到物联网 打造智慧平安的绿色新城

为什么说ADAS为商用车而生

2018年11月30日,在高工智能汽车开发者大会深圳站上,中天安驰CEO徐一新发表了《Smarter....
的头像 高工智能汽车 发表于 01-07 14:42 375次 阅读
为什么说ADAS为商用车而生

萨塞萨斯大学发明了世界上运行速度最快、最节能的小鼠大脑模拟器

此次的研究项目以 GeNN 软件为基础,在电脑上测试了两个已成体系的脑神经科学模型。其中的一个模型是....
的头像 芯论 发表于 01-07 14:28 414次 阅读
萨塞萨斯大学发明了世界上运行速度最快、最节能的小鼠大脑模拟器

高云半导体与荷兰Intrinsic ID展开合作,提供基于高云FPGA的BroadKey物联网安全方案

 BroadKey技术可为可编程FPGA芯片提供不可更改、不可克隆的器件识别解决方案,包括ARM和R....
的头像 人间烟火123 发表于 01-07 11:56 1898次 阅读
高云半导体与荷兰Intrinsic ID展开合作,提供基于高云FPGA的BroadKey物联网安全方案

51单片机寄存器功能汇总表

21个特殊功能寄存器(52系列是26个)不连续地分布在128个字节的SFR存储空间中,地址空间为80....
发表于 01-07 08:00 63次 阅读
51单片机寄存器功能汇总表

三星发布首款自动驾驶汽车芯片Exynos Auto V9,基于8nm工艺

专为高级信息娱乐系统而设计,允许在多个屏幕上显示内容,以获得更安全,更愉快的体验。
的头像 电子发烧友网工程师 发表于 01-05 10:43 637次 阅读
三星发布首款自动驾驶汽车芯片Exynos Auto V9,基于8nm工艺

如何解决PLCS7-200CPU输出模块烧坏的问题

在输出端24V电压上串入200V电压,使的于此输出模块相连的多个元件烧坏,此模块多个端子间短路.应该....
的头像 工控培训 发表于 01-05 10:19 481次 阅读
如何解决PLCS7-200CPU输出模块烧坏的问题

2019年的十大科技发展趋势AI芯片将挑战GPU

阿里达摩院官网公布2019十大科技趋势:AI仍是最火方向,其中,语音AI在特定领域有望通过图灵测试、....
的头像 ZEALER订阅号 发表于 01-05 10:00 793次 阅读
2019年的十大科技发展趋势AI芯片将挑战GPU

AI芯片什么是AI芯片的架构、分类及关键技术概述

人工智能芯片目前有两种发展路径:一种是延续传统计算架构,加速硬件计算能力,主要以 3 种类型的芯片为....
的头像 芯论 发表于 01-05 09:15 604次 阅读
AI芯片什么是AI芯片的架构、分类及关键技术概述

AI专用芯片将挑战GPU的绝对统治地位

昨日,阿里达摩院发布2019十大科技趋势,其中就指出:AI专用芯片将挑战GPU的绝对统治地位。当下数....
发表于 01-04 15:52 313次 阅读
AI专用芯片将挑战GPU的绝对统治地位

CES 2019即将启幕,NVIDIA三大亮点提前看

在CES 2019上,NVIDIA有哪些值得关注的亮点呢?NVIDIA创始人兼首席执行官黄仁勋先生将....
发表于 01-04 11:20 382次 阅读
CES 2019即将启幕,NVIDIA三大亮点提前看

NVIDIA虚拟GPU技术为学生和患者带来福音

Touro牙科医学院借助Quadro虚拟数据中心工作站技术为学生和患者带来福音。
的头像 英伟达NVIDIA企业解决方案 发表于 01-04 09:52 384次 阅读
NVIDIA虚拟GPU技术为学生和患者带来福音

IT从业者应该知道的CPU Cache相关的知识

随着工艺的提升最近几十年CPU的频率不断提升,而受制于制造工艺和成本限制,目前计算机的内存主要是DR....
的头像 Linuxer 发表于 01-04 09:30 365次 阅读
IT从业者应该知道的CPU Cache相关的知识

剖析AI芯片的架构、分类及关键技术

人工智能芯片目前有两种发展路径:一种是延续传统计算架构,加速硬件计算能力,主要以 3 种类型的芯片为....
的头像 嵌入式资讯精选 发表于 01-04 08:40 391次 阅读
剖析AI芯片的架构、分类及关键技术

单片机应用系统的结构及工作原理

将CPU、存储器和输入/输出接口等制作在一块集成电路中就构成了单片机,但单独一块单片机集成电路时无法....
发表于 01-03 15:58 224次 阅读
单片机应用系统的结构及工作原理

8块2080ti主机炫到没朋友

为了等新一代图灵显卡上市,我的新电脑配件搁置了一个月。现在终于可以将新显卡公之于众了,我就赶紧抄起家....
的头像 发烧友学院 发表于 01-02 16:30 469次 阅读
8块2080ti主机炫到没朋友

TMS320VC5501 定点数字信号处理器

TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
发表于 10-09 14:55 43次 阅读
TMS320VC5501 定点数字信号处理器