随着智能手机平板电脑进入视网膜屏高清时代,GPU的重要性日益凸显,用户在使用这些电子设备时,首先关注的是高清视频、3D游戏以及flash动画的体验,而这些体验和GPU性能有直接联系,一款性能出色的GPU不但可以给用户以最佳体验,更兼顾低功耗特性,在CPU核战已无悬念的情况下,未来GPU将如何发展?近日,笔者采访了ARM公司媒体处理部门战略营销副总裁Kevin Smith,就ARM GPU未来发展进行了交流,归纳为ARM GPU的三个发展趋势。

Kevin Smith
趋势一:关注可扩展性,GPU核战爆发在即
在PC领域,曾经爆发过有关CPU与GPU谁更重要的口水大战,现在看来,两者都重要,因为它们架构不同、侧重不同,CPU和GPU都是具有高速运算能力的芯片,CPU更像“通才”——指令运算+数值运算,GPU更像“专才”——图形计算,不同类型的运算速度决定了它们的能力。因此CPU更擅长像操作系统、系统软件和通用应用程序这类拥有复杂指令调度、循环、分支、逻辑判断的程序任务,而GPU则擅长图形类和非图形类的高度并行数值计算。因此,在一部手机或者平板中,两者需要均衡搭配才能发挥出最大效能。
到目前为止,ARM共发布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五个系列的GPU,在MaliT600以后,ARM GPU在结构上发上了很大改变,以桌面应用看齐,在性能上有很大提升。

Mali400结构功能图

Mali-t604功能图
Kevin Smith介绍说实际上在发布T600系列时,ARM已经考虑到了与未来64位处理器的兼容问题,所以Mali-T600的第二代支持64位双精度,可以与ARM最新的A50系列64位处理器紧密关联。“另外,T600系列采用了这色器内核架构和三管道体系,更容易实现多核,这比其他架构GPU更有优势。” Kevin Smith强调。“未来ARM会重点优化T600系列产品,例如我们最新发布的T624\T628\T678就比T604在同等裸片面积性能提升 50%!”
他解释说性能的提升源自对架构的增强,例如这三款系列GPU可在同样的内核面积下提供更高的时钟频率、更高的IPC(每时钟周期指令数)、更高的能效,所以每个型号的性能都可以提升50%。
另外,这三款GPU也首次次支持ASTC(适应性可扩展纹理压缩):这是一种由ARM开发、Khronos Group已将其纳入OpenGL ES规范的纹理压缩技术,能在系统级别提高效率,并改进纹理质量和弹性,“而且,ARM GPU也是率先支持OpenGL ES 3.0版新标准的处理器。”他指出,“我们的GPU支持OpenGL Full Profile的GPU计算,不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,此外还支持Google RenderScript计算语言。实际上已经向桌面应用看齐。也向GPGPU更迈进了一步。当然,这也是增强兼容性的举措,我们的策略是就是支持公开的各类标准和API。”

Mali-T678功能框图
由于GPU的并行架构更适合实现多核,因此为未来多核GPU将是一大亮点,Kevin表示依托ARM的独特优势,未来不管是16核还是24核均可以轻易实现。

ARM GPU的,扩展性示意图
在我采访ImaginaTIon时,他们也勾勒了一幅未来处理器发展的蓝图,显然,多核GPU是亮点。

未来处理器发展的蓝图
那么2013年,主流的GPU产品将是多是核心?Kevin认为8核GPU会出现但将是高端市场,主流市场仍将是四核为主,不过他认为明年市场上GPU跨度较大,从单核到双核到四核到8核都有出现,满足市场从低到高的需求。
近日,谷歌Nexus 10平板电脑已经面市,该机采用一块10英寸屏幕,分辨率高达2560&TImes;1600像素,像素密度为300ppi,超过了iPad4和新 iPad,它采用了1.7GHz主频的三星Exynos 5250双核处理器,配备2GB RAM,集成Mali T604四核GPU,Kevin强调这样高端机型足以说明ARM GPU可以支持高端应用。
在GPU的发展策略上,Kevin介绍说ARM会坚持以较小的面积实现更高的性能,即坚持高能效的策略,同时,会考虑高性能方向,向桌面GPU看齐。
以下是各类GPU的功耗对比,可以看出,ARM GPU在单位功耗方面的性能突出,能达到每瓦48GFLOPS的特性,原高于桌面GPU的能效。


趋势二:关注一致性,与CPU融合
在PC处理器领域,AMD以融合CPU和GPU的APU开创了新的PC处理器领域,在移动处理器领域,这个趋势仍将延续,从近日 ImaginaTIon对MIPS的收购已经显现端倪。Kevin也认同这个趋势,“ARM的GPU不但注重图形处理更看重通用计算,未来CPU与GPU 要走融合的道路,所以ARM在布局GPU时就考虑与未来CPU的搭配,比如我们的GPU是支持64位处理器的,所以未来处理器升级到64位我们都可以支持。”他指出,“ARM考虑到是让用户用最快的方式实现低功耗高性能处理器,未来融合CPU与GPU的Soc内部会采用ARM的AMBA总线。”
实际上,在ARM的的Mali-T600 系列 GPU 内的有个作业管理器,它可以任务管理从 CPU 卸载到 GPU,并在活动着色器内核之间实现无缝负载平衡。这个功能估计已经为未来的CPU与GPU融合埋下了伏笔,通过 ARM 的一致性和互连技术,计算任务在异类系统中进行共享处理时,可以轻松跨越 CPU、GPU 和其他可用计算资源,更高效地访问数据。
他强调ARM GPU还关注通用计算,因此,未来也将压缩DSP市场,CEVA是否感受到了压力?
从支持64位处理里来看,未来采用融合CPU与GPU的处理器将是A50系列处理器,按照某些芯片厂商的估计,预计2014年此类芯片可以面市。
趋势三:工艺升级,2014年ARM处理器采用finFET技术?
很多人认为ARM处理器在传统工艺上的升级空间已经不大,在英特尔大张旗鼓地宣传3D晶体管技术的时候,ARM 其实也也已经开始了下一代工艺技术的研发,Kevin透露ARM的PIP(物理IP)部门早与TSMC以及Global Foundries合作开始了下一代工艺finFET晶体管工艺技术的研发,这是前所未有的,预计新的工艺技术将在TSMC的16nm工艺 和Global Foundries上的14nm上实现,而新工艺可能会用于ARM下一代64位处理器上。
在具体产品发展上,在ARM公布了最新的A50系列处理器后,已经有AMD、博通(Broadcom)、Calxeda、海思半导体、三星及意法半导体等七家公司获得A53与A57处理器授权,其中,STE声称将在2014年出货A53处理器,这是否意味着2014年ARM处理器将采用finFET 工艺技术?
在今年1月召开的2012国际电子器件会议(IEDM)上,TSMC已经展示有关finFET晶体管工艺技术,台积电将提供的16nm工艺金属布线部分直接沿袭20nm工艺,将晶体管部分换成16nm工艺的FinFET。与20nm工艺相比,可使晶体管的工作速度提高20%~25%,使耗电量降低 35%。由于金属布线部分在20nm工艺和16nm工艺间通用,因此两工艺的芯片面积相同。与intel的工艺不同,台积电的finFET晶体管掺入了锗材料。

TSMC展示有关finFET晶体管工艺技术
以下为采用主要GPU的处理器性能对比


相关推荐
本文主要介绍了电脑硬件基础篇gpu(gpu工作原理及作用_特性参数及型号和位置),图形处理器(英语:...
发表于 2018-04-10 11:42
•
12次阅读
ARM处理器对数据操作(读或写)支持三种数据长度:字节(8位)、半字(16位)、字(32位)。假设在...
发表于 2018-04-09 14:46
•
95次阅读
随着嵌入式相关技术的迅速发展, 嵌入式系统的功能越来越强大,应用接口更加丰富,根据实际应用的需要设计...
发表于 2018-04-09 13:38
•
12次阅读
近年来以微电子学和计算机技术为基础的信息技术飞速发展,超声无损检测仪器也得到了前所未有的发展动力,为...
发表于 2018-04-09 08:12
•
12次阅读
PowerVR Series9XE和 9XM GPU保持在填充率密度方面的领先地位,并提供显著的性能...
发表于 2018-04-09 07:19
•
15次阅读
8位的51单片机长期占据着微控制器(MCU)的主流市场,但随着技术与需求的发展,32位微控制器应用增...
发表于 2018-04-09 06:28
•
13次阅读
PetaLinux为Zynq应用开发提供了有力的助推,“读”懂了TA,就可让Zynq去应对更多应用场...
发表于 2018-04-08 14:41
•
587次阅读
众所周知,Arm是目前全球最大的移动IP提供商,全球绝大多数的智能手机都用采用Arm的Cortex系...
发表于 2018-04-08 14:16
•
475次阅读
“给XenServer安装补丁曾经是我们的噩梦,因为我们要花费一个月或停机几个小时才能完成。通过使用...
发表于 2018-04-08 14:13
•
112次阅读
由于具有得天独厚的技术和应用优势,英伟达和谷歌几乎占据了人工智能处理领域 80% 的市场份额,而且在...
发表于 2018-04-08 09:24
•
1319次阅读
当你需要对大量数据做同样的事情时,GPU更合适,当你需要对同一数据做很多事情时,CPU正好。
然而...
发表于 2018-04-08 08:51
•
43次阅读
FPGA并不是万能的。相对于串行结构处理器,其设计的灵活性是以工作量的增加为代价的。FPGA与ARM...
发表于 2018-04-08 08:27
•
95次阅读
首先,“嵌入式”这是个概念,准确的定义没有,各个书上都有各自的定义。
发表于 2018-04-07 12:38
•
654次阅读
苹果终于发布了全新的 iPad ,和去年的机型一样,新款的价格也是329美元,并且外观基本没有太大变...
发表于 2018-04-07 06:05
•
433次阅读
开始将堆栈指针设置在内部RAM,是因为不是每个板上都有外部RAM,而且外部RAM的大小也不相同,而且...
发表于 2018-04-06 19:46
•
279次阅读
什么是CPU
中央处理器(英文Central Processing Unit,CPU)是一台计...
发表于 2018-04-06 12:08
•
829次阅读
伺服压力机的基本结构及对控制系统的要求与传统压力机比较,伺服压力机取消了原有压力机的飞轮和离合器,保...
发表于 2018-04-06 08:07
•
297次阅读
三星16/32位ARM处理器S3C4510B是目前在国内应用非常广泛的一种性价比很高的ARM处理器,...
发表于 2018-04-05 11:44
•
33次阅读
ARM中异常中断的类型问题分析总结 一、ARM中异常中断的类型: 异常中断名称 含义 复位(Rese...
发表于 2018-04-05 10:51
•
46次阅读
最新的ARM Mali多媒体IP组合代表了ARM在分布式处理领域的扩展,确保以图形为主的内容与视频内...
发表于 2018-04-04 09:06
•
54次阅读
英特尔通过聘请业内最知名的AMD前GPU架构师Raja Koduri负责研发其独立GPU产品。
发表于 2018-04-04 08:52
•
1396次阅读
“ARM实在太贵了。”信息安全芯片公司Dover Microsystems联合创始人Jothy Ro...
发表于 2018-04-03 11:41
•
453次阅读
对于学硬件的人而言,必须先对硬件的基本使用方法有感性的认识,更必须深刻认识该硬件的控制方式.
发表于 2018-04-03 11:36
•
166次阅读
和前一代相比,Mali G72的能效比提高了25%,并且在许多地方都有所改进,比如图形保真、视网膜漏...
发表于 2018-04-03 10:38
•
201次阅读
英国半导体巨头ARM表示,新的Mali-G72图形处理器Cortex-A75和Cortex-A55处...
发表于 2018-04-03 10:06
•
205次阅读
作者:Benny Har-Even 去年Imagination推出了最新的图形架构Furian,自2...
发表于 2018-04-03 09:13
•
2015次阅读
CPU和GPU都属于冯·诺依曼结构,指令译码执行,共享内存。FPGA之所以比CPU、GPU更快,本质...
发表于 2018-04-02 17:52
•
455次阅读
一年一度的GTC至今已经迎来了第十个年头,虽然它每年或多或少的给网友一些“失望”,但它也终究是代表着...
发表于 2018-04-02 10:13
•
737次阅读
英伟达(Nvidia)在其年度GPU技术大会(GTC 2018)发表多项系统级升级功能,以提升其绘图...
发表于 2018-04-01 09:47
•
108次阅读
比特大陆开发的比特币ASIC芯片,挖矿效益远优于GPU,ASIC早已成了比特币的挖矿主流。在此之前,...
发表于 2018-04-01 09:17
•
321次阅读
由于图形和视频在常见生产力类应用中的使用大量增加,对于众多传统知识型岗位工作者来说,GPU已经成为其...
发表于 2018-04-01 08:49
•
2010次阅读
作为全球首个支持 Cat.18 下载速度的调制解调器,骁龙 X20 集成在骁龙845 芯片组中,提供...
发表于 2018-04-01 08:22
•
1349次阅读
ARM是一个32位RISC(精简指令集)处理器架构,ARM处理器则是ARM架构下的微处理器。ARM处...
发表于 2018-04-01 08:17
•
995次阅读
NVIDIA宣布扩展其Isaac平台以构建机器人应用,此举将加速机器人在各行各业中的开发与部署。
发表于 2018-03-31 10:37
•
270次阅读
日前,英伟达GTC 2018(GPU Technology Conference 2018,以下简称...
发表于 2018-03-31 09:12
•
449次阅读
计算机发展到今天,已经大大改变了我们的生活,我们已经进入了智能化的时代。但要是想实现影视作品中那样充...
发表于 2018-03-31 07:15
•
362次阅读
2018年3月29日,由电子发烧友网主办的第一届中国AI与机器学习研讨会,在深圳南山科兴科学园召开。...
发表于 2018-03-30 17:46
•
510次阅读
CPU 和 GPU 将各自维护一些数据结构来保证环形缓冲区的正确工作。这些 数据结构有缓冲区的基地址...
发表于 2018-03-30 15:01
•
359次阅读
我们正处在GPU计算的关键点,黄仁勋表示。这部分他还介绍TESLA V100等产品的多快好省,也谈到...
发表于 2018-03-30 10:31
•
275次阅读
黄仁勋说两件大事,一是发布了迄今最大的GPU,二是自动驾驶暂停研发。
发表于 2018-03-30 09:47
•
346次阅读
在所有运行模式下,未分组寄存器都指向同一个物理寄存器,他们未被系统用作特殊的用途。因此在中断或异常处...
发表于 2018-03-29 16:52
•
650次阅读
初创公司LexiconAI正在致力于使用AI技术自动化电子病历记录过程。
发表于 2018-03-29 16:36
•
414次阅读
3月15日消息 Valve今日升级SteamVR Beta,增加了一个可以根据GPU渲染能力来自动调...
发表于 2018-03-29 15:47
•
212次阅读
在2018年的CES 上,英伟达发布了 BFGD游戏显示器,65英寸的丰富色彩表现、G-Sync、4...
发表于 2018-03-29 14:59
•
238次阅读
Google、特斯拉、三星、高通等80家科技公司准备组队研发一种新的芯片设计模式,这部分业务正是AR...
发表于 2018-03-29 13:59
•
669次阅读
他开场介绍的第一个项目就是英伟达在前不久GDC上发布的NVIDIA RTX光线追踪技术(ray-tr...
发表于 2018-03-29 10:09
•
372次阅读
命令处理器CP(Command Processor)是GPU中用来获取从CPU中生成的命令,并进行解...
发表于 2018-03-29 08:52
•
132次阅读
Arm日前隆重宣布推出两款全新Mali GPU:Mali-G52和Mali-G31,为主流以及超高效...
发表于 2018-03-28 16:39
•
2344次阅读
放眼电子器件市场,移动设备可以说是规模最大也最为复杂的一个。据统计,2018年人们的日常生活中会用到...
发表于 2018-03-28 15:29
•
257次阅读
发表于 2018-03-28 14:50
•
439次阅读
致力于在功耗、安全、可靠性和性能方面提供差异化的领先半导体技术方案供应商美高森美公司宣布其Switc...
发表于 2018-03-28 12:22
•
1483次阅读
对于希望学习 ARM 汇编的同学而言, 购买 ARM 开发板进行板上实测无疑是一个有效的方法,不过购...
发表于 2018-03-28 09:07
•
224次阅读
未来系统需要在计算能力上大幅改进,以支持不断增多的工作负载以及不断演进的底层算法。
发表于 2018-03-27 16:10
•
415次阅读
AI 已经无疑是现在市场的绝对主角。随着概念的火热。围绕着AI芯片、算法和应用应运而生的企业已经不...
发表于 2018-03-27 14:08
•
40次阅读
发表于 2018-03-27 11:36
•
192次阅读
与上一代主流产品Mali-DP650执行双重显示相比,Mali-D51在相同面积内实现了两倍的场景复...
发表于 2018-03-27 11:26
•
315次阅读
发表于 2018-03-26 17:50
•
459次阅读
在为这样的大规模应用部署GPU加速时,出现了一个主要的技术挑战:训练数据太大而无法存储在GPU上可用...
发表于 2018-03-26 10:29
•
241次阅读
光线追踪(Ray Tracing)其实并不是什么新鲜技术,但因为需要实时计算画面中所有光线的发射、折...
发表于 2018-03-26 07:42
•
807次阅读
在大多数架构中(A R M采用加载/存储架构,也不例外),数据移动是必需的。如果不将信息从一个位置移...
发表于 2018-03-24 10:19
•
157次阅读
发表于 2018-03-23 19:01
•
196次阅读
Imagination宣布推出具备完整功能的集成开发环境(IDE)PVRStudio,它可简化嵌入式...
发表于 2018-03-23 18:24
•
78次阅读
Imagination宣布,推出PowerVR GPU 的性能分析工具 PVRTune的新版本,它可...
发表于 2018-03-23 18:21
•
129次阅读
发表于 2018-03-23 11:07
•
241次阅读
最近,机器学习(ML)话题大热,Arm也推出神经网络机器学习软件 Arm NN。这是一项关键技术,可...
发表于 2018-03-22 16:36
•
610次阅读
Arm在北京召开2018全球技术发布会,详细介绍了Project Trillium项目,同时Arm还...
发表于 2018-03-22 16:05
•
690次阅读
发表于 2018-03-22 10:24
•
473次阅读
本文以Hynix公司生产的HMS30C7202工业级处理器作为控制器,以矩阵键盘作为输入设备,以AM...
发表于 2018-03-22 09:01
•
180次阅读
发表于 2018-03-21 15:46
•
417次阅读
发表于 2018-03-20 22:51
•
906次阅读
加利福尼亚州圣何塞 —自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASD...
发表于 2018-03-20 10:21
•
1899次阅读
发表于 2018-03-19 15:48
•
206次阅读
发表于 2018-03-19 15:00
•
777次阅读
传Arm预定四月分割中国业务,将成立名为Arm mini China的新公司。Arm mini Ch...
发表于 2018-03-19 12:51
•
839次阅读
目前的物联网设备大多通过 Wi-Fi 或物联网卡连接网络。芯片设计公司 ARM 最近推出了一个新方案...
发表于 2018-03-19 10:56
•
369次阅读
为什么 CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力?
发表于 2018-03-16 15:12
•
415次阅读
Cortex-M处理器系列包括广泛使用的Cortex-M3处理器、针对FPGA的Cortex-M1处...
发表于 2018-03-15 15:45
•
182次阅读
非议在增加,但是对国内区块链、比特币的热度,没有太大影响。在这个世界里,隐藏着一门独特的大生意,那就...
发表于 2018-03-15 11:41
•
3738次阅读
目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对GPU进行更多的优化,甚至有人认为学...
发表于 2018-03-14 18:29
•
2473次阅读
首先编辑一个最简单的函数,包含变量分配及初始化,首先对输出的文件格式说明,对于如下的输出,左边是程序...
发表于 2018-03-14 10:36
•
632次阅读
ARM首先是一个公司,这家公司设计CPU并向各个CPU制造商授权许可,所以ARM公司是一家CPU设计...
发表于 2018-03-14 10:28
•
642次阅读
经历了十数年的高速发展之后,以智能手机为代表的移动设备开始迈入下半场。大家对新设备的关注重点从过往的...
发表于 2018-03-13 16:09
•
691次阅读
内嵌的桶形移位寄存器产生了更复杂的指令。桶形移位寄存器是一个硬件部件,在一个寄存器被一条指令使用之前...
发表于 2018-03-13 15:03
•
1854次阅读
若要在AI方面取得长足进步,我们必须在硬件上进行改变,或是半导体材料上进行突破。演变从GPU开始,引...
发表于 2018-03-13 09:22
•
969次阅读
发表于 2018-03-12 16:34
•
563次阅读
基于74HC系列的CMOS积体电路,插在面包板上用电线跳接起来,他花了两天时间画电路图、一个星期时间...
发表于 2018-03-12 09:21
•
198次阅读
摩尔定律也是一种财务(finance)与雄心(ambition)的定律,市场对于先进工艺技术的需求是...
发表于 2018-03-12 09:17
•
618次阅读
随着全球互联程度的日益加深,嵌入式系统解决方案也在不断增加新的连接选项,以及高级感测能力和本地分析功...
发表于 2018-03-12 09:08
•
2297次阅读
目前在移动世界发生了什么变化呢?消费者的使用行为发生了变化,智能手机已成为打通人类通向世界的网关。a...
发表于 2018-03-11 09:38
•
565次阅读
继承Mali-G51的优点,Mali-G52可从容应对更高的图形复杂度,允许在主流移动系统的功率和带...
发表于 2018-03-09 08:44
•
156次阅读
发表于 2018-03-08 10:54
•
854次阅读
在勘探到石油之前,油气公司需要事先处理海量的数据。NVIDIA正在与GE旗下油服公司Baker Hu...
发表于 2018-03-07 15:19
•
522次阅读
近期米尔电子基于Zynq-7010处理器及Zynq-7007S处理器推出了MYC-Y7Z010/00...
发表于 2018-03-07 10:47
•
2351次阅读
3月6日,为提供满足新一代体验需求的创新解决方案,Arm今日宣布推出包含全新的视频、显示和图像处理器...
发表于 2018-03-07 10:44
•
2529次阅读
日前,一则英特尔前总裁投身ARM服务器芯片领域,叫板老东家的新闻在业内掀起了轩然大波。
发表于 2018-03-06 16:46
•
831次阅读
数百万需要连接至物联网的设备可能由于成本问题、缺少代码空间和处理能力而受限。但其有限的计算资源仍能满...
发表于 2018-03-05 15:22
•
123次阅读
有51基础很容易入门ARM是真的吗?从51到ARM,这路怎么走?
发表于 2018-03-01 16:55
•
585次阅读
《财富》美国500强里年过五十的首席执行官,大多都没有刺青,更别说刺青还是自身经营的公司的商标的情况...
发表于 2018-03-01 10:46
•
2125次阅读
在芯片领域很多人都在猜测苹果布了一个“王炸之局”,高通、三星等都在苹果的布局之中。苹果不仅拔得 64...
发表于 2018-02-28 10:16
•
249次阅读
SIM卡是移动通讯必备的产品,包含用户辨识码IMSI、鉴权密钥KI、手机号码等重要信息,但是虚拟SI...
发表于 2018-02-27 11:27
•
224次阅读
评论