0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析移动GPU厂商的发展史及其核心技术

SSDFans 来源:未知 作者:胡薇 2018-09-13 09:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能的飞速发展,需要强大的算力作为支撑,这背后NIVIDIA可谓是当之无愧的功臣。NIVIDIA先进的GPU技术和优异的软件生态,使其在竞争中脱颖而出,成为市场霸主。目前人工智能在图像处理及语音识别领域的研究取得了很好的发展,在手机和安防领域也有很多产品落地。在落地过程中,依然会面临设备算力的问题,而移动端GPU则自然而然的进入了人们的视野。

移动端GPU厂商的发展史

在移动端GPU市场中,没有形成一家独大的竞争格局。目前主要的移动端GPU厂商有高通arm和imaginaton。高通的adreno来自ATI的imageon,ATI最早被AMD收购,后来高通收购了AMD的移动设备资产,取得了AMD的矢量绘图与3D绘图技术和相关知识产权。后来高通结合AMD的手机图形技术发展为自家的Adreno图形处理器。另一家移动计算的巨头ARM,ARM在移动CPU的市场地位可谓遥不可及,但是在GPU领域,它确是诸多厂商中的一家,他的GPU业务也并非一开始就拥有,而是后来组建的。其GPU技术来自一家名为Falanx的公司,这家公司是早起从挪威大学脱离出来的一个名为mali的研究小组的成员组建的,最早定位于PC领域,失利后转向SoC GPU设计。随着SoC市场的不断壮大,以及移动计算的发展,ARM收购了Falanx,组建了自己的GPU事业部。最后一家,Imagination Technologies,这是一家专注于GPU技术的公司,最早在桌面级GPU的竞争中失利,后来转战移动端,Intel,三星,苹果,联发科,展讯曾经都是他的客户,一度被认为是全球最大的移动GPU厂商。这家公司可谓命运多舛,曾经作为苹果的供应商,由于iphone的每代产品在图形性能方面都比arm公版的Mali GPU有优势,一度让Imagination风光无二,但是随着苹果宣布自研GPU,Imagination的股票出现了断崖式下跌,公司濒临破产。后来将其业务进行拆分,MIPS业务出售给Tallwood MIPS,而GPU业务则出售给中国背景的私募基金Canyon Bridge。这一收购也填补了国内在GPU领域的空白。

在市场占有率方面,由于ARM以及高通的捆绑销售,Imagination并无优势,但是鉴于在物联网以及人工智能领域,目前三家都还没有建立起强大的生态,因此未来谁能称雄并未可知。

在技术方面三家GPU厂商架构差异比较明显,而且对外披露都比较少,相比较来说Imagination发面对于技术方面会开放一些。

Imagination的GPU Rogue架构浅析

在关于GPU的宣传中很容易看到一个词core,而且高端GPU也都是成千上万的core。其实宣传中的core并非CPU上“核”的概念。而真正意义上的核心,应该是AMD GCN架构中的Compute Unit, NVIDIA Maxwell架构中的SMM以及PowerVR Rogue架构中的USC等。对应于编程语言,应该是OpenCL中的Compute Unit(简称CU)。而宣传中所谓的core,则是OpenCL中的ProcessElement(简称PE)。

目前GPU采用的是多层级的线程技术,硬件结构和软件概念的对照如下图所示:从硬件结构看,首先是GPU设备,叫做device;一个GPU包含多个CU,而每个CU又包含多个计算通道。从OpenCL的软件架构看,每个NDRange对应一个GPU设备,其包含多个work-group,而每个work-group必须在一个CU上执行,也就是说,每个CU可以执行多个work-group,但是每个work-group不可以拆分到多个CU上去执行;每个work-group包含多个work-item,一个计算通道执行一个work-item。

简单介绍一下计算通道,SIMD叫做单指令多数据流(Single instruction MultipleData),目前所有的GPU都术语SIMD,一般都是16路或者32路SIMD。

关于线程的调度,首先介绍一个概念,AMD的wavefront或者NIVIDIA的warp,这是指线程调度的最小单位,也就是说,在GPU中每次执行一个warp,一般一个warp包含32个线程;对于AMD显卡则是一个wavefront包含64个work-item。下文中对这一概念统称为warp,线程和work-item通用。在Rogue架构中每个warp也是包含32个线程。

如下图所示,是Rogue架构的示意图,GPU中包含有多个USC(个数与产品型号有关),每个USC包含着色器,驻留槽,执行单元,存储器,纹理单元等等等。这样每个work-item在自己的生命周期中都包含自己的片上存储在Unified store中,shared local memory隐藏在common store中,这样每个USC都可以在warp之间进行零开销的上下文切换。

线程的执行过程如下图:

图中的Residency Slots中包含很多slot,每个slot代表一个warp,空的表示目前还没有部署warp。而部署了warp的slots一共有三个状态,绿色表示active,黄色表示ready,可以执行了,红色表示阻塞;active的warp接下来会在执行单元上执行,如图右侧所示,所有的32个work-item同时并行执行。Ready的会在下一个执行周期被调度执行;阻塞的则是因为读写等原因进入该状态。

下图是USC中流水线示意图,其中包含4个warp的调度。Warp0首先被执行,warp0会一直执行到它进入阻塞状态,例如读写全局存储,此时调度器会停止调度warp0,开始执行warp1;因为warp中的所有工作项执行相同的kernel代码,因此就有相同的特性,例如同时进入阻塞;在warp2进入阻塞状态时,warp0读写结束,进入read状态;最后在调度器调度完warp3后,重新开始调度warp0。这样并发执行可以实现对内存访问延迟的隐藏。因此在编程实现中一般使用较大的工作组,来实现warp切换对内存访问的延迟(当然,这不是绝对的,在实际中还要考虑寄存器等资源的消耗情况)。

下图展示了Rogue架构下得PowerVR Series7XT系列的架构图。

该系列的GPU拥有2到16个USC,因此具有100GFLOPS到1.5TFLOPS的可扩展性能。如下图展示了该系列GPU的USC架构。

以GT7400为例,其拥有128个FP32ALU核心,256个FP16 ALU核心。每个USC中包含16个pipelines,每个pipelines中含有多个ALU。其中的SFU可以原生的处理FP16、FP32(上一代会全部推给FP32),因此这一代架构可以避免没有必要的高精度操作,提升了性能并降低了功耗。

目前Imagenition已经发布了最新的GPU架构Furian,该架构相对于多年来已成业界标杆的Rogue架构有了在性能方面有了更大的提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134461
  • 人工智能
    +关注

    关注

    1813

    文章

    49735

    浏览量

    261532

原文标题:移动GPU浅谈

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    遥控开关方案详解:2025年遥控开关的核心技术与应用案例指南

    朝着多协议融合、低功耗、高稳定性和智能化方向演进。本文基于权威数据平台的市场调研和技术分析,全面解析遥控开关的核心技术、行业现状、主要品牌厂商及其优势产品,同时结合真实应用案例,提供具
    的头像 发表于 11-19 18:10 1794次阅读

    UPS电源的核心技术是什么

    UPS电源的核心技术围绕电力转换与稳定控制展开,涵盖整流、逆变、储能管理、切换控制四大核心模块,其技术原理与分类如下:一、核心模块与技术原理
    的头像 发表于 11-01 08:56 194次阅读
    UPS电源的<b class='flag-5'>核心技术</b>是什么

    深入解析X-Ray设备检测的核心技术与应用价值-智诚精展

    在现代工业、安检和材料检测领域,X-Ray设备的应用日益广泛。然而,许多人对X-Ray设备的核心技术、检测原理及其实际应用仍存在疑问。如,X-Ray设备是如何工作的?它们在各个行业中究竟有什么样
    的头像 发表于 10-16 13:42 255次阅读

    便携式高光谱相机的核心技术与应用优势

    光谱相机凭借其独特的核心技术和广泛的应用场景,成为了农业监测、环境评估、材料分析等领域的重要解决方案。本文将深入解析便携式高光谱相机的核心技术和其带来的诸多应用优势,助您更好地理解这一领域的最新发展。 1. 什么
    的头像 发表于 09-05 15:39 523次阅读
    便携式高光谱相机的<b class='flag-5'>核心技术</b>与应用优势

    深入解析地物光谱仪厂家核心技术与行业优势

    高精度、多波段覆盖及稳定性能的地物光谱仪,以满足复杂地物分析需求?本文将深入探讨地物光谱仪厂家在核心技术上的突破及其带来的行业优势,帮助您更好地理解选择优质设备的关键因素。 地物光谱仪核心技术解析 地物光谱仪是一种
    的头像 发表于 08-28 09:46 400次阅读

    Kubernetes安全加固的核心技术

    在生产环境中,Kubernetes集群的安全性直接关系到企业数据安全和业务稳定性。本文将从实战角度,带你掌握K8s安全加固的核心技术
    的头像 发表于 08-18 11:18 499次阅读

    聊聊倒装芯片凸点(Bump)制作的发展史

    凸点(Bump)是倒装芯片的“神经末梢”,其从金凸点到Cu-Cu键合的演变,推动了芯片从平面互连向3D集成的跨越。未来,随着间距缩小至亚微米级、材料与工艺的深度创新,凸点将成为支撑异构集成、高带宽芯片的核心技术,在AI、5G、汽车电子等领域发挥关键作用。
    的头像 发表于 08-12 09:17 3121次阅读
    聊聊倒装芯片凸点(Bump)制作的<b class='flag-5'>发展史</b>

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1 、Deepseek-V3
    发表于 07-22 22:14

    深圳 SMT:现代电子制造的核心技术

    深圳 SMT 作为现代电子制造的核心技术,在过去的发展中取得了辉煌成就,在未来也将继续引领电子制造行业的发展潮流,为全球电子产品的创新和升级提供坚实的技术支撑。而晋力达回流焊设备也将凭
    的头像 发表于 06-23 14:17 1034次阅读

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    的展望,大模型的训练方法、推理部署,到 GPU 硬件及推理模型的发展趋势,以前瞻性的视角为读者描绘了大模型的发展蓝图。 DeepSeek核心+配套视频课程 本书由一线资深
    发表于 06-09 14:38

    半导体材料发展史:从硅基到超宽禁带半导体的跨越

    半导体材料是现代信息技术的基石,其发展史不仅是科技进步的缩影,更是人类对材料性能极限不断突破的见证。从第一代硅基材料到第四代超宽禁带半导体,每一代材料的迭代都推动了电子器件性能的飞跃。 1 第一代
    的头像 发表于 04-10 15:58 2308次阅读

    深入探讨DeepSeek大模型的核心技术

    导读 本文深入探讨了DeepSeek大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。   一、关于DeepSeek公司及其大模型 1.1 公司概况 DeepSeek
    的头像 发表于 02-10 10:49 3320次阅读
    深入探讨DeepSeek大模型的<b class='flag-5'>核心技术</b>

    从市场角度解读机器人核心关键技术

    从讲机器人发展史--机器人技术层面上升到从场景从市场来谈人工智能机器人核心关键技术的阶段了。对于人工智能机器人来说,若从技术角度来讨论
    的头像 发表于 12-25 15:20 1147次阅读
    从市场角度解读机器人<b class='flag-5'>核心</b>关键<b class='flag-5'>技术</b>

    从MCU到SoC:汽车芯片核心技术的深度剖析

    在科技日新月异的今天,汽车已经从单纯的交通工具演变为集智能化、网联化、电动化于一体的高科技产品。这一变革的背后,汽车芯片作为汽车电子系统的核心组成部分,发挥着至关重要的作用。本文将深入探讨汽车芯片产业链及其关键核心技术,揭示这一
    的头像 发表于 12-20 13:40 2513次阅读
    从MCU到SoC:汽车芯片<b class='flag-5'>核心技术</b>的深度剖析

    浅谈显示屏的发展史

    显示器如今已成为日常办公、娱乐不可或缺的一部分,它是人们与机器之间交互的窗口,随着显示器技术的不断发展,也让人机交互体验提升了一个又一个新的台阶,时至今日,历经超100年的发展。从早期的黑白世界到彩色世界,显示器走过了漫长而艰辛
    的头像 发表于 12-18 09:12 3769次阅读