0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度解读GPU在历史上的二三事

Linux阅码场 来源:Linux阅码场 作者:Linux阅码场 2021-04-20 11:31 次阅读

历史学家克罗齐有言“一切历史都是当代史”。朱光潜先生注释说 “没有一个过去史真正是历史,如果它不引起现实的思索,打动现实的兴趣,和现实的心灵生活打成一片”,深以为然,是为题记。

笔者学校毕业后第一份工作服务于S3 Graphics。上个世纪90年代初,还是2D图形时代,S3曾经称霸整个显示卡市场。进入3D时代,强敌环伺,不敌ATI, 3Dfx, Nvidia等,渐趋下风。于2000年被威盛收购,仍不见起色,终至一蹶不振,回天乏力。文中关于S3最后命运是这么描述的 “An added issue for S3 was that the cost of building the cards resulted in razor thin profits. The company needed high volume sales in a market dominated by two vendors. HTC were to acquire S3 in July 2012 for $300 million, a move originally seen as leverage in HTC’s and S3’s separate legal disputes with Apple”。

这项交易的背景是HTC作为Android手机第一阵营,风头正劲,苹果为打击Android对手,对HTC发起专利诉讼。同时美国国际贸易委员会(International Trade Commission, ITC)也初步判定苹果侵犯了S3的专利权,HTC希望籍由并购S3获得与苹果谈判的筹码,而该交易中的焦点S3TC纹理压缩专利还是上个世纪S3 Savage产品时代开发的。一个曾经辉煌的公司努力挣扎后获得如此下场,不免让人一声叹息。

Imagination是我颇有好感的一个GPU设计公司。以前服务的公司曾取得过PowerVR SGX IP的授权,所以对其产品相对熟悉,个人觉得其TBDR(关于GPU绘制技术TBDR,TBR和IMR简单说明见文后注释)的设计浑然天成,整体无间,令人心生优美之感。Imagination的前身是Videologic, 从1992年开始图形方面的研究,也就是PowerVR项目,并于90年代中期研制出TBDR技术。

在日本市场,与NEC合作开发,大量供货世嘉的Dreamcast游戏机和Naomi街机系统。另外也与ST Micro携手进军PC图形市场。随着市场环境发生变化,Imagination也进行战略转移,放弃PC市场而专攻移动设备,聚焦IP授权。随着智能手机和平板电脑的兴起,Imagination的GPU IP授权业务获得长足发展。根据2012年JPR公布的移动GPU市场份额来看,Imagination遥遥领先。光鲜之下,危机也在逼近。首先高通

cf74e5ce-a100-11eb-8b86-12bb97331649.png

凭借骁龙Soc在移动处理器上的绝对优势,垂直整合,其Adreno GPU的份额一直居高不下。而ARM Mali也不是善茬,”ARM can offer both CPU and GPU designs to 3rd party licensees, this means ARM can offer the CPU and GPU designs together in a bundle, but perhaps more importantly it means they have the capability design the two in concert with each other.“。

利用CPU和GPU的捆绑销售策略,更重要的是技术上协同设计,Mali在GPU IP市场不断摧城拔寨,侵占Imagination的生存领地。而同时Imagination又太过依靠苹果的出货量,也限制了与Android手机芯片客户的进一步合作,这些大客户纷纷开始转用Mali GPU。到2014年,Imagination的市场直线下滑,已经被ARM反超。另外Imagination欣欣向荣之际,收购了MIPS公司,试图进入ARM主导的移动CPU市场,现在回头看不能不说是个败笔,MIPS已经被边缘化,在移动市场几乎没有份额。

2017年4月,Imagination 迎来最惨痛时刻,苹果通知Imagination苹果产品未来15至24个月后将不再使用该公司的技术,随后,Imagination股价瞬间暴跌了近 69%,当天跌幅更是高达75%。要知道苹果是Imagination的最大客户,其支付给Imagination的许可证费用和专利费为其总收入总额的一半,而之前一年Imagination已出现历史上最大的亏损,需要裁员来削减成本,真可谓雪上加霜。目前Imagination已

cf83f8de-a100-11eb-8b86-12bb97331649.png

经被中国资本收购,但在中美贸易战的背景下,整合之路好像困难重重,不知道还有没有机会重拾旧山河。

另外一个有趣的话题AMD和移动GPU的故事。ATI在2006年收购了BitBoys,并宣布在欧洲成立设计中心。跟Imagination类似,BitBoys是一家提供移动GPU IP的公司,其之前的产品Glaze3D也采用TBR绘制技术。但接着ATI被AMD收购以后,这个被重命名为Imageon的移动设计部门,在2009年竟匪夷所思被6500万美元卖给高通。

依托骁龙Soc,Adreno(与Radeon字母顺序调整下,表示同源?) GPU不断锤炼,终于练成史上最强大的移动GPU,也成为了骁龙Soc核心技术和制胜法宝。在《History of the Modern Graphics Processor》中作者以BitBoys‘ exit and AMD’s blunder为题描述这段过程,并以“in a major lack of management foresight”来形容当时AMD管理层的短视。但最近几年,两大PC GPU巨头Nvidia和AMD也貌似开始重新拥抱TBR绘制技术,见如下有关Nvidia和AMD的报道。

cf8eade2-a100-11eb-8b86-12bb97331649.png

cfa5e2f0-a100-11eb-8b86-12bb97331649.png

这么看来,2019年三星获得AMD的GPU授权用于手机和平板移动市场就一点不奇怪了。兜兜转转,AMD再次杀入移动GPU领域,一旦成功,移动GPU的江湖保不定会再次掀起血雨腥风。

IMR,TBR和TBDR技术比较

TBR(Tile Based Rendering),把屏幕区域网格化,称为tile,一般是16x16或32x32像素大小,绘制的时候先收集一帧所有绘制命令的几何信息,顶点变换后,计算与每个tile的交集。然后再按tile,依次进行渲染。由于tile比较小,中间的的渲染过程包括深度测试都可以在片上内存发生,只有tile中最终可见像素才会输出到系统内存,极大的地减少与系统内存的交互,对性能,功耗水平都有提升。

TBDR(Tile Based Defferred Rendering),TBR并没有解决overdraw的问题,被遮挡的像素也会进入渲染过程,浪费GPU算力。所以TBDR更进一步,渲染之前引入HSR(Hidden Surface Removal,隐藏面消除)步骤,保证渲染过程只渲染可见像素,被遮挡像素会被提前剔除掉。

IMR(Immediate Mode Rendering), 简单,粗暴,直接,来什么,画什么。优点是可预测强,debug和profiling都比较容易。缺点是会有大量的内存带宽负载,同时与TBR类似,IMR没有完全解决overdraw的问题,会浪费一部分GPU算力,这些都会引起功耗水平增加。所以一般是对功耗,发热都不敏感的PC GPU会采用IMR技术。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5190

    浏览量

    132631
  • 三星电子
    +关注

    关注

    34

    文章

    15602

    浏览量

    180111
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4413

    浏览量

    126640
  • IMRT
    +关注

    关注

    0

    文章

    3

    浏览量

    9042

原文标题:GPU历史之二三事

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA在深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    AI for Science,开启智能科学时代

    当人工智能遇上科研,让历史上的科学家都闻之落泪……
    的头像 发表于 02-02 09:36 2271次阅读
    AI for Science,开启智能科学时代

    iOS18将迎苹果史上最大革新

    苹果公司正在积极筹备的iOS 18操作系统可能是iPhone历史上最大的一次更新。虽然目前关于iOS 18的具体信息仍然相对较少,但已经有两项重大改进被确认。
    的头像 发表于 01-30 16:55 565次阅读

    二三四线式接近开关如何接线?

    二三四线式接近开关如何接线? 二三四线式接近开关作为一种常用的传感器,广泛应用于自动控制和检测领域。正确的接线方法是保证其正常工作的基础。本文将详细介绍二三四线式接近开关的接线步骤和注意事项,以帮助
    的头像 发表于 12-20 11:17 391次阅读

    深度解读英特尔拆分FPGA业务的原因

    不了解FPGA的朋友可能没听说过PSG,它是英特尔旗下的一个业务部门,前身是全球第二大FPGA公司Altera,也是我的前司。结果,就在我加入后不久啊,Altera就在2015年被英特尔花167亿美元收购了,这也是英特尔历史上最大的收购案,当时也是震惊了整个芯片行业。
    发表于 12-13 10:34 254次阅读

    GPU深度学习中的应用与优势

    人工智能的飞速发展,深度学习作为其重要分支,正在推动着诸多领域的创新。在这个过程中,GPU扮演着不可或缺的角色。就像超级英雄电影中的主角一样,GPU深度学习中拥有举足轻重的地位。那么
    的头像 发表于 12-06 08:27 706次阅读
    <b class='flag-5'>GPU</b>在<b class='flag-5'>深度</b>学习中的应用与优势

    争分夺秒:人工智能速度下的战争

    随着武装冲突时间的缩短,会产生哪些技术影响?过去可能耗时数年的战争可能在数月甚至数周内就能决定胜负。历时数周的行动必须在数天或数小时内完成。而指挥官们在做出决定之前,在历史上可能有充足的时间,但现在却不得不在几秒钟内做出决定。
    的头像 发表于 11-20 17:47 508次阅读

    为什么需要Streams?它们能取代Java中的for循环吗?

    Java8的发布是Java历史上的一个重大时刻。Streams 和 Lambda 被引入,它们现在被广泛使用。
    的头像 发表于 11-03 09:39 248次阅读
    为什么需要Streams?它们能取代Java中的for循环吗?

    GPU的张量核心: 深度学习的秘密武器

    GPU最初是为图形渲染而设计的,但是由于其卓越的并行计算能力,它们很快被引入深度学习中。深度学习的迅速发展离不开计算机图形处理单元(GPU)的支持,而
    的头像 发表于 09-26 08:29 525次阅读
    <b class='flag-5'>GPU</b>的张量核心: <b class='flag-5'>深度</b>学习的秘密武器

    传英伟达AI芯片将迎重大变革:Blackwell B100 GPU采用Chiplet设计

    到目前为止,英伟达已经证明业界不使用Chiplet也能发展,英伟达的hopper和ada lovelace gpu在提供公司历史上最高的瓦糖性能和最高收益方面非常卓越。但是,从布莱克威尔(blackwell)开始,我们将会看到英伟达的第一个芯片封装设计。
    的头像 发表于 09-19 14:36 1015次阅读

    CoreSight技术系统设计指南

    CoreSight系统提供调试、监控和优化完整片上系统(SoC)设计性能所需的所有基础设施。 在历史上,存在以下调试基于ARM处理器的SoC的方法: ·常规JTAG调试。 这是使用以下命令暂停内核
    发表于 08-12 06:00

    08.08 Java及JVM历史上的重大事件 #硬声创作季

    代码项目开发
    充八万
    发布于 :2023年07月18日 06:06:17

    深度学习如何挑选GPU

    NVIDIA的标准库使在CUDA中建立第一个深度学习库变得非常容易。早期的优势加上NVIDIA强大的社区支持意味着如果使用NVIDIA GPU,则在出现问题时可以轻松得到支持。
    发表于 07-12 11:49 426次阅读
    <b class='flag-5'>深度</b>学习如何挑选<b class='flag-5'>GPU</b>?

    英特尔斥资300亿欧元在德国建立晶圆厂 德国历史上最大外国投资

    路透社消息,英特尔将投巨资超过300亿欧元在德国的马德堡(Magdeburg)设立两座晶圆厂,德国总理舒尔茨表示,这是德国历史上最大一笔外国投资。一位知情人士表示,德国柏林已与这家美国芯片制造商达成了价值近100亿欧元的补贴,超过了最初向英特尔提供的68亿欧元补贴,用于在东部城市建造两个尖端设施。
    的头像 发表于 06-20 09:12 7512次阅读
    英特尔斥资300亿欧元在德国建立晶圆厂 德国<b class='flag-5'>历史上</b>最大外国投资

    微型太赫兹唤醒接收器的潜在应用

    无线频谱的太赫兹区域是电磁频谱中一个非常令人抓狂的部分,它有时被称为无线电信号和光学信号频率之间的“死区(dead zone)”。频段(300千兆赫到30太赫兹)有其吸引人的特性,但其令人生畏的物理特性在历史上使其难以用于实际应用。
    的头像 发表于 05-16 11:43 583次阅读