0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曙光已现!通用GPU芯片加速破局,国内企业突破量产瓶颈

Monika观察 来源:电子发烧友网 作者:莫婷婷 2022-03-08 07:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/莫婷婷)当下,英伟达AMD两大巨头占据全球超过80%的通用GPU市场。在算力需求激增的情况下,多家国内企业选择加入通用GPU赛道,例如天数智芯、沐曦、壁仞科技、登临科技等。就在2021年3月,天数智芯发布全自研云端训练通用GPU芯片——天垓100芯片,这也是国内第一款全自研、GPU架构下的7nm制程通用GPU训练芯片。

电子发烧友网记者了解到,天数智芯的7nm 通用GPU训练芯片已经获得安防、人工智能、超算中心等多个应用领域的客户订单,未来将持续往5nm、3nm等更高级的制程发力。那么,国内通用GPU芯片量产的技术瓶颈在哪里,国内企业如何实现突围?记者就相关问题与天数智芯副总裁郭为进行了交流。

为什么国产通用GPU芯片量产难度大?

通用GPU即通用图形处理器,可用于人工智能模型训练与推理,以及高性能计算。与CPU相比,GPU的平行处理能力、处理速度都优于CPU,这也加强了GPU的通用性,而通用GPU的出现让GPU更加专注通用性。可以说,通用GPU就是GPU里的另一个快速发展的细分市场。

市场机构的数据显示,2019年我国通用GPU芯片的市场规模已达86亿元,预计到2025年将保持32%的年复合增长率,达458亿元。面对如此巨大的市场,国内企业涉足通用GPU市场,面临哪些挑战?郭为向记者表示,通用GPU芯片在设计上主要面临的是两大挑战,一是通用架构,二是软件生态。

在架构方面,通用架构需要适配各种各样的算法,包括基础计算;同时考虑到应用场景的特殊性,对芯片功耗也有要求,这就需要对芯片架构的优化和设计,实现低功耗高算力;另一方面,记者了解到国内在人才方面还面临较大的缺口,培养一位成熟的工程师需要10年的时间。

在软件生态方面,通用GPU不仅仅是一颗芯片硬件,还涉及到整个软件栈、编译器等一系列的软件生态系统。

为了突破技术瓶颈,天数智芯从2018年开始正式启动通用GPU芯片设计,历时三年最终量产国内首款全自研的7nm 通用GPU芯片。据了解,该芯片采用2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型支持标准/混合训练。在软件上,该芯片兼容主流生态系统,采用自主研发的软件栈,从多方面实现算力升级。

目前,一些国际巨头在GPU行业中仍处于领先位置,国内厂商需要突破重重挑战才能实现GPU突围。郭为也提到,英伟达经过十几年的发展,不仅有自主完善芯片架构,同样也有完善的软件生态,相对于软件生态,它具有丰富的软件接口、底层加速库,通用GPU芯片的入场门槛更高,这些都是国产企业需要追赶的。

正是因为通用GPU行业的高门槛,天数智芯的不易与成功也让国产企业看到了另一个可能性。

天数智芯推出7nm通用GPU芯片时便得到了业内人士的认可。中国工程院院士倪光南表示,该芯片在性能指标方面并不亚于国外主流产品。电子发烧友网了解到,天数智芯的“天垓100芯片”比业内同类芯片的面积小了一半,却实现单精FP32性能37TFlops,半精FP16/BF16性能147TFlops。

国产通用GPU芯片落地,深挖应用场景

国产通用GPU芯片在AI领域将打开大规模的应用市场,而这些都需要云端训练。以安防摄像头为例,摄像头在工作过程中,需要进行车辆识别、人脸识别等,这部分更重要的是依赖云端训练出的模型,进行大量推理。

郭为提到,通用GPU芯片还可以用于安检机,以及快递行业,对大量的物品进行识别,不管是安防还是快递行业,这些行业对模型训练以及模型推理的速度要求都非常高。在这方面,天数智芯已有客户带来了落地应用案例。

通用GPU芯片最典型的应用场景是在人工智能,但随着技术的成熟,通用GPU芯片在5G自动驾驶、大数据等领域的应用不断扩增。

自动驾驶最重要的是安全性,车上有大量的传感器获取路面情况,这些数据将被整合,再通过预先训练的模型预测路况,可以迅速作出决定。郭为指出,在这个过程中,需要大量的算力,同时考虑到汽车空间、电池功耗等问题,将大功耗或者大算力系统放在汽车内部也不太适合,最值得考虑的解决方案是将系统放在边缘侧,同时因为它需要迅速作出决定,要求边缘侧和汽车之间的通讯尽量地做到低时延,5G恰好可以实现这样的低时延。

在这些处理过程中,都需要用到通用GPU芯片。郭为认为,在达到理想的高算力低功耗的技术下,未来可以把高端的高算力的芯片直接放在汽车上面,应用场景也就更广了,这也是未来几年业内的研究方向。

对于未来的发展战略,天数智芯副总裁郭为提到了三大方面:

一是更强的算力。任何一个AI应用的模型都会越来越复杂,要求提供更高的算力,同时芯片制成提升会带来边际效应收窄,这时该如何进一步提升算力,实际上是任何一个通用GPU芯片都会面临的技术挑战。另一方面,自动驾驶、智慧医疗等各个行业的算法也在不断演进,此时,对于训练芯片来讲,更高的算力才能支持相应的算法运行。

二是更高的通用性。由于技术的快速迭代,云端训练芯片一定要有更高的通用性才能跟上智能驾驶、智慧医疗等高端市场需求。

三是隐私计算。智慧医疗场景涉及到患者,甚至医院的医疗数据隐私。而任何一个AI模型都需要大量的数据做训练,这时需要用到隐私计算,通过隐私加解密的方式,让这些敏感的数据做到可用。

“对于医疗这样的场景,隐私保护是相当重要的。云端训练芯片关于隐私保护这部分的解决方案,以及通用计算,也应当是后面的发展趋势。”郭为表示,天数智芯在未来会深挖隐私保护的相关应用场景,并且推出解决方案。

小结

如今,国内企业不断发力通用GPU芯片市场,随着技术的成熟也将给更多的应用场景带来多样化的可能性。当然,国内企业还需正视与国际企业的差距,并且在追赶的过程中,不断缩小差距,让国内的通用GPU芯片打开真正的用武之地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41885

    浏览量

    302993
  • GPU芯片
    +关注

    关注

    1

    文章

    308

    浏览量

    6577
  • 天数智芯
    +关注

    关注

    0

    文章

    113

    浏览量

    6687
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    狭路相逢“能效”胜!AI GPU供电的SPS国产

    部署,AI训练与推理任务呈指数级增长,全方位推动算力需求迎来爆发式扩容。 作为技术变革的核心载体,算力芯片正经历着跨越式升级:GPU 单卡功率从过往的 300W 飙升至700W,部分高性能AI芯片甚至
    的头像 发表于 02-09 10:02 1.9w次阅读
    狭路相逢“能效”胜!AI <b class='flag-5'>GPU</b>供电的SPS国产<b class='flag-5'>破</b><b class='flag-5'>局</b>

    国内推理GPU厂商曦望,获超10亿元融资

    电子发烧友网报道 4月20日,国内专注于全栈自研AI推理GPU企业曦望(Sunrise)宣布,成功完成新一轮超10亿元人民币的融资。自一年多前从商汤分拆独立以来,曦望累计完成七轮融
    的头像 发表于 04-21 10:41 1600次阅读

    深圳SMOOTH斯蒙奇|减速箱厂家:全球市场演变,中国企业如何

    深圳SMOOTH斯蒙奇|减速箱厂家:全球市场演变,中国企业如何
    的头像 发表于 04-09 15:53 258次阅读

    硬科技·新消费——CES Asia 2026机器人量产化与商业化论坛定档北京

    当机器人产业从技术演示迈入量产落地关键期,成本高企、供应链协同不足、商业化路径模糊等痛点成为行业突围的核心阻碍。“硬科技 · 新消费——CES Asia 2026机器人量产化与商业化
    的头像 发表于 03-25 17:24 528次阅读

    又一国产GPU企业上市

    GPU企业国内首家实现“训练+推理”通用GPU量产企业
    的头像 发表于 01-08 18:09 7175次阅读

    存储迭代暗涌:HBM4与UFS4.1浪潮下,烧录环节何以成为新瓶颈

    存储芯片市场扩产繁荣,HBM4、UFS4.1等先进技术加速量产,但被低估的烧录环节成关键瓶颈。先进存储对烧录的速度、精度和协议复杂度提出极高要求,面临三重技术关卡。需专用烧录方案
    的头像 发表于 12-22 14:03 805次阅读

    芯片制程升级,PCB散热如何

    。 高密度互连(HDI)板在应对热挑战时面临双重压力:一方面,微孔结构增加热阻,局部热点易导致铜箔剥离;另一方面,轻薄化设计压缩散热空间。实践中,我们通过优化导热路径——例如,在BGA封装区域增加阶梯式散热过孔,将热量导向内
    的头像 发表于 12-05 16:12 643次阅读

    陀螺形体材料,突破光子芯片瓶颈

    电子发烧友网综合报道 在人工智能、物联网与大数据技术驱动下,全球数据量正以指数级速度增长。传统电子芯片受限于电子传输的物理瓶颈难以满足未来计算对速度与能效的严苛需求。在此背景下,以光子为信息载体
    的头像 发表于 11-23 07:14 1w次阅读
    陀螺形体材料,<b class='flag-5'>突破</b>光子<b class='flag-5'>芯片</b><b class='flag-5'>瓶颈</b>

    PCB行业痛点何解?盘古信息IMS MOM系统打造数字化之道

    端产品毛利率降低,高端化、精细化成为关键。而 PCB 行业因工序复杂、精度要求高,且能带动产业链协同升级,成为数字化转型先行军,转型需求迫切。 痛点聚焦·数字化:PCB行业面临
    的头像 发表于 09-10 08:59 729次阅读
    PCB行业痛点何解?盘古信息IMS MOM系统打造数字化<b class='flag-5'>破</b><b class='flag-5'>局</b>之道

    汇川技术助力土耳其电梯厂商突破技术瓶颈

    土耳其Top 3电梯厂商Yükseliş冲击高端市场,却受困于高速梯核心技术瓶颈与海外方案落地难,项目一度搁浅。如何?本期《千行百业有汇川》走进土耳其,看汇川技术如何以自研13m/s高速梯系统方案,助力客户高效落地项目,成功
    的头像 发表于 08-14 13:01 1451次阅读

    ·领航 | 匠芯创M7000系列六款总线型工业级高性能实时处理器DSP重磅发布

    的发布会,不仅彰显了行业对本土创新的强烈期待,更标志着我国在工业控制核心芯片领域正以之势,加速构建自主可控的产业新生态。2025年全球工业芯片
    的头像 发表于 08-07 15:38 1851次阅读
    <b class='flag-5'>破</b><b class='flag-5'>局</b>·领航 | 匠芯创M7000系列六款总线型工业级高性能实时处理器DSP重磅发布

    新品 | 散热困境!捷智算5090 浸没式液冷服务器全新来袭!

    在算力需求呈爆发式增长的当下,服务器硬件适配困难与散热不畅这两大难题,一直困扰着许多用户。不过,曙光!捷智算全新推出的5090液冷浸没式服务器,带着硬核技术突破了难题。它究竟藏着哪
    的头像 发表于 08-06 17:12 2497次阅读
    新品 | <b class='flag-5'>破</b><b class='flag-5'>局</b>散热困境!捷智算5090 浸没式液冷服务器全新来袭!

    燧原科技加速国产智算

    7月27日上午,燧原科技与中国电子信息产业发展研究院、人工智能产业工作委员会、上海市集成电路行业协会、上海市算力网络协会、上海赛西科技发展有限责任公司共同举办“芯节点·新突破——协同创新聚力 加速
    的头像 发表于 08-01 16:12 2038次阅读

    RISC-V如何盈利?本土企业率先

    7月16日,第五届RISC-V中国峰会在上海盛大开幕,规模和全球影响力远超历届。去年峰会圆桌讨论如何盈利,今年就有本土企业率先。据峰会现场消息,沁恒青稞RISC-V商用五年并持续
    的头像 发表于 07-18 11:32 3664次阅读
    RISC-V如何盈利?本土<b class='flag-5'>企业</b>率先<b class='flag-5'>破</b><b class='flag-5'>局</b>

    吐槽国内芯片资料

    国内企业的技术文档和欧美企业的文档,差距不是一点半点,欧美文档唯恐给你说不明白,国内文档唯恐给你说明白,这说明国内半导体
    发表于 06-02 15:17