0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曙光已现!通用GPU芯片加速破局,国内企业突破量产瓶颈

Monika观察 来源:电子发烧友网 作者:莫婷婷 2022-03-08 07:23 次阅读

电子发烧友网报道(文/莫婷婷)当下,英伟达AMD两大巨头占据全球超过80%的通用GPU市场。在算力需求激增的情况下,多家国内企业选择加入通用GPU赛道,例如天数智芯、沐曦、壁仞科技、登临科技等。就在2021年3月,天数智芯发布全自研云端训练通用GPU芯片——天垓100芯片,这也是国内第一款全自研、GPU架构下的7nm制程通用GPU训练芯片。

电子发烧友网记者了解到,天数智芯的7nm 通用GPU训练芯片已经获得安防、人工智能、超算中心等多个应用领域的客户订单,未来将持续往5nm、3nm等更高级的制程发力。那么,国内通用GPU芯片量产的技术瓶颈在哪里,国内企业如何实现突围?记者就相关问题与天数智芯副总裁郭为进行了交流。

为什么国产通用GPU芯片量产难度大?

通用GPU即通用图形处理器,可用于人工智能模型训练与推理,以及高性能计算。与CPU相比,GPU的平行处理能力、处理速度都优于CPU,这也加强了GPU的通用性,而通用GPU的出现让GPU更加专注通用性。可以说,通用GPU就是GPU里的另一个快速发展的细分市场。

市场机构的数据显示,2019年我国通用GPU芯片的市场规模已达86亿元,预计到2025年将保持32%的年复合增长率,达458亿元。面对如此巨大的市场,国内企业涉足通用GPU市场,面临哪些挑战?郭为向记者表示,通用GPU芯片在设计上主要面临的是两大挑战,一是通用架构,二是软件生态。

在架构方面,通用架构需要适配各种各样的算法,包括基础计算;同时考虑到应用场景的特殊性,对芯片功耗也有要求,这就需要对芯片架构的优化和设计,实现低功耗高算力;另一方面,记者了解到国内在人才方面还面临较大的缺口,培养一位成熟的工程师需要10年的时间。

在软件生态方面,通用GPU不仅仅是一颗芯片硬件,还涉及到整个软件栈、编译器等一系列的软件生态系统。

为了突破技术瓶颈,天数智芯从2018年开始正式启动通用GPU芯片设计,历时三年最终量产国内首款全自研的7nm 通用GPU芯片。据了解,该芯片采用2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型支持标准/混合训练。在软件上,该芯片兼容主流生态系统,采用自主研发的软件栈,从多方面实现算力升级。

目前,一些国际巨头在GPU行业中仍处于领先位置,国内厂商需要突破重重挑战才能实现GPU突围。郭为也提到,英伟达经过十几年的发展,不仅有自主完善芯片架构,同样也有完善的软件生态,相对于软件生态,它具有丰富的软件接口、底层加速库,通用GPU芯片的入场门槛更高,这些都是国产企业需要追赶的。

正是因为通用GPU行业的高门槛,天数智芯的不易与成功也让国产企业看到了另一个可能性。

天数智芯推出7nm通用GPU芯片时便得到了业内人士的认可。中国工程院院士倪光南表示,该芯片在性能指标方面并不亚于国外主流产品。电子发烧友网了解到,天数智芯的“天垓100芯片”比业内同类芯片的面积小了一半,却实现单精FP32性能37TFlops,半精FP16/BF16性能147TFlops。

国产通用GPU芯片落地,深挖应用场景

国产通用GPU芯片在AI领域将打开大规模的应用市场,而这些都需要云端训练。以安防摄像头为例,摄像头在工作过程中,需要进行车辆识别、人脸识别等,这部分更重要的是依赖云端训练出的模型,进行大量推理。

郭为提到,通用GPU芯片还可以用于安检机,以及快递行业,对大量的物品进行识别,不管是安防还是快递行业,这些行业对模型训练以及模型推理的速度要求都非常高。在这方面,天数智芯已有客户带来了落地应用案例。

通用GPU芯片最典型的应用场景是在人工智能,但随着技术的成熟,通用GPU芯片在5G自动驾驶、大数据等领域的应用不断扩增。

自动驾驶最重要的是安全性,车上有大量的传感器获取路面情况,这些数据将被整合,再通过预先训练的模型预测路况,可以迅速作出决定。郭为指出,在这个过程中,需要大量的算力,同时考虑到汽车空间、电池功耗等问题,将大功耗或者大算力系统放在汽车内部也不太适合,最值得考虑的解决方案是将系统放在边缘侧,同时因为它需要迅速作出决定,要求边缘侧和汽车之间的通讯尽量地做到低时延,5G恰好可以实现这样的低时延。

在这些处理过程中,都需要用到通用GPU芯片。郭为认为,在达到理想的高算力低功耗的技术下,未来可以把高端的高算力的芯片直接放在汽车上面,应用场景也就更广了,这也是未来几年业内的研究方向。

对于未来的发展战略,天数智芯副总裁郭为提到了三大方面:

一是更强的算力。任何一个AI应用的模型都会越来越复杂,要求提供更高的算力,同时芯片制成提升会带来边际效应收窄,这时该如何进一步提升算力,实际上是任何一个通用GPU芯片都会面临的技术挑战。另一方面,自动驾驶、智慧医疗等各个行业的算法也在不断演进,此时,对于训练芯片来讲,更高的算力才能支持相应的算法运行。

二是更高的通用性。由于技术的快速迭代,云端训练芯片一定要有更高的通用性才能跟上智能驾驶、智慧医疗等高端市场需求。

三是隐私计算。智慧医疗场景涉及到患者,甚至医院的医疗数据隐私。而任何一个AI模型都需要大量的数据做训练,这时需要用到隐私计算,通过隐私加解密的方式,让这些敏感的数据做到可用。

“对于医疗这样的场景,隐私保护是相当重要的。云端训练芯片关于隐私保护这部分的解决方案,以及通用计算,也应当是后面的发展趋势。”郭为表示,天数智芯在未来会深挖隐私保护的相关应用场景,并且推出解决方案。

小结

如今,国内企业不断发力通用GPU芯片市场,随着技术的成熟也将给更多的应用场景带来多样化的可能性。当然,国内企业还需正视与国际企业的差距,并且在追赶的过程中,不断缩小差距,让国内的通用GPU芯片打开真正的用武之地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264044
  • GPU芯片
    +关注

    关注

    1

    文章

    289

    浏览量

    5688
  • 天数智芯
    +关注

    关注

    0

    文章

    91

    浏览量

    5337
收藏 人收藏

    评论

    相关推荐

    FPGA芯片你了解多少?

    ,FPGA芯片未来五年势必会迎来加速放量期,尽管国内企业和世界顶级企业还有较大差距,但在国产替代的核心逻辑下,摘取低处的果实也足以吃饱,不出
    发表于 04-17 11:13

    未来来,多传感器融合感知是自动驾驶的关键

    方面表示,这是L4级自动驾驶公司和车企为了打造Robotaxi量产车,在国内成立的首个合资公司。首款车型已完成产品定义,正在进行设计造型的联合评审,计划明年实现量产。未来来,2024
    发表于 04-11 10:26

    量产进行时,钠离子电池产业化“曙光”初现

    作为动储电池产业变革的重要方向之一,钠离子电池产业化进程正处于亟待寻求突破瓶颈期。
    的头像 发表于 03-17 09:47 710次阅读
    <b class='flag-5'>量产</b>进行时,钠离子电池产业化“<b class='flag-5'>曙光</b>”初现

    Nvidia与AMD新芯片突破PCIe瓶颈

    AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域,数据必须通过 PCI 接口从 CPU 域移动到 GPU 域(并返回)。
    的头像 发表于 03-08 14:15 232次阅读
    Nvidia与AMD新<b class='flag-5'>芯片</b>,<b class='flag-5'>突破</b>PCIe<b class='flag-5'>瓶颈</b>

    壁仞科技通用GPU芯片BR104荣获“中国芯”优秀技术创新产品奖

    年,迄今已举办了十七届,是中国集成电路产品和技术发展的“风向标”,旨在表彰最近一年正式发布的优秀集成电路产品,深受行业认可。本届共征集到来自285家芯片企业,累计398款芯片产品的报名材料,均为历史新高。  
    的头像 发表于 09-21 10:44 2247次阅读

    首款国产车规7nm芯片量产上车

    ​首搭国内首款自研车规级7nm量产芯片“龙鹰一号”,魅族车机系统首发上车。
    的头像 发表于 09-14 16:12 524次阅读

    中科曙光与行业伙伴加速构建创新型算力服务平台

    研发、科技成果转化等方面的成绩表示肯定,相信以曙光为代表的高科技企业,将以科技创新赋能产业发展,全力推动产业创新转型。 曙光公司总裁历军对来访领导表示欢迎,并介绍将与行业伙伴一起,加速
    的头像 发表于 09-05 11:33 582次阅读

    GPU如何突破算力供需瓶颈

    演讲嘉宾,探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。   沐曦联合创始人、CTO兼首席硬件架构师彭莉 发表主题演讲 在题为“后GPT时代的算力需求”的演讲中,彭莉预测大模型
    的头像 发表于 08-22 10:26 928次阅读

    研华科技与登临创新通用GPU系列加速卡Goldwasser完成适配和互认证

    过程中,表现出优越的系统稳定性且各项性能特征均满足用户的关键应用需求。 随着大数据和物联网的发展,AI在智慧城市、智慧医疗及智慧工厂等各个领域的应用越来越普遍,AI技术已经成为促进产业数字化升级的关键。应市场的发展和需求,深耕于物联网多年的研华与国内通用
    的头像 发表于 08-11 08:59 1123次阅读

    后摩智能与艾氪英诺合作加速智能驾驶技术的量产与普及

    。 作为全球存算一体智驾芯片的先行者,后摩智能通过先进的存算一体技术和存储工艺,不断突破芯片的性能与功耗瓶颈。目前,后摩智能已经推出了首款存算一体
    的头像 发表于 07-25 15:35 424次阅读

    2023WAIC完美收官,天数智芯闪耀自主通用GPU光芒

    7月6日-8日,为期三天的2023世界人工智能大会(WAIC)圆满落幕!作为国内率先实现通用GPU量产应用的硬科技企业,天数智芯重磅展示了天
    的头像 发表于 07-11 23:05 886次阅读
    2023WAIC完美收官,天数智芯闪耀自主<b class='flag-5'>通用</b><b class='flag-5'>GPU</b>光芒

    对话天数智芯董事长兼CEO盖鲁江:国产通用GPU性能提升的四大抓手

    而言,核心三要素是算法、数据和算力,其中算力是底座。  对于算力而言,目前行业基本的共识是基于通用GPU来构建AI大模型的算力集群,上海天数智芯半导体有限公司(以下简称:天数智芯)是目前国内第一家实现
    的头像 发表于 07-11 01:07 2716次阅读
    对话天数智芯董事长兼CEO盖鲁江:国产<b class='flag-5'>通用</b><b class='flag-5'>GPU</b>性能提升的四大抓手

    智慧渲染,通用为“先”——象帝先推动 “通用、好用、高性能、自主可控” GPU解决方案

    与发热的要求还很高。 象帝先专注于高性能通用图形处理器的开发,提供“通用、好用、高性能、自主可控”的GPU芯片与完整的软件驱动,同时积极推动生态系统的建立与发展。通过在桌面端与服务器端
    的头像 发表于 06-25 12:41 1185次阅读

    生态伙伴 | 华秋硬创联合湾加速,共同加速企业发展

    了35000多名硬创先锋报名参加线上线下培训会,并成功聚集了400多家生态合作伙伴,与 500多家顶级投资机构建立合作。 过往八届赛事123家总决赛晋级企业中,有112家获得融资,融资金额突破167亿
    发表于 06-16 16:00

    中国电源管理芯片上市企业研发投入占比超10%,上海贝岭产品品类持续增加

    ,朝着成为国内一流的模拟集成电路和功率器件设计公司方向努力。 上海贝岭在电源管理领域产品类别 公司电源管理产品业务在汽车电子市场也实现突破,一款车规LDO和一款LED驱动芯片开始实现批量销售。报告期
    发表于 06-09 14:52