0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPGPU市场增长强劲 创新性架构大幅提升AI计算效率!

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-01-19 11:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)GPU中文叫图形处理单元,是一种并行处理的硬件,早起只用来渲染复杂的计算机图形环境。随着技术进步,GPU不再局限于图形领域,扩展应用到其他计算密集的领域,被称为GPGPU,成为AI 芯片领域的代表。

GPU具有很好的通用性,同时传统的架构也存在一定局限,比如计算密度低、效率低,如何在保证通用性的情况下,又提高它的计算效率成为业界关注的重点。

创新架构提高AI计算效率

那么应该如何做呢?为了提高GPU的计算效率,GPU知名企业英伟达也进行的相应的尝试,即对原来的GPU架构进行修改,比如增加专门的张量计算单元、增加片上内存器等,这一定程度可以提高AI的计算效率,不过受限于GPU整体架构,问题并没有得到很好的解决。

图:传统GPU对AI加速的局限体现在哪些方面(图片来自登临科技分享)


成立于2017年的登临科技,从2018年自主研发创新性的GPU+架构,一款由软件定义的、片内异构的支持并行化计算的架构。GPU+架构针对AI应用,具备和GPU一样的可编程能力和通用性。同时通过架构创新,提供更高的计算密度,更快的计算速度,同时大幅降低对外部带宽的需求。而这些是传统GPU芯片无法兼顾的。


由于GPU良好的通用性,在服务器及云端等使用场景中,会大规模应用 GPU。运行各类神经网络。大量开源生态的应用、大量客户定制化的软件,都是在主流的GPU软件生态上完成。如何保持客户已有的投入,即如何减少客户的使用成本,也是AI技术产业化的重要课题。

怎么做呢?登临科技在接受电子发烧友采访的时候表示,登临自主创新的GPU+架构,通过对高效的Tensor引擎和可编程的GPGPU引擎的有机配合,硬件直接兼容CUDA/OpenCL,可无缝接入现有软件生态,大大降低了客户的迁移成本。

通过片内异构,GPU+解决了传统的系统级异构计算调度,数据交换的开销大,以及数据的连贯相干性的难题。在整个系统的计算密度极高的基础上,通过软件定义,使针对不同神经网络的应用场景,都能达到硬件性能和能效最大化。

登临科技表示,通过大规模客户实测,在同等功耗下,GPU+的性能可以达到国际主流产品3倍以上的能效。

打造真正符合市场需求的产品

登临科技成立以后,一直思考如何制定真正符合市场需求的技术路线,即上文所谈的如何保持客户已有的投入,减少客户的使用成本,这是登临科技制定产品的价值导向。

2018年登临确定了产品的方向:基于GPGPU的高能效计算,并自主研发创新的GPU+架构。经过团队一年多的工作,于2019年6月,公司完成了首款基于GPU+架构的Goldwasser设计,并mpw流片成功。

2020年6月Goldwasser成功回片通过测试,开始客户送样,Goldwasser目前已在成熟的12nm/14nm工艺上实现量产。登临Goldwasser已于2021年在智慧城市、互联网等领域顺利实现了商业化落地,并同时与数十家客户在边缘至云端的不同应用场景中进行产品开发、测试。


登临科技的Goldwasser 系列产品包括:边缘计算产品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。多种规格的产品,使得客户可以根据自身需求分别部署在边缘侧、云端的各种计算设备中。

登临科技方案架构总监郑韬此前在某论坛上也介绍过,Goldwasser覆盖主流系统生态,登临Hamming软件开发包支持主流GPU编程语言,包括CUDA、OpenCL等;适配国内外主流服务器厂家;支持主流国内外AI计算框架,包括PyTorch、百度飞浆、TensorFlow等;适配国内外主流CPU厂家,包括飞腾、龙芯、英特尔AMD等。

在不同的应用场景下,Goldwasser可以支持多种不同的算法实现和落地,如智慧城市、智能交通、语音识别、虚拟客服、智慧工地、智慧车站、机器翻译、工业视觉等,场景覆盖CV、NLP、知识图谱、信号处理和计算等多个领域。Goldwasser可以同时支持训练和推理。

登临科技表示,目前Goldwasser正与30多家不同行业的头部企业进行量产导入。同时,登临科技打通供应链上下游相关企业和合作伙伴,确保产品正常交付。

小结

当前AI技术正快速发展,GPGPU呈现出强劲的增长势头,根据有关数据预测,到2025年,我国GPGPU芯片板卡的市场规模将达458亿元,年复合增长率高达32%,未来市场可观。

目前国际巨头占据大部分市场,与之相比国内厂商还存在差距,不过近几年不少国内GPU厂商通过自主创新,在技术上逐渐取得进展,产品也逐步走向落地商用,比如登临科技。

另外,对于政府目前重点关注的降碳增效,登临科技表示,对计算芯片而言关键指标是能效比,而这也是公司产品的最重要的优势之一,登临将继续通过对传统GPU的架构创新,不断提升异构硬件的算力,达到非常显著的能效比优势,为降碳和增效做贡献。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vibe Coding AI全栈开发实战

    Coding AI全栈开发模式凭借其独特的优势,正成为开发者们提升效率、加速创新的新利器。(搜星 课it。top) Vibe Coding:重新定义开发范式 Vibe Coding,
    发表于 04-15 16:02

    智造引擎,仿真之巅:Altair HyperWorks 重塑工程研发新格局?

    设计环节,形成 “仿真 - 优化 - 设计” 闭环,加速创新落地。4. AI 驱动仿真:颠覆传统,效率提升千倍最新 HyperWorks 2026 深度融合几何深度学习、GPU 加速降
    发表于 04-03 14:45

    Altair CFD 以技术赋能工程创新?

    的端到端无缝衔接。具备自动网格划分、GPU加速、稳态时间行进等功能,其中几何模型准备效率较传统工具提升80%,稳态仿真可在少于100次迭代中快速收敛,大幅缩短仿真周期。4. AI赋能+
    发表于 02-28 14:47

    Imagination:边缘AI是半导体市场重要增长引擎,E-Series 架构恰逢其时

    2025年半导体市场AI需求爆发与全产业链复苏的双重推动下,呈现出强劲增长态势。以EDA/IP先进方法学、先进工艺、算力芯片、端侧AI
    的头像 发表于 01-08 10:21 569次阅读
    Imagination:边缘<b class='flag-5'>AI</b>是半导体<b class='flag-5'>市场</b>重要<b class='flag-5'>增长</b>引擎,E-Series <b class='flag-5'>架构</b>恰逢其时

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    优化计算资源并有效地适应任务的复杂。 显著特征: MoE 模型的一个显著特征是在管理大型数据集方面的灵活性较高,它能够在计算效率小幅降低的情况下,将模型容量扩大上千倍。稀疏门控混合专
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    的时间缩短、效率提升的硬件架构非常重要。因此存内加速方案,X-Former应运而生。它是一种混合存内计算架构,结合了NVM和基于互补金属氧化
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    是展望未来的AGI芯片,并探讨相关的发展和伦理话题。 各章的目录名称如下: 第1章 大模型浪潮下,AI芯片的需求与挑战免费 第2章 实现深度学习AI芯片的创新方法与架构 第3章
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审中的竞争力。例如,
    发表于 08-19 08:58

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    创新、应用创新、系统创新五个部分,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围
    发表于 07-28 13:54

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    数据中挖掘有价值信息,这也让我意识到架构设计对模型性能起着根本性作用,是 AI 具备强大能力的 “骨骼” 支撑。 二、流水线并行 书中关于流水线并行的内容,展现了提升计算
    发表于 07-20 15:07

    AI芯片:加速人工智能计算的专用硬件引擎

    处理等应用落地的关键硬件基础。   AI芯片的核心技术特点     AI芯片的设计重点在于提升计算效率,主要技术特点包括:   1.   并
    的头像 发表于 07-09 15:59 1949次阅读

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI大幅提升产品设计、营销及物流等方面的运营效率
    的头像 发表于 06-19 14:36 1349次阅读

    芯原可扩展的高性能GPGPU-AI计算IP赋能汽车与边缘服务器AI解决方案

    芯原股份 (芯原,股票代码:688521.SH) 日前宣布其 高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能 。通过将可编程并行
    的头像 发表于 06-16 10:44 1520次阅读

    进迭时空同构融合技术加速大模型AI应用创新

    同构融合技术为了加速AI计算,芯片企业设计了多种专用处理器架构,如GPGPU、NPU、TPU等。这些专用处理器架构在执行调度代码及应用层代码
    的头像 发表于 06-06 16:55 1254次阅读
    进迭时空同构融合技术加速大模型<b class='flag-5'>AI</b>应用<b class='flag-5'>创新</b>

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    ,强化与AI、5G等技术的融合,同时通过独立运营提升战略专注度。市场机遇:AI、边缘计算等领域的爆发式
    发表于 04-25 10:19