0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPGPU市场增长强劲 创新性架构大幅提升AI计算效率!

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-01-19 11:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)GPU中文叫图形处理单元,是一种并行处理的硬件,早起只用来渲染复杂的计算机图形环境。随着技术进步,GPU不再局限于图形领域,扩展应用到其他计算密集的领域,被称为GPGPU,成为AI 芯片领域的代表。

GPU具有很好的通用性,同时传统的架构也存在一定局限,比如计算密度低、效率低,如何在保证通用性的情况下,又提高它的计算效率成为业界关注的重点。

创新架构提高AI计算效率

那么应该如何做呢?为了提高GPU的计算效率,GPU知名企业英伟达也进行的相应的尝试,即对原来的GPU架构进行修改,比如增加专门的张量计算单元、增加片上内存器等,这一定程度可以提高AI的计算效率,不过受限于GPU整体架构,问题并没有得到很好的解决。

图:传统GPU对AI加速的局限体现在哪些方面(图片来自登临科技分享)


成立于2017年的登临科技,从2018年自主研发创新性的GPU+架构,一款由软件定义的、片内异构的支持并行化计算的架构。GPU+架构针对AI应用,具备和GPU一样的可编程能力和通用性。同时通过架构创新,提供更高的计算密度,更快的计算速度,同时大幅降低对外部带宽的需求。而这些是传统GPU芯片无法兼顾的。


由于GPU良好的通用性,在服务器及云端等使用场景中,会大规模应用 GPU。运行各类神经网络。大量开源生态的应用、大量客户定制化的软件,都是在主流的GPU软件生态上完成。如何保持客户已有的投入,即如何减少客户的使用成本,也是AI技术产业化的重要课题。

怎么做呢?登临科技在接受电子发烧友采访的时候表示,登临自主创新的GPU+架构,通过对高效的Tensor引擎和可编程的GPGPU引擎的有机配合,硬件直接兼容CUDA/OpenCL,可无缝接入现有软件生态,大大降低了客户的迁移成本。

通过片内异构,GPU+解决了传统的系统级异构计算调度,数据交换的开销大,以及数据的连贯相干性的难题。在整个系统的计算密度极高的基础上,通过软件定义,使针对不同神经网络的应用场景,都能达到硬件性能和能效最大化。

登临科技表示,通过大规模客户实测,在同等功耗下,GPU+的性能可以达到国际主流产品3倍以上的能效。

打造真正符合市场需求的产品

登临科技成立以后,一直思考如何制定真正符合市场需求的技术路线,即上文所谈的如何保持客户已有的投入,减少客户的使用成本,这是登临科技制定产品的价值导向。

2018年登临确定了产品的方向:基于GPGPU的高能效计算,并自主研发创新的GPU+架构。经过团队一年多的工作,于2019年6月,公司完成了首款基于GPU+架构的Goldwasser设计,并mpw流片成功。

2020年6月Goldwasser成功回片通过测试,开始客户送样,Goldwasser目前已在成熟的12nm/14nm工艺上实现量产。登临Goldwasser已于2021年在智慧城市、互联网等领域顺利实现了商业化落地,并同时与数十家客户在边缘至云端的不同应用场景中进行产品开发、测试。


登临科技的Goldwasser 系列产品包括:边缘计算产品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。多种规格的产品,使得客户可以根据自身需求分别部署在边缘侧、云端的各种计算设备中。

登临科技方案架构总监郑韬此前在某论坛上也介绍过,Goldwasser覆盖主流系统生态,登临Hamming软件开发包支持主流GPU编程语言,包括CUDA、OpenCL等;适配国内外主流服务器厂家;支持主流国内外AI计算框架,包括PyTorch、百度飞浆、TensorFlow等;适配国内外主流CPU厂家,包括飞腾、龙芯、英特尔AMD等。

在不同的应用场景下,Goldwasser可以支持多种不同的算法实现和落地,如智慧城市、智能交通、语音识别、虚拟客服、智慧工地、智慧车站、机器翻译、工业视觉等,场景覆盖CV、NLP、知识图谱、信号处理和计算等多个领域。Goldwasser可以同时支持训练和推理。

登临科技表示,目前Goldwasser正与30多家不同行业的头部企业进行量产导入。同时,登临科技打通供应链上下游相关企业和合作伙伴,确保产品正常交付。

小结

当前AI技术正快速发展,GPGPU呈现出强劲的增长势头,根据有关数据预测,到2025年,我国GPGPU芯片板卡的市场规模将达458亿元,年复合增长率高达32%,未来市场可观。

目前国际巨头占据大部分市场,与之相比国内厂商还存在差距,不过近几年不少国内GPU厂商通过自主创新,在技术上逐渐取得进展,产品也逐步走向落地商用,比如登临科技。

另外,对于政府目前重点关注的降碳增效,登临科技表示,对计算芯片而言关键指标是能效比,而这也是公司产品的最重要的优势之一,登临将继续通过对传统GPU的架构创新,不断提升异构硬件的算力,达到非常显著的能效比优势,为降碳和增效做贡献。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    的时间缩短、效率提升的硬件架构非常重要。因此存内加速方案,X-Former应运而生。它是一种混合存内计算架构,结合了NVM和基于互补金属氧化
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    是展望未来的AGI芯片,并探讨相关的发展和伦理话题。 各章的目录名称如下: 第1章 大模型浪潮下,AI芯片的需求与挑战免费 第2章 实现深度学习AI芯片的创新方法与架构 第3章
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审中的竞争力。例如,
    发表于 08-19 08:58

    AI芯片:加速人工智能计算的专用硬件引擎

    处理等应用落地的关键硬件基础。   AI芯片的核心技术特点     AI芯片的设计重点在于提升计算效率,主要技术特点包括:   1.   并
    的头像 发表于 07-09 15:59 922次阅读

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI大幅提升产品设计、营销及物流等方面的运营效率
    的头像 发表于 06-19 14:36 971次阅读

    芯原可扩展的高性能GPGPU-AI计算IP赋能汽车与边缘服务器AI解决方案

    芯原股份 (芯原,股票代码:688521.SH) 日前宣布其 高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能 。通过将可编程并行
    的头像 发表于 06-16 10:44 1117次阅读

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    ,强化与AI、5G等技术的融合,同时通过独立运营提升战略专注度。市场机遇:AI、边缘计算等领域的爆发式
    发表于 04-25 10:19

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率提升

    HarmonyOS应用的AI智能辅助开发助手——CodeGenie,该AI助手深度集成在DevEco Studio中,提供鸿蒙知识智能问答、鸿蒙ArkTS代码补全/生成和万能卡片生成等功能,提升了开发
    发表于 04-18 14:43

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    的端侧部署,Token产生速度提升了40%,让端侧大模型拥有更高的计算效率和推理性能,使端侧AI交互响应更及时,用户体验更贴心。 联发科还与vivo和全民K歌携手,借助天玑
    发表于 04-13 19:52

    DeepSeek推动AI算力需求:800G光模块的关键作用

    数据传输速率,减少带宽瓶颈,成为数据中心和AI集群架构优化的重点。光模块速率的跃升不仅提升了传输效率,也为大规模并行计算任务提供了必要的带宽
    发表于 03-25 12:00

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ...... 2) AI超算革命:FPGA集群功耗比GPU降低62%;混合精度计算效率提升5.8倍...... 3) 6G通信突破:软件无线电实现Sub-6GHz/毫米波全频段覆盖;M
    发表于 03-03 11:21

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。
    发表于 02-15 11:41

    AI需求助力DISCO营收大幅增长

    日本晶圆切割机大厂DISCO近日发布了其本财年度前三季的财务业绩报告。报告显示,受到AI相关需求的强劲推动以及日圆汇率走贬的影响,DISCO的营收和盈利均实现了大幅增长
    的头像 发表于 01-22 15:55 768次阅读

    英国政府计划大幅提升AI算力

    满足学术界和公共服务领域对高性能计算能力的迫切需求。随着人工智能技术的快速发展,GPU作为AI计算的核心硬件之一,其重要日益凸显。 斯塔默首相表示,通过采购这些GPU,英国将能够加速
    的头像 发表于 01-14 14:18 691次阅读

    国芯科技:已结束基于RISC-V架构GPGPU研发

    电子发烧友网报道(文/吴子鹏)近日,有投资者在互动平台向国芯科技提问:请问贵公司是否有GPU研发计划?   对此,国芯科技回答称,“公司与上海清华国际创新中心合作开展了基于开源RISC-V指令架构
    的头像 发表于 12-20 00:15 3733次阅读