0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来的AI计算领域,将是CPU、GPU、IPU并行

如意 来源:OFweek电子工程网 作者:Ai芯天下 2020-10-19 16:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言:

AI近些年的大火,直接促进了CPUGPU的发展,而英伟达的GPU真正借此迅速成为AI市场的主流产品之一,其势头甚至盖过了CPU。

而AI应用需要专门的处理器,而IPU正是这样的处理器。目前,AI在各行各业均得到广泛应用,IPU可以基于自身优势为世界的智能化进程增添不竭动力。

未来的AI计算领域,将是CPU、GPU、IPU并行

英伟达专注的GPU优势逐渐缩小

从专注图像渲染崛起的英伟达的GPU,走的也是相当于ASIC的技术路线,但随着游戏、视频渲染以及AI加速需要的出现,英伟达的GPU也在向着GPGPU的方向演进。

当硬件更多的需要与软件生态挂钩时,市场大多数参与者便会倒下。在竞争清理过后,GPU形成了如今的双寡头市场,并且步入相当成熟的阶段。

ASIC本身的成本、灵活性缺失,以及应用范围很窄的特点,都导致它无法采用最先进制程: 即便它们具备性能和能效优势,一旦无法采用最先进制程,则这一优势也将不再明显。

为保持其在GPU领域的寡头地位,使得英伟达必须一直保持先进的制程工艺,保持其通用性,但是要牺牲一定的效能优势。

相比于来自类GPU的竞争,英伟达不应该忽视Graphcore的IPU,特别是Graphcore一直都在强调其是为AI而生,面向的应用也是CPU、GPU不那么擅长的AI应用。

未来的AI计算领域,将是CPU、GPU、IPU并行

利用AI计算打侧面竞争战

不管CPU还是GPU都无法从根本上解决AI问题,因为AI是一个面向计算图的任务、与CPU的标量计算和GPU的矢量计算区别很大。

而另一边的IPU,则为AI计算提供了全新的技术架构,同时将训练和推理合二为一,兼具处理二者工作的能力。

作为标准的神经网络处理芯片,IPU可以支持多种神经网络模型,因其具备数以千计到数百万计的顶点数量,远远超过GPU的顶点规模,可以进行更高潜力的并行计算工作。

未来的AI计算领域,将是CPU、GPU、IPU并行

计算加上数据的突破可以让IPU在原生稀疏计算中展现出领先IPU 10-50倍的性能优势,到了数据稀疏以及动态稀疏时,IPU就有了比GPU越来越显著的优势。

此外,如果是在IPU更擅长的分组卷积内核中,组维度越少,IPU的性能优势越明显,总体而言,有4-100倍的吞吐量提升。

5G网络切片和资源管理中需要用到的强化学习,用IPU训练吞吐量也能够提升最多13倍。

两种芯片势能英伟达与Graphcore的较量

Graphcore成立于2016年,是一家专注于机器智能、同时也代表着全新计算负载的芯片制造公司,其包括IPU在内的产品研发擅长大规模并行计算、稀疏的数据结构、低精度计算、数据参数复用以及静态图结构。

英伟达的潜在竞争对手Graphcore的第二代IPU在多个主流模型上的表现优于A100 GPU,两者将在超大规模数据中心正面竞争。

未来,IPU可能在一些新兴的AI应用中展现出更大的优势。

未来的AI计算领域,将是CPU、GPU、IPU并行

第二代IPU相比第一代IPU有两倍峰值算力的提升,在典型的CV还有NLP的模型中,第二代IPU相比第一代IPU则展现出了平均8倍的性能提升。

如果对比英伟达基于8个最新A100 GPU的DGX-A100,Graphcore 8个M2000组成的系统的FP32算力是DGX-A100的12倍,AI计算是3倍,AI存储是10倍。

AI计算未来有三种计算平台

第一种平台是CPU,它还会持续存在,因为一些业务在CPU上的表现依然不错;

第二种平台是GPU,它还会持续发展,会有适合GPU的应用场景。

第三种平台是就是Graphcore的IPU。

IPU旨在帮助创新者在AI应用上实现新的突破,帮助用户应对当前在CPU、GPU上表现不太好的任务或者阻碍大家创新的场景。”卢涛副总指出。

目前GPU在全球已是大规模的商用部署,其次是Google的TPU通过内部应用及TensorFlow的生态占第二大规模,IPU处于第三,是量产的、部署的平台。

与此同时,Graphcore也在中国积极组建其创新社区。Graphcore已在微信、知乎、微博和GitHub开通了官方频道,旨在与开发者、创新者、研究者更好地交流和互动。

关于未来的AI计算领域,未来会是 “CPU、GPU、IPU并行” 的时代,GPU或部分CPU专注于业务场景的实现和落地,而IPU专为AI创新者带来更多突破。

未来的AI计算领域,将是CPU、GPU、IPU并行

构建生态链条IPU仍在路上

IPU想要在AI计算中拥有挑战GPU地位的资格,除了在性能和价格上面证明自己的优势之外,还需要在为机器学习框架提供的软件栈上提供更多选择,获得主流AI算法厂商的支持。

在标准生态、操作系统上也需要有广泛的支持,对于开发者有更方便的开发工具和社区内容的支持,才能从实际应用中壮大IPU的开发生态。

一个AI芯片从产出到大规模应用必须要经过一系列的中间环节,包括像上面提到的支持主流算法框架的软件库、工具链、用户生态等等,打通这样一条链条都会面临一个巨大挑战。

目前申请使用Graphcore IPU开发者云的主要是商业用户和高校,个人研究者比较少。IPU开发者云支持当前一些最先进和最复杂的AI算法模型的训练和推理。

和本世纪初的GPU市场一样,在AI芯片市场步入弱编程阶段,如今百家争鸣的局面预计也将很快结束,市场在一轮厮杀后会剩下为数不多的参与者做最终对决。

现在要看的是在发展初期的逐一击破阶段,Graphcore是否真有定义并主控第三类芯片的魄力了。

不过从创新的架构到芯片再到成为革命性的产品,Graphcore从芯片到落地之间的距离,需要易用的软件和丰富的工具来支持,特别是对软件生态依赖程度比较到的云端芯片市场。

结尾:

IPU不是GPU,这个可能是最大的一个挑战,但同时也是最大的一个机会。IPU并不是GPU的替代品或者类似品,所以不能拿GPU的逻辑来套用IPU的逻辑。

近两年,AI 芯片出现了各种品类的井喷,可以预计未来IPU在各类AI应用中将具有更大的优势。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226479
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5334

    浏览量

    136234
  • AI
    AI
    +关注

    关注

    91

    文章

    42141

    浏览量

    303134
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI智能体推动芯片需求从GPU扩展至CPU

    4月20日有消息称,摩根士丹利分析指出,随着AI自主性不断提升,其对芯片的需求正从图形处理器(GPU)向中央处理器(CPU)扩展,这一趋势将重塑数据中心建设模式,并促使投资范畴从当前主导AI
    的头像 发表于 04-21 10:55 2284次阅读

    基于openEuler平台的CPUGPU与FPGA异构加速实战

    随着 AI、视频处理、加密和高性能计算需求的增长,单一 CPU 已无法满足低延迟、高吞吐量的计算需求。openEuler 作为面向企业和云端的开源操作系统,在 多样算力支持 方面表现出
    的头像 发表于 04-08 11:02 1483次阅读
    基于openEuler平台的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>与FPGA异构加速实战

    寻找对RISCV众核并行计算感兴趣的伙伴、朋友

    一、我们在RISCV众核并行计算方案包括: 1、众核芯片 自研RISCV CPU IP,和自研NOC IP(片上网络),在单一芯片上利用NOC IP连接几十/几百/几千个以上的CPU核,组成众核芯片
    发表于 03-28 14:41

    寻找对RISCV众核并行计算感兴趣的伙伴

    一、我们在RISCV众核并行计算方案包括: 1、众核芯片 自研RISCV CPU IP,和自研NOC IP(片上网络),在单一芯片上利用NOC IP连接几十/几百/几千个以上的CPU核,组成众核芯片
    发表于 03-28 14:37

    GPU不是AI的唯一解:英伟达用Groq LPU证明,推理赛道需要“另一条腿”

    大会上,英伟达CEO黄仁勋正式发布了Vera Rubin AI超级计算机平台。这一平台的问世,不仅标志着英伟达战略从单一的GPU主导转向涵盖CPU
    的头像 发表于 03-24 11:27 6226次阅读
    <b class='flag-5'>GPU</b>不是<b class='flag-5'>AI</b>的唯一解:英伟达用Groq LPU证明,推理赛道需要“另一条腿”

    AI硬件全景解析:CPUGPU、NPU、TPU的差异化之路,一文看懂!​

    CPU作为“通用基石”,支撑所有设备的基础运行;GPU凭借并行算力,成为AI训练与图形处理的“主力”;TPU在Google生态中深耕云端大模型训练;NPU则让
    的头像 发表于 12-17 17:13 2590次阅读
    <b class='flag-5'>AI</b>硬件全景解析:<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、NPU、TPU的差异化之路,一文看懂!​

    为啥 AI 计算速度这么惊人?—— 聊聊 GPU、内存与并行计算

    提到AI,大家常说它“算得快”,其实是指AI能在眨眼间处理海量数据。可它为啥有这本事?答案就藏在“GPU+高速内存+并行计算”这trio(组合)里。咱们可以把
    的头像 发表于 12-05 14:35 1273次阅读
    为啥 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>速度这么惊人?—— 聊聊 <b class='flag-5'>GPU</b>、内存与<b class='flag-5'>并行计算</b>

    汽车中的GPU是如何使用的?

    。我们从GPU在汽车中的应用场景及其具体需求出发,深入探讨了GPU对汽车行业发展的影响,并对未来趋势提出了关键判断。1、GPU计算在汽车中的
    的头像 发表于 12-03 14:45 9775次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)

    大家都知道,AI计算(尤其是模型训练和推理),主要以并行计算为主。AI计算中涉及到的很多具体算法(例如矩阵相乘、卷积、循环层、梯度运算等),
    的头像 发表于 11-28 08:33 2170次阅读
    一文看懂<b class='flag-5'>AI</b>大模型的<b class='flag-5'>并行</b>训练方式(DP、PP、TP、EP)

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI未来:提升算力还是智力

    本章节作者分析了下AI未来在哪里,就目前而言有来那个两种思想:①继续增加大模型②将大模型改为小模型,并将之优化使之与大模型性能不不相上下。 一、大模型是一条不可持续发展的道路 大模型的不可
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是
    发表于 09-06 19:12

    从自然仿真到智能调度——GPU并行计算的多场景突破

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持随着复杂计算问题的不断涌现,传统的CPU串行计算在处理大规模数据与高并发任务时逐渐显露瓶颈。GPU(图形处理单元)凭借
    的头像 发表于 09-03 10:32 1079次阅读
    从自然仿真到智能调度——<b class='flag-5'>GPU</b><b class='flag-5'>并行计算</b>的多场景突破

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代步伐、介绍新兴领域和最新动向。 这就是《AI芯片:前沿技术与创新未来》的姊妹篇—
    发表于 07-28 13:54

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为
    的头像 发表于 07-09 15:59 2099次阅读

    边缘AI广泛应用推动并行计算崛起及创新GPU渗透率快速提升

    是时候重新教育整个生态了。边缘AI未来不属于那些高度优化但功能狭窄的芯片,而是属于可编程的、可适配的并行计算平台,它们能与智能软件共同成长并扩展。
    的头像 发表于 06-11 14:57 795次阅读