0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云计算三大神器CPU、GPU、DPU!

SSDFans 来源:ssdfans 作者:ssdfans 2020-11-13 14:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近又读了阿里巴巴的技术委员会的新书《弹性计算》,从序上看的确很新,2020年7月。在疫情这个年代,短时间内出版再次证明了中国人民的伟大。关于书中的内容,不想再多说。俺几个小时读下来,挑了几个错别字,以后找各位大佬领赏了。

其中印象深刻的是,为什么有神龙裸金属服务器,对RDMA的支持是一个关键的场景。在云计算中引入RDMA,目的也很明确-HPC。HPC是老黄的老巢,也是老黄现在整合网络,计算和存储的试验田。有了Mellanox,ARM加持,老黄提出了自己的口号:

CPU,做业务的编排,框架

GPU,做计算

DPU,数据的搬运和服务

不得不讲,老黄的市场部很强大,DPU就这样横空出世了。对比我司万能的P2P[1]的功能,我们就是简单说P2P,不知道的人以为我们就是个金融片子,悲催的我司没赶上匹凸匹的好时光。人家老黄不对称的P2P实现就有一个响亮的名字,GPUDirect。同样,老黄的Tensor Core也有一个土鳖的名字,DSP

这里就来谈谈这个RDMA,RDMA的优势和劣势都很清楚。在过去的10几年中,mellanox作为另类的以色列公司持续投入了很多年。(大部分以色列公司的套路是第一代产品创新,卖公司。公司卖不掉,第二代产品就SoSo了,如果有第三代产品,可以真接pass了)。

在Flash刚刚进入数据中心的时候,大家都在考虑DAS到SANder问题,什么样的网络最合适。

其中试过PCIE 外接,AMD的HT,等等。就像一位做HPC出身的朋友讲的一样:“没几年就会冒出了一堆硬件公司,然后大家就上一把,然后大部分公司都死掉了”

因此,可以看到IB versb在2010年成为主流,在HPC中目前已经已有疲态了,正是把这个HPC的专用技术用到hyperscale数据中心的好时机。

第一个规模使用IB而成功的案例是Oracle 的Exadata[1]

之后就是大量的SDS存储的公司起来了。Flash+RDMA是大家的标配。直到Microsoft在数据中心中规模部署。其实之前的RoCE本质上还是一个channel的协议,和之前的FCOE类似,只是在RoCEv2的时候,因为Microsoft的加持,从真正成就了Mellanox,同时把原来最擅长存储的Iwarp打进了小众市场,但是目前IBM和Netapp依然在坚守。

原来一个Intel的网卡大佬就很不服气,“我们做网卡快20年了,Mellanox的ethernet 网卡到现在都有很多功能不支持,但是他们咋就成了先进技术了,成了Smartnic呢?”。这样的话,当年EMC也说过Fusion-io这样的startup。

不管结果如何,Microsoft和Mellanox在Data Center Network的深度合作,让Mellanox在25G成功上位。取代了Intel和Broadcom在高端网卡的江湖地位。

当年在见识了Annapuna的EBS性能之后,我在加入新公司时就对大佬说要做RDMA,要做RoCEv2。但是大佬就是大佬,他们认为lossless的网络一直就是一个传说。而且,那个时候AI正在风口上。总之,这个事情也让我看清了一个事实,就是Hyperscale用RDMA,只会有两种配置:Mellanox的RDMA,以及他们自己的RDMA。

这个微软是最先这么考虑的,他们就是认为RDMA只有两种。微软内部实现的RDMA的细节很少有透露,知道的大佬欢迎分享。

但是另一个大佬的AWS的RDMA就有很多细节。拿另一个常常教育我的大佬的话:" 他们想做什么都在EFA的驱动里写着!!!“。在火焰图流行的这个时代,静态分析的确有点反人类。

比较好的是,作为HPC RDMA权威的熊猫教授率先被AWS的EFA招安,他们在SC19以及今年发表很多关于EFA的详细信息[2]。当然还有Annapurna CTO Nafea 同学的软文[3]

熊猫教授的一个学生做了Azure和AWS的RDMA性能的分析,因为过于敏感,自己关心的人可以去了解。但是以后估计每家大厂炫耀的资本里面会很快有一个:“我的RDMA是自研的,是XXXCloud特色的RDMA!”

--"老黄你怎么办呢?"

"DPU,DPU+GPU,DPU+GPU+CPU。。。。。。。"

--"Chiplets 要不要考虑一下?"

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11326

    浏览量

    225874
  • 云计算
    +关注

    关注

    39

    文章

    8042

    浏览量

    144758
  • DAS
    DAS
    +关注

    关注

    1

    文章

    119

    浏览量

    32551

原文标题:云计算三大神器来了!CPU、GPU、DPU!

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    内存要取代GPU?HBM之父警告:以英伟达GPU为核心的架构要被颠覆

    主板和CPU成为了主角。   而最近“HBM之父”金正浩教授也语出惊人,提出未来内存将成为主角:“GPUCPU将会被集成到内存(HBM和HBF)里,沦为内存中的一个组件”。   倒反天罡,在内存里装
    的头像 发表于 04-03 09:54 6927次阅读
    内存要取代<b class='flag-5'>GPU</b>?HBM之父警告:以英伟达<b class='flag-5'>GPU</b>为核心的架构要被颠覆

    AI智能体推动芯片需求从GPU扩展至CPU

    GPU进一步延伸。   摩根士丹利在周日发布的说明中提到,随着人工智能从内容生成向自主行动转变,计算瓶颈正逐渐转向CPU和内存,进而推动通用计算强度发生阶跃式变化。不过,该机构也强调
    的头像 发表于 04-21 10:55 1534次阅读

    基于openEuler平台的CPUGPU与FPGA异构加速实战

    随着 AI、视频处理、加密和高性能计算需求的增长,单一 CPU 已无法满足低延迟、高吞吐量的计算需求。openEuler 作为面向企业和云端的开源操作系统,在 多样算力支持 方面表现出色,能够高效调度
    的头像 发表于 04-08 11:02 654次阅读
    基于openEuler平台的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>与FPGA异构加速实战

    中关村计算产业联盟党建交流活动在中科驭数圆满举办

    活动伊始,与会人员参观了中科驭数 DPU 展厅,深入了解 DPU 技术在计算领域的创新应用与发展前景。
    的头像 发表于 01-23 15:20 719次阅读

    RSoft GPU加速技术重塑光子元件设计效率革命

    设计效率。为了解决这个问题,RSoft 光子器件工具的 FullWAVE FDTD 模组中引入 GPU 加速,通过 NVIDIA GPU 的平行运算能力,使得模拟速度相比 CPU 计算
    的头像 发表于 01-12 14:09 409次阅读
    RSoft <b class='flag-5'>GPU</b>加速技术重塑光子元件设计效率革命

    什么是企业服务器-计算

    企业服务器是指为企业提供的基于计算技术的服务器解决方案。华纳是一家计算服务提供商,为企业
    的头像 发表于 12-29 17:57 1061次阅读

    晶丰明源推出第二代Smart DrMOS及配套Vcore电源解决方案

    在人工智能、元宇宙、计算与自动驾驶等前沿技术加速迭代的驱动下,市场对CPUGPUDPU及ASIC等核心处理器的算力需求呈指数级增长。此
    的头像 发表于 11-18 15:46 1590次阅读
    晶丰明源推出第二代Smart DrMOS及配套Vcore电源解决方案

    RISC-V DPU,重塑数据中心算力格局?

    电子发烧友网综合报道 在现代数据中心架构中,数据处理单元(DPU)正迅速崛起为继 CPUGPU 之后的第颗核心芯片。DPU 专为数据
    的头像 发表于 09-13 00:51 5033次阅读

    从自然仿真到智能调度——GPU并行计算的多场景突破

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持随着复杂计算问题的不断涌现,传统的CPU串行计算在处理大规模数据与高并发任务时逐渐显露瓶颈。GPU(图形处理单元)凭借
    的头像 发表于 09-03 10:32 988次阅读
    从自然仿真到智能调度——<b class='flag-5'>GPU</b>并行<b class='flag-5'>计算</b>的多场景突破

    CPUGPU,渲染技术如何重塑游戏、影视与设计?

    渲染技术是计算机图形学的核心内容之一,它是将维场景转换为二维图像的过程。渲染技术一直在不断演进,从最初的CPU渲染到后来的GPU渲染,性能和质量都有了显著提升。从
    的头像 发表于 09-01 12:16 1117次阅读
    从 <b class='flag-5'>CPU</b> 到 <b class='flag-5'>GPU</b>,渲染技术如何重塑游戏、影视与设计?

    PCIe协议分析仪能测试哪些设备?

    ) 测试场景:验证CPU与PCIe设备(如GPU、FPGA)之间的数据流,优化任务调度和数据流。 应用价值:在异构计算环境中平衡计算资源,减少数据传输瓶颈。 二、存储设备 NVMe
    发表于 07-25 14:09

    硅谷GPU服务器是什么意思?使用指南详解

    硅谷GPU服务器本质上是一种IaaS(基础设施即服务)产品,它将物理服务器上的GPU资源通过虚拟化技术分割成可弹性调配的服务。与普通CPU
    的头像 发表于 06-16 09:41 727次阅读

    (ST大赛等奖作品)超声波自拍神器实例项目

    (ST大赛等奖作品)超声波自拍神器电路图:
    发表于 05-28 21:04

    届NVIDIA DPU黑客松开启报名

    届 NVIDIA DPU 中国虚拟黑客松(Hackathon)将于 6 月 28 日 - 6 月 30 日正式开启!作为备受广大开发者期待的年度赛事,它将提供与 NVIDIA 加速网络技术深度
    的头像 发表于 05-27 10:16 1008次阅读

    Imagination与澎峰科技携手推动GPU+AI解决方案,共拓计算生态

    近日, Imagination Technologies 与国内领先的异构计算软件与智算混合服务提供商 澎峰科技 ( PerfXLab )正式签署合作备忘录( MoU ),围绕 GPU 与 AI
    发表于 05-21 09:40 1293次阅读