0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IPU正成为未来数据中心里起舞的精灵 面向微服务创新

脑极体 来源:脑极体 作者:脑极体 2022-09-22 18:58 次阅读

日耳曼神话中,有一种名叫戈兰林(Gremlin)的小精灵。传说这种精灵熟悉各种工具和机械,可以帮助能工巧匠完成种种工作,还可以提升工匠的技术,启迪他们的发明精神。很多时候,工匠们的传统方式方法到达一定瓶颈,就会祈祷小精灵出现,能够帮助他们解决难题。

在我们这个时代,数据中心就是伟大的工匠,肩负着为千行百业打造计算、智能基础设施的重任。当数据重心遇到了工作瓶颈,可能也需要精灵加入他们的工作中。

近日,英特尔携手百度智能云,发布了《为基础设施提供加速引擎 助力塑造未来数据中心》英特尔IPU平台解决方案白皮书,主要解析了英特尔IPU架构的功能和应用,以及如何与百度智能云通力合作打造其全新DPU架构,帮助云数据中心充分释放算力,全面赋能云服务创新。

AI与大数据时代,云数据中心走向计算架构变革成为当务之急。英特尔IPU的发布与实践,可以保持基础设施高性能、高利用率的同时,实现更灵活地资源调配,并使云服务提供商能更快地转向完全虚拟化存储和网络架构,从而极大满足云数据中心的升级需求。

在白皮书当中,我们可以通过云计算中心的发展与挑战-IPU的架构与技术优势解析-英特尔与百度智能云携手进行的实践,三个维度来审视IPU的发展蓝图与价值期待。

数据中心里,小精灵正待起舞。

云数智变革:数据中心的压力与瓶颈

云时代正在蓬勃发展,全新的技术与产业变革正酝酿在云计算产业中。对于云服务商来说,企业创新应用对云数据中心既有能力提出更高需求。随着 5G、AI、边缘计算等前沿技术在更多行业获得落地应用,企业级云服务出现了许多新的变化与趋势。比如说——

更呈分布式的云服务部署:边缘计算等技术的发展推动着云服务由传统的中心云逐渐向“云边端”协同演进,更多云服务被部署在贴近应用的边缘端。

更为广泛的云服务应用场景:云服务正成为更多行业的 IT 基础设施之一,在智能制造、智慧零售、云游戏等新业态中作为主力,支撑企业的数字化、智能化创新。

在这些变化的推动,云数据中心服务器在管理与应用上面临更多挑战。

例如更多虚拟机(Virtual Machine,VM)的部署使虚拟机管理等管理任务变得更加复杂。同时,其能力输出也逐渐从传统单体式应用向微服务化发展,这也进一步提高了云数据中心管理任务的复杂程度,进而占用大量处理器资源。

既要对虚拟机、微服务等开展高效管理,又要对相关的云数据中心的网络、存储等基础设施实现加速,其中的复杂性和资源开销水平不断增加,传统基础架构已经很难满足未来数据中心要求。

随着微服务模型越来越多地用于云数据中心的应用、存储和网络工作负载。可以预测的是,

未来数据中心需要进行以下方面的转型和升级:

1.云原生应用的出现和快速增长推高了对专用基础设施的需求,并大幅提高云服务的敏捷

性以及云数据中心的效率。

2.云服务的微服务化,推动了分布式异构计算环境的发展,而每个微服务都应在更适合其

的加速节点上运行。

3.微服务模型的广泛采用也催生出数据中心编排系统,使各异构计算服务器之间实现微服务分发的自动化及管理。

4.使用微服务、虚拟机、容器以及容器编排的场景不断增加,推动了服务网格的开发。服务网格能够简化微服务到微服务的通信,并使其更加高效。服务网格已经成为云原生堆栈的标准组成部分。

因此,未来数据中心的架构将更多地面向于微服务且日益分散的应用环境而设计,以此来更好利用异构计算带来的加速处理能力。整体而言,未来数据中心架构需要面向微服务与分散应用环境设计,通过异构计算的方式来使数据中心算力设施各司其职,适应分布式部署的特点和需求,以此来应对云时代的产业升级压力。

这种情况下,IPU的诞生与发展就成了顺理成章的事情。

精灵起舞:IPU为数据中心献上时代之变

数据中心在目前阶段必须要完成新的升级与演变,尤其要有新的计算机构出现。未来的数据中心,需要实现大规模分布式异构计算协同工作、无缝连接。尤其是处理基础设施加速的计算单元可以有效负载分担CPU的工作,对于数据中心效率提升至关重要。

2021年,英特尔推出了基础设施处理器(IPU)。作为一种可编程网络设备,英特尔IPU能够助力云和通信服务提供商以及企业提高安全性、节约开销并充分释放中央处理器(CPU)的性能。借助英特尔IPU平台,数据中心可以通过安全、稳定、可编程的解决方案更好地释放计算资源,并实现更高的安全性和隔离性。IPU这个帮助数据中心释放算力的小精灵,可以为云数据中心的微服务创新带来多项优势。

作为全新的产品形态。英特尔IPU在涵盖智能网卡功能的同时,更能为未来云数据中心带来更高级别的安全性和控制力。其优势包括:

1.减少了主机侧处理器中虚拟机管理程序和基础设施堆栈的开销,使更多的处理器资源可用于应用和租户工作负载。

2.从主机侧处理器中卸载了存储堆栈,从而为应用和租户工作负载释放更多处理器资源。

3.卸载了高密集的基础设施任务,如加密和解密以及数据包处理。

4.在极端情况下,英特尔IPU可以卸载整个虚拟机管理程序,释放 处理器所有内核为应用和微服务提供支持,这对于裸金属服务产品来说至关重要。

5.为裸金属和云主机统一云管控创造了可能。

从技术架构角度思考, 英特尔IPU能够为云数据中心带来一系列发展优势,是因为数据中心能够有效地将网络、存储、安全以及基础设施管理等多种能力从处理器卸载到 英特尔IPU,从而实现算力释放,并加速多种基础设施能力。这些能力包括——

1.网络加速:将承载网络 I/O、数据转发等功能的虚拟交换机软件,如 OVS 等从主机侧处理器卸载到 IPU,提升网络吞吐量,减少网络处理时延。

2.存储加速:将 virtio-blk、NVMe-oF 等存储接口、协议栈从主机侧处理器转移到 IPU,提高存储弹性和灵活性,并降低系统复杂性和开销。

3.安全加速:从主机侧处理器卸载大量加密/解密、压缩和其他安全功能。

4.基础设施处理: 将云服务管理功能从主机侧处理器卸载到英特尔 IPU,使虚拟机、容器或裸金属服务的分配和管理更为高效。

除了引入性能更强、且具备灵活可编程特性的硬件来面向特定功能进行优化加速,释放更多

宝贵算力之外,英特尔也赋予了 IPU 产品丰富的软件生态。目前,英特尔正以加速开发平台(Acceleration Development Platform,ADP)为抓手,通过更优生态系统的构建,助力合作伙伴实现云数据中心性能加速解决方案的快速开发和部署。在规划中,ADP 平台将为用户提供通过英特尔开放式 FPGA 堆栈(英特尔OFS)实现的板卡硬件设计、软件、驱动程序以及技术设计支持。用户可以利用这些软件工具与技术支持,加速 IPU 相关产品的开发,并迅速将产品推向市场。

此外,需要注意的是处理器是数据中心的心脏。将英特尔IPU纳入云数据中心架构,可以有效发挥其与处理器之间的系统能力与平台化价值。通过对接英特尔至强可扩展处理器,英特尔IPU能够有效提升云数据中心算力,充分释放异构算力。

在英特尔为用户提供的高效能云数据中心生态方案中,不仅可以通过 IPU 开展能力卸载,对基础设施进行性能加速,也可以引入英特尔至强可扩展处理器来进一步加强算力。通过对算力的“开源节流”,实现更快的数据处理速度、更大的带宽接入能力以及更低的网络时延。

第三代英特尔至强可扩展处理器能够为服务器带来的性能增强包括:

1.更多的内核、更优的架构带来算力性能的大幅提升,可有效应对高密度计算所需;

2.支持更多内存,支持 PCIe-Gen4,可实现更高的每核 I/O 带宽;

3.多项内置加速技术,如英特尔深度学习加速技术(英特尔DL Boost)等可在人工智能等场景提供强大加速能力。

在算力架构中引入英特尔至强可扩展处理器的另一个优势是能够有效提升能力卸载的效率和平滑性。由于主机侧和 IPU 都采用基于英特尔架构的处理器,就能够非常方便地将主机侧运行应用迁移到 IPU ,甚至无需编译即可迁移,大幅提升开发、部署和测试的效率。

在基于IPU带来的一系列价值之下,云数据中心可以持续迈向微服务创新时代,打通未来数据中心之路。

助力巧匠:百度智能云的先驱探索

在白皮书中,我们可以看到英特尔IPU与百度智能云的合作案例与行业示范价值。从双方合作中可以看出,百度智能云成功实现了提升服务器效率,提升安全水平,降低算力综合成本等价值。

在云与AI带来的数智化大潮中,云服务持续向各个领域延伸,并承载越来越多核心业务能力。这也导致云计算服务商正面临着需要更强算力资源、更大带宽接入和更低网络时延的挑战。与此同时,云服务品牌也需要从计算架构革新中获得价值,来确保自身的竞争优势。为此,百度智能云提出云智一体战略,大力发展AI云业务。而AI云服务带来的算力需求指数级提升。面向未来的元宇宙等需求,算力释放还将面临更多挑战。

在这一进程中,百度智能云借助英特尔FPGA 与英特尔至强D处理器带来的高效软硬件可编程的加速,首次推出了自研 DPU 设备——百度太行 DPU1.0。其支持太行弹性裸金属服务,包括网络卸载、PCIe 设备热插拔等功能,让云计算的虚拟化开销很大程度沉淀在网卡上,使云产品的性能大大提升。目前,太行 DPU1.0 产品已在太行弹性裸金属等多种云服务场景中开展应用,并获得了用户的良好评价。实践证明,百度自主研发的百度太行 DPU1.0 可以有效解决云数据中心管理及虚拟化的局限性。

百度太行 DPU1.0 产品配备了 2 个 25G 带宽的光口,并引入英特尔的FPGA 与英特尔至强D处理器作为算力核心,来实现了各项虚拟化功能的卸载,在为用户提供弹性网卡、弹性存储能力之余,还支持 1024 个设备的热插拔。同时,通过将云管控平面卸载到百度太行DPU1.0 中,实现虚拟云主机和裸金属共池,即裸金属可与虚拟云主机被统一灵活调度。来自百度智能云的测试验证表明,百度太行DPU1.0 产品能够为用户提供 1000 万 PPS 的转发率以及 20 万 IOPS 的存储性能。

面向未来,DPU 产品也将成为智能云服务的核心组件,助力IaaS资源的统一弹性底座,进而为用户依托百度智能云开展各类业务创新、实施产业智能化转型提供可靠保证。

IPU带来的架构革新,可以从基座层确保算力最大化释放,释放数据中心的核心竞争优势。从2016年开始,“互联网下半场”开始成为被广泛讨论的命题。如今,在规模化竞争进入收尾阶段,技术创新与精细化服务成为主要竞争点的阶段,“云计算下半场”似乎也已经到来。

在这一产业周期,云计算服务商的竞争力不仅在于基础设施性价比,而是要面向客户提供服务创新、技术创新以及综合价值。这种情况下,云计算数据中心的基础架构创新变得至关重要。它既是算力集约化的保障,也是业务创新的基石。

随着英特尔 IPU 以及基于其参考设计研发的相关产品,在云数据中心的基础架构革新中展现出显著性能优势和市场价值,并逐步形成可持续发展的生态链,英特尔与百度智能云等深度合作伙伴也正围绕云服务的未来发展方向,从软硬件层面开拓更多优化方案。例如通过新的英特尔IPU 平台提供更大网络吞吐量,实现对硬件资源的全面解耦,以及以极低时延实

现端到端的加速等。

面向未来,英特尔计划在 IPU 产品体系上持续发力。英特尔在 2022 年推出两款第二代 200G 的可编程 IPU, 代号分别为“Oak Springs Canyon”和“Mount Evans”。其中Oak SpringsCanyon 搭载了英特尔至强D 处理器与英特尔Agilex™ FPGA 芯片。而Mount Evans 则是英特尔首款基于ASIC 芯片的IPU产品。这两款产品都将具有卸载 200 G工作负载所需的基础设施加速能力,且都可与英特尔至强可扩展处理器协同工作。未来两到三年内,英特尔将推出支持 400 G的 IPU产品,并且在2025年或晚些时候,推出新一代基于 FPGA 芯片和 ASIC芯片的 800G IPU 产品。

与此同时,英特尔也正进一步背靠丰富的开源软件(如基础架构编程人员开发套件(International Package and Development Kit ,IPDK)、SPDK、DPDK 等),致力于通过开放的生态系统、多方位的行业协作以及积极的社区互动,让百度等云服务提供商、云服务最终用户以及其他合作伙伴能加速 IPU 相关解决方案的构建,从云数据中心基础架构的持续革新中撷取更大价值。

未来数据中心正在加速到来,而IPU正在成为其中翩然起舞的精灵。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9398

    浏览量

    168655
  • 云计算
    +关注

    关注

    38

    文章

    7337

    浏览量

    135649
  • 数据中心
    +关注

    关注

    15

    文章

    4170

    浏览量

    69832
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263955
  • 大数据
    +关注

    关注

    64

    文章

    8632

    浏览量

    136568
  • IPU
    IPU
    +关注

    关注

    0

    文章

    34

    浏览量

    15453
收藏 人收藏

    评论

    相关推荐

    港灯打造了面向未来的下一代电力数据中心网络

    通过华为数据中心网络CloudFabric解决方案实现了秒级切换,保障了“业务零中断”和“零单点故障”,港灯打造了面向未来的下一代电力数据中心网络, 为港灯未来全面演进软件定义的
    的头像 发表于 04-16 09:29 137次阅读

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    #mpo光纤跳线 #数据中心光纤跳线

    光纤数据中心
    jf_51241005
    发布于 :2024年03月22日 10:18:31

    模块化机房:数据中心未来

    随着数字化转型加速,数据中心成为企业运营的核心。传统的数据中心面临空间利用不足、能源效率低下、扩展性差和维护成本高等问题。模块化机房应运而生,它不仅克服了传统设计的局限,还为数据中心
    的头像 发表于 03-12 17:26 282次阅读

    #光纤弯曲 #光纤衰减 #数据中心光纤

    光纤数据中心
    jf_51241005
    发布于 :2024年03月08日 09:59:50

    #MPO预端接 #数据中心机房 #机房布线

    数据中心MPO
    jf_51241005
    发布于 :2024年03月01日 11:12:47

    #永久链路 #信道测试 #数据中心

    数据中心
    jf_51241005
    发布于 :2024年02月23日 10:17:58

    #紧套光缆 #松套光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月26日 09:44:11

    数据中心服务器功率一般多大 数据中心服务器操作系统三大类包括

    数据中心服务器功率一般多大: 数据中心服务器的功率大小可以根据具体的需求和规模而定。一般来说,数据中心服务器的功率会相对较大,以应对大量数据处理和存储的需求。根据统计
    的头像 发表于 01-25 10:10 616次阅读

    #光缆水峰 #综合布线光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月15日 09:43:26

    数据处理器:DPU编程入门》读书笔记

    目前业界所公认的以数据中心的体系结构下的创新。综上,DPU对数据中心来说,是通过更明细的分工来实现效率的提升、实现总体系统的成本最优化。 DPU可以从业务应用中将
    发表于 12-21 10:47

    #预端接光缆 #24芯光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2023年12月08日 11:01:21

    大模型时代,数据中心将转向何方?

    数据中心大模型
    脑极体
    发布于 :2023年11月22日 09:01:41

    共话未来智算时代数据中心新机遇|全球数据中心咨询师峰会新加坡站成功举办

    数据中心基础设施是迈向智算时代的基石。2023年10月13日,以“共话智算时代DC未来”为主题的华为全球数据中心咨询师峰会—新加坡站召开,来自亚太地区数据中心行业协会、行业组织、咨询公
    的头像 发表于 10-13 20:45 480次阅读
    共话<b class='flag-5'>未来</b>智算时代<b class='flag-5'>数据中心</b>新机遇|全球<b class='flag-5'>数据中心</b>咨询师峰会新加坡站成功举办

    华为发布《数据中心2030》报告,引领新型数据中心创新与发展

    ,牵引数据中心创新发展。 智能时代加速而来,最大的需求是算力,最关键的基础设施是数据中心。   过去三年间,华为与业界百余名专家学者、客户伙伴及研究院机构深入交流,组织了 50多场专题研讨 ,集业界专家和华为专家的集体智慧,共
    的头像 发表于 09-20 23:30 463次阅读
    华为发布《<b class='flag-5'>数据中心</b>2030》报告,引领新型<b class='flag-5'>数据中心</b><b class='flag-5'>创新</b>与发展