0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云回归云计算本质,CIPU搭配“神龙”、“盘古”、“洛神”,让数据中心更加“绿色”

Felix分析 来源:电子发烧友网 作者:吴子鹏 2022-06-14 00:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)6月13日,在2022阿里云峰会上,阿里云智能总裁、阿里巴巴达摩院院长张建锋表示,阿里云今年最重要策略是“Back to Basic”,回到云计算的本质,坚持技术长征。

阿里云智能总裁、阿里巴巴达摩院院长张建锋

图源:阿里云


围绕这一核心主题,张建锋详细介绍阿里云新一代云数据中心处理器CIPU,以及与其相关联的飞天操作系统、神龙计算层架构等等。

图源:阿里云

专为云数据中心打造的CIPU

从CIPU的名字来看,大家都有一种很熟悉的感觉,因为它和处理器CPU仅仅只有一个字母“I”的差别。但实际上,CIPU和CPU有明显的不同,CIPU是Cloud Infrastructure Processing Units的简称,中文释义为云基础设施处理器,是为新型云数据中心设计的专用处理器。

当然,CIPU和CPU也有一层深层的关系,CIPU在云数据中心领域是CPU的替代者,成为新的算力引擎。

我们先看一下CIPU提出的背景,传统数据中心以CPU为核心进行打造,经过历年来的不断优化,这种方式已经触及到了天花板,在性能、功耗和时延等方面有着明显的瓶颈限制。与此同时,数据中心在需求端的明显变化进一步放大了这一短板,数据密集型的计算需求不断涌现,低时延和高带宽都是必要的参数配置,而满足这些需求的前提是更加低碳环保。

此外,目前全球都在规模性部署超大型数据中心。根据市场调研公司Synergy Research Group的数据分析,目前全球拥有314个超大型数据中心,未来3年的时间内将增加到1000个。张建锋指出,基于CPU为中心的架构无法解决超大规模的复杂管理问题。

作为CPU在云数据中心领域的继任者,张建锋介绍称CIPU主要有以下几点重要特性:

Ø网络:对高带宽物理网络进行硬件加速,通过建设大规模的eRDMA分布式高性能网络,实现RDMA技术的普惠化;

Ø存储:对存算分离架构的块存储接入进行硬件加速,提供超高性能的云盘;

Ø计算:快速接入不同类型资源的神龙计算平台,带来算力的“0”损耗,以及硬件级安全的加固隔离。

上面更多是质变的描述,我们看一下量变的情况。根据张建锋的介绍,CIPU在主流通用计算场景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%;大数据和AI 场景下,AI深度学习场景训练性能提升30%,Spark计算性能提升30%。

在存储方面,CIPU存储时延最低可至30us(PLX),IOPS高达300万,存储带宽可达200 Gbps,全面超越市面上所有云产品。

在网路传输方面,CIPU基础带宽从100G升级至200G,VPC的PPS转发性能从2000万提升至4000万,网络时延从22us降低至16us,RDMA协议下更可低至5.5us。

阿里云CIPU性能参数,图源:阿里云


更需要特别指出的是,CIPU并不是一个独立的高性能硬件,而是一个硬件基础,它可对计算资源进行云化加速,并可部署飞天操作系统对云资源进行管控。和阿里云当前的飞天架构和神龙架构结合,都能够迸发出1+1大于2的效果。

阿里云的软硬件一体化布局

当前,全球数据中心的发展已经步入新阶段,数据中心的构建和对算力的需求都发生了巨大的变化,传统通用处理器已经越来越难以满足这些情况变化。我们看到,不仅仅是阿里云,各个大型数据中心运营商都在致力于自研专用处理器,配合自家的架构体系,以求在功耗、时延和性能等方面打造最佳的平衡。

近几年阿里云在软硬件方面持续投入,收获颇丰,并逐渐实现自家软硬件的深度融合。

回顾2021阿里云峰会,阿里云宣布,飞天操作系统正在全面兼容X86、ARMRISC-V等多种芯片架构,实现“一云多芯”。按照阿里云的描述,“一云多芯”的实现让阿里云成为全球支持CPU种类最多的云厂商。

随后2021阿里云栖大会上,阿里云又发布首款通用芯片倚天710,采用最新ARMv9架构,多达128核,主频最高3.2GHz,可同时兼顾性能和功耗,适配云的不同应用场景。2022年4月,基于倚天710的公共云 ECS实例已上线邀测。硬件方面,阿里云还在去年发布了自研的磐久服务器。

而为了能够最大化释放这些硬件的潜能,阿里云在云数据中心部署各个关键节点都发布了自研的基础架构和核心平台。为解决服务器长久以来的虚拟化性能损耗的问题,阿里云在计算层推出了自研的神龙架构,神龙与CIPU结合,可将虚拟化转移到专用硬件中进行加速,可将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并带来更强劲的性能表现;为提升存储传输速度、安全防护和容灾能力等,阿里云在存储层推出了自研的盘古架构,是阿里云底层的统一存储架构,采用了分布式系统先进的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,大幅提高了存储系统的可靠性和安全性,可支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式;为了实现“让网络更简单”的理念,阿里云推出自研的洛神核心技术平台,支撑起百万级的用户业务部署,让更多能够人体验到云计算带来的高效便捷服务,2021云栖大会上,阿里云更新推出了洛神云网络3.0新平台架构。

在软硬件如此多元化和大范围的投入,阿里云的目的是在提供更好算力支持的情况下,打造更加绿色的数据中心。根据Supermicro发布的《数据中心与环境2021绿色数据中心现状分析报告》,目前全球数据中心已占全球发电总量近3%,预计到2030年将快速增加到8%,也有可能接近一成。

张建锋表示,阿里云是国内最早实践绿色数据中心的厂商之一,目前阿里云自建的数据中心都已达到国家绿色数据中心标准,全年平均PUE小于1.3。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    39

    文章

    8043

    浏览量

    144774
  • 数据中心
    +关注

    关注

    18

    文章

    5773

    浏览量

    75209
  • 阿里云
    +关注

    关注

    3

    文章

    1046

    浏览量

    45870
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国电信与阿里共建粤港澳大湾区首个真武万卡智算集群上线

    近日,由中国电信联合阿里建设的粤港澳大湾区首个真武万卡智算集群在韶关数据中心正式上线。
    的头像 发表于 04-15 10:47 423次阅读

    双芯光缆:数据中心建设的理想之选

    在数字化时代,数据中心作为信息存储、处理和传输的核心枢纽,其重要性不言而喻。随着计算、大数据、人工智能等技术的快速发展,数据中心面临着前所
    的头像 发表于 03-26 10:05 196次阅读

    什么是企业服务器-计算

    地扩展和管理其IT基础设施。华纳的企业服务器基于虚拟化技术,在环境中运行多个虚拟服务器实例,为企业提供灵活的资源分配和管理。 华纳的企业
    的头像 发表于 12-29 17:57 1077次阅读

    科通技术亮相2025上海国际数据中心计算产业展览会

    2025年11月18日至20日,CDCE国际数据中心计算展在上海新国际博览中心成功举办。作为NVIDIA Networking及NVIDIA Jetson的全国总代理,深圳市科通技
    的头像 发表于 12-02 10:21 975次阅读

    大冲能源亮相2025国际数据中心计算产业展览会

    近日,2025国际数据中心计算产业展览会在上海新国际博览中心盛大启幕。作为全球数据中心
    的头像 发表于 11-25 11:30 574次阅读

    物联网数据中心是什么?有什么功能?

    物联网数据中心是集成和管理物联网设备数据的核心平台,具备数据采集、处理、存储、分析、可视化及安全管控等功能,其本质是通过技术融合实现物理世界与数字世界的双向交互与智能决策。以下从定义、
    的头像 发表于 09-22 17:14 1293次阅读

    赛思PTP时间同步服务器推荐 赛思×阿里 |30ns精度编织全球算力无界网

    赛思全球分布式数据中心PTP解决方案,助力阿里加速构建“全球计算一张网”。01阿里
    的头像 发表于 08-15 17:59 2702次阅读
    赛思PTP时间同步服务器推荐 赛思×<b class='flag-5'>阿里</b><b class='flag-5'>云</b> |30ns精度编织全球算力无界网

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI的转型。AI工厂依赖超大规模GPU集群驱动大模型训练,要求网络具备超高带宽与超低延迟;AI则为多
    发表于 08-13 19:01

    阿里设备的物模型数据里面始终没有值是哪里的问题?

    如上图,不知道讲清楚没有。 IG502自定义TOPIC 上发到阿里没问题。采用阿里物模型的格式来上发就不行。请大佬指教!
    发表于 08-05 06:43

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古大模型5.5 宣布新一代昇腾AI服务上线

    HarmonyOS、昇腾AI服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为计算CEO张平安宣布基于CloudMatrix384 超节点的新一代昇腾AI
    的头像 发表于 06-20 20:19 4671次阅读
    华为开发者大会2025(HDC 2025)亮点:华为<b class='flag-5'>云</b>发布<b class='flag-5'>盘古</b>大模型5.5 宣布新一代昇腾AI<b class='flag-5'>云</b>服务上线

    易华录参编的绿色数据中心评价国家标准发布

    近日,我国首部数据中心绿色化评价方面国家标准《绿色数据中心评价》正式实施,标志着在国家层面绿色数据中心
    的头像 发表于 06-07 09:57 1149次阅读

    华为UPS5000-H荣获“计算中心科技奖” 赋能智算中心绿色发展

    探讨智算时代下数据中心的安全可靠、弹性敏捷、绿色低碳发展之道,更见证了华为技术创新的重要里程碑——华为UPS5000-H高效节能超大功率模块化不间断电源,凭借其在数据中心能源解决方案领域的卓越贡献,荣获
    的头像 发表于 06-06 09:27 1048次阅读
    华为UPS5000-H荣获“<b class='flag-5'>云</b><b class='flag-5'>计算中心</b>科技奖”   赋能智算<b class='flag-5'>中心</b><b class='flag-5'>绿色</b>发展

    绿色数据中心 微模块机房集成技术

    绿色数据中心微模块机房集成技术通过预制化、模块化架构实现数据中心基础设施的高效整合与灵活部署,其核心特点及技术创新主要体现在以下方面: 一、核心技术集成架构 一体化子系统整合‌ 微模块机房将供配电
    的头像 发表于 05-23 07:49 943次阅读
    <b class='flag-5'>绿色</b><b class='flag-5'>数据中心</b> 微模块机房集成技术

    磁悬浮冷站引领绿色革命,维谛技术(Vertiv)助力中国电信江西计算数据中心制冷系统实现PUE1.2

    ,如何数据中心既当“最强大脑”又做“节能标兵”?在中国电信江西计算数据中心,维谛技术(Vertiv)搭建的业界首个集成自然冷和余热回收的磁悬浮集成冷站,正在上
    的头像 发表于 05-22 14:18 1014次阅读
    磁悬浮冷站引领<b class='flag-5'>绿色</b>革命,维谛技术(Vertiv)助力中国电信江西<b class='flag-5'>云</b><b class='flag-5'>计算数据中心</b>制冷系统实现PUE1.2

    RAKsmart液冷技术如何实现PUE&lt;1.2的绿色数据中心

    传统数据中心因依赖风冷技术,能源使用效率(PUE)普遍在1.5以上,导致大量电力被用于散热而非计算本身。面对“双碳”目标与可持续发展的紧迫需求,RAKsmart凭借其创新的液冷技术,成功将数据中心的PUE降至1.2以下,为行业树
    的头像 发表于 05-15 09:58 1244次阅读