0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮云海刘健:“一云多芯+云原生”是算力异构最优解

全球TMT 来源:全球TMT 作者:全球TMT 2023-08-25 05:13 次阅读

浪潮云海秉承开放兼容、分层解耦的技术理念,面向全行业用户提供领先的私有云产品与解决方案,助力企业构建坚实云基座,实现数字化重构与转型。在金融领域的云原生和云计算建设过程中,浪潮云海积累了丰富的实践经验,凭借创新务实的实干理念,以客户需求为核心的服务意识,得到了行业和客户的广泛认可。

本文系浪潮数据云计算方案总监刘健演讲实录,以下内容将从云计算的发展趋势、金融云的趋势及挑战、浪潮云海在云原生基础设施建设过程中的实践成果三部分进行相关经验的分享和观点的探讨。

一、云计算发展趋势:下一代云数据中心

目前,AI5G、大数据这些词汇已和云计算密不可分,在这样的环境下,浪潮云海认为开放硬件、开放软件以及软硬件分层解耦已成为数据中心发展的重要趋势,同时,面对更为多样的计算场景,云计算体系架构的演进、模型即服务、多元算力的管理能力也成为下一代云数据中心的进化方向。

软硬件同步优化

为满足用户对产品性能和使用体验的需求,在倡导软硬解耦的基础上,浪潮云海同样关注软硬件的同步优化。在云计算领域,通过对硬件的深度优化,可大幅提升产品性能,以此解决软件层容器和虚拟化的损耗问题;通过DPU改变底层的高可用架构,从而实现虚拟机高可用的逻辑切换。

广泛的软硬件协同

计算系统架构的解耦和计算设备之间的互操作性是未来计算可持续发展的关键。在网络层面,硬件SDN和网络设备极易绑定,在解耦的阶段,通过云上软SDN和任意厂商网络设备,配合GPU智能网卡加速,就可以做到解除绑定和性能提升;在存储系统层面,也可以通过同样的办法实现存储系统的加速;在安全层面,以DPU做加强,可实现计算机系统负荷的卸载。以上都是通过硬件优化来实现软件的性能提速。

模型即基础设施

随着ChatGPT的持续火热,模型已经和算力、算法一样,成为了下一代云的基础设施标准。但从归属划分上看,公有云上训练得到的模型仍属于公有云,只有在私有云上基于自己的数据进行训练,才能得到专属的大模型,这也是国内大型金融机构目前致力发展的方向。

多元算力

支撑新兴业务发展,助力多元算力场景。现在的数据中心从物理资源层上看基础设施更加多元,X86和ARM设备的混部已成为常态;用户对算力引擎的需求也囊括了虚拟化、裸机、容器,且这一状态将长期持续;算力类型上也从单纯的CPU向GPU、FPGA扩展。

二、金融云趋势及挑战

金融云发展趋势

金融云发展大致可分为三个阶段:IOE时代、业务云化时代、云原生时代。云原生能力又可概括为以下三点:应用的容器化,服务的Mesh化及Serverless。金融IT本质上是为组织和业务服务的,所以上层技术的变化往往源于组织架构的变迁。业务架构从单体、到服务化再到微服务架构,数据架构从统计分析到数据服务湖仓一体,技术架构对应发展到服务网格,最终形成组织架构和开发框架的变革。每个阶段组织架构和技术架构都需要匹配,这是一个逐步演进的过程。

金融云建设挑战

IaaS层的建设经验较为通用,但是PaaS层的建设则更加复杂,对此我们做出以下分析:

IaaS和PaaS都有明显的行业属性,如果一个云厂商卖给所有客户的PaaS都是一样的,则它是不具备行业属性的。每个行业的业务不同,要求的PaaS指标和组件也不同,标准化产品未必适用。

容器即服务,很多场景下用户认为PaaS不好用、不灵活是因为厂商将PaaS的基础设施跟PaaS的服务整合在了一起,极端情况可能是每个产品都附带了容器平台。对此,浪潮云海的建设经验是把PaaS的功能解耦出来,使之成为容器即服务。

在业务层的搭建过程中,我们建议用户建设一个统一的云基础设施,并选择业务可解耦的PaaS厂商,将解耦后的能力架设在统一的容器即服务平台上。

微服务体系的建设也存在多架构并存和逐步演进的过程:在微服务框架里面,Dubbo和SpringCloud是目前较为流行的应用分布式、微服务开发框架,在金融行业应用广泛;而Istio目前的发展趋势则是平台级别的服务治理框架,可进行无侵入的遗留系统微服务改造。当然,微服务架构的选择和平台规划、公司规划是密不可分的,同时也需要逐步去演进。

对于微服务的运维,我们建议将IaaS层和PaaS层打通,形成垂直运维体系。这里面临如下挑战:PaaS组件版本、开发框架多,不同的PaaS组件有不同的硬件资源,导致部署效率低;在业务数据网络隔离的情况下,如何解决PaaS的跨域使用。对此我们建议在网络分区的情况下,根据使用环境需求按需部署、按需编排,并构建统一发放的网络,把中间运维侧打通,通过运维网络将PaaS发放到不同的域里面去,通过就近部署、就近访问,统一运维,实现PaaS层的统一。

三、浪潮云海云原生基础设施创新与实践

目前,浪潮云海主要着力于建设云原生基础设施的底层,参考信通院发布的《云原生能力成熟度标准》,聚焦两个方向来开展工作:第一,技术架构,主要是资源管理、运维保障、研发测试等;第二,业务应用,主要是弹性、高可用、自动化、可观测等。

"一云多芯+云原生"

在金融云的建设实践中,"一云多芯"是金融行业云的一项重要的基础指标。一云多芯"可满足用户算力多样化需求,并且可有效规避算力孤岛;是打破小生态、构建大生态的关键纽带; 并且可有效降低供应链风险 。无论是从业务角度、技术角度,还是产业链角度,践行"一云多芯"已经成为当下及未来云计算产业发展的关键,是产业链相关厂商的必然选择,现在,能源、电力行业也对一云多芯提出了明确的要求。

浪潮云海认为"一云多芯+云原生"是解决算力异构的最优解,我们根据无状态和有状态两种业务形态总结出以下实践经验:

对于无状态应用,基本都基于Java开发,编译过程并不难,重新编译后的应用,都能运行在多芯集群里,对底层CPU或服务器并无太多限制;

对于有状态的数据,最重要的是保障数据库数据无丢失,不一定要追求一云多芯。但可以进行相关尝试,如在一云多芯环境中部署分布式数据库,可以用X86算力支撑primary集群或写操作,用非X86算力承载standby或者读操作,这是数据库一云多芯的一种实现方式。这种模式也可以应用在数据库层面的容灾建设中。

除了考虑业务形态,我们在实践过程中还总结了以下几个建设要点:

集群内的算力自动等价调度:因为不同架构服务器之间有算力的换算问题;对此,我们联合信通院及多家厂商,进行过算力自动等价调度测试;

流量切换:在实践中可通过网关切换来实现;

无感切换:目前我们的产品已经具备这种能力,用户底层基础设施的架构并不会影响上层业务运行,用户可基于不同架构的底层资源进行动态的调整和资源的调用。

微服务架构体系的建设

对于微服务架构体系的建设,如上提到,首先是开发框架的并存问题。对此,我们建议通过配置中心将各架构统管起来,先把共性的东西抽离出来,再进一步做融合。其次是多数据中心的问题,目前用户普遍都有多套数据中心,对此,可以通过级连的方式做管理,用总分总的模式进行管理。

高可用设计

下一代云的高可用设计在云原生层面不难实现,但并不是所有业务都是云原生的,这就使得难以从上层解决高可用的问题。作为基础设施厂商,我们提倡通过底层建设,即使不依赖云原生也能实现高可用。所以对于下一代的高可用架构,我们希望可以在这两个维度上来回切换,同时也希望能打通裸机和虚拟机的控制平面,实现多引擎间的高可用。这其中还有很多挑战,仍需逐步演进。

目前浪潮云海已经服务了15000多家客户,在各个行业全面开花,涵盖金融、能源、交通、医疗、企业、教育等关键领域,是客户数字化、智慧化转型的重要云底座。这其中包括国内最大规模的金融生产云,承载客户的双11业务;最大规模、芯片种类最多的省级政务云,承载4套公共应用服务,104个业务系统;以及汽车、轨交、科学计算实验室等多个千万级大项目。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    38

    文章

    7351

    浏览量

    135722
  • 浪潮
    +关注

    关注

    1

    文章

    404

    浏览量

    23576
  • 5G
    5G
    +关注

    关注

    1340

    文章

    47809

    浏览量

    554351
收藏 人收藏

    评论

    相关推荐

    云原生是大模型“降本增效”的解药吗?

    云原生AI正当时
    的头像 发表于 02-20 09:31 136次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    米哈游大数据云原生实践

    近年来,容器、微服务、Kubernetes 等各项云原生技术的日渐成熟,越来越多的公司开始选择拥抱云原生,并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例,在云上运行
    的头像 发表于 01-09 10:41 265次阅读
    米哈游大数据<b class='flag-5'>云原生</b>实践

    云原生技术前沿落地实践分论坛圆满举办

    12 月 16 日,2023 开放原子开发者大会【云原生技术前沿落地实践】分论坛在无锡成功举办。论坛将聚焦云原生的泛在化、Serverless 化以及智能化等前沿发展趋势,与一线技术专家及最终用户
    的头像 发表于 12-22 09:20 572次阅读
    <b class='flag-5'>云原生</b>技术前沿落地实践分论坛圆满举办

    诚邀报名 | 开放原子开发者工作坊:云原生革新开发模式,开发者如何把握先机?

    在全球数字化转型的浪潮中,云原生技术已成为近年来的热门话题。它改变了传统的开发模式,提升了应用开发和运维效率,助力企业在数字化时代实现业务创新。云原生带来了更高的效率、弹性和可扩展性,确保业务稳定
    的头像 发表于 11-15 18:45 272次阅读

    2023 浪潮云海云图峰会:共建共赢 释放生态价值

    北京2023年9月8日 /美通社/ -- 日前,"云融数智 创领未来"2023浪潮云海云图生态峰会产品技术伙伴专场在北京成功举办。来自开源基金会、云安全、PaaS、数据库服务、容灾备份等领域的头部
    的头像 发表于 09-08 11:49 558次阅读
    2023 <b class='flag-5'>浪潮</b><b class='flag-5'>云海</b>云图峰会:共建共赢 释放生态价值

    中国移动网络云原生演进技术白皮书

    云原生是近几年云计算领域炙手可热的话题。目前,无论互联网企业还是传统企业,都在拥抱云原生云原生是包含系列技术体系、系统设计理念、组织管理方法的全面系统变革,其核心要素包含基础设施云原生
    发表于 08-30 12:15 437次阅读
    中国移动网络<b class='flag-5'>云原生</b>演进技术白皮书

    拓维·梧桐云原生平台夯实企业管理数智化底座

    在数字化时代浪潮下,传统IT应用正在加速向云原生应用转型,云原生正在成为企业数字化转型的重要引擎,为企业数字化管理不断注入澎湃动能。随着数字时代加速到来,处于快速发展期的软件类、互联网企业,往往存在
    的头像 发表于 08-14 10:01 706次阅读
    拓维·梧桐<b class='flag-5'>云原生</b>平台夯实企业管理数智化底座

    拓维·梧桐云原生平台夯实企业管理数智化底座

    在数字化时代浪潮下,传统IT应用正在加速向云原生应用转型,云原生正在成为企业数字化转型的重要引擎,为企业数字化管理不断注入澎湃动能。 随着数字时代加速到来,处于快速发展期的软件类、互联网企业,往往
    的头像 发表于 08-10 18:20 536次阅读

    浪潮云海庞慷宇:产品筑基,生态共赢,云领企业智慧化转型

    北京2023年8月9日 /美通社/ -- 浪潮云海经过13年的发展,到今天形成了以服务器虚拟化、超融合、InCloudOS 为代表的云海产品家族,凭借领先的产品技术能力和丰富的行业实践,满足不同行业
    的头像 发表于 08-09 20:28 719次阅读
    <b class='flag-5'>浪潮</b><b class='flag-5'>云海</b>庞慷宇:产品筑基,生态共赢,云领企业智慧化转型

    华为云发布面向消费终端的企业云原生白皮书,开辟移动时代的云原生路径

    云原生路径何处寻?答案在华为云与华为终端云的牵手中
    的头像 发表于 06-06 17:38 676次阅读
    华为云发布面向消费终端的企业<b class='flag-5'>云原生</b>白皮书,开辟移动时代的<b class='flag-5'>云原生</b>路径

    探索云原生技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会云原生分论坛即将启幕

    随着开源成为软件技术创新和协同发展的重要模式,企业对云原生的认知日益强化,越来越多的企业应用云原生技术与产品解决实际问题,云原生进入落地爆发的关键期。IDC报告显示,2023年企业云原生
    的头像 发表于 06-01 14:48 319次阅读
    探索<b class='flag-5'>云原生</b>技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会<b class='flag-5'>云原生</b>分论坛即将启幕

    探索云原生技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会云原生分论坛即将启幕

    随着开源成为软件技术创新和协同发展的重要模式,企业对云原生的认知日益强化,越来越多的企业应用云原生技术与产品解决实际问题,云原生进入落地爆发的关键期。IDC报告显示,2023年企业云原生
    的头像 发表于 05-30 01:40 377次阅读
    探索<b class='flag-5'>云原生</b>技术发展与应用实践,赋能企业数字化转型 | 2023开放原子全球开源峰会<b class='flag-5'>云原生</b>分论坛即将启幕

    RISC-V入!赛昉科技联合中国电信完成首个RISC-V云原生轻量级虚拟机验证

    构建RISC-V计算生态领先优势的关键环,有助于推动中国电信引领RISC-V上,实现数据中心基础设施自主可控、降低成本等目标。中国
    发表于 05-11 14:08

    中国电信自研 RISC-V 云原生轻量级虚拟机 TeleVM 成功运行,内存开销降低约 90%

    精简指令集特性,裁剪冗余功能,实现了应用安全隔离,同时降低资源消耗并提升响应速度,适用于可信云原生、Serverless、函数计算等新型弹性计算业务场景。” 赛昉科技表示,已交付支持虚拟化指令扩展
    发表于 05-05 09:46