0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让公有云服务“宁安如梦”的“定心丸”在哪里?

jf_81200783 来源:jf_81200783 作者:jf_81200783 2023-11-22 21:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电视剧《宁安如梦》正在热播中,该剧讲述了主人公在经历人生的重大风险后,重获新生再活一遍,以确定性的方式抵御和化解原有的重大风险。然而,在现实的生活中,却没有这样的重来机会。

2023 年 11 月 13 日,Gartner 发布了 2024 全球最终用户公有云支出预测,预计 2024 年将增长 20.4%达 6788 亿美元。“云已经必不可少”,Gartner 分析师认为。但同时,公有云的安全高可用,却成为企业数字化转型的高风险事件。

2023 年,一方面是大模型和生成式 AI 加速了上云进程,另一方面是公有云宕机事件频出而凸显基础质量问题。2023 年是公有云第 17 个年头,公有云也已经渡过了市场炒作高峰期而进入了主流,Gartner 曾预计到 2025 年全球 50%的企业应用将迁移到主流公有云上,但也将带来“云集中”风险——一旦单个云服务商出现故障,将导致业务发生严重中断。

从 2023 年来看,单个云服务商出现重大故障事件,已经影响了市场对公有云可靠性和安全性的信心。例如,2023 年 11 月 8 日,澳大利亚电信运营商 Optus 的一次故障事件导致澳大利亚 40%的人口超过 12 个小时无法正常上网,11 月 12 日阿里云发生严重故障,导致阿里巴巴大量产品无法连接,除了阿里系几乎全线产品出现故障外,整数云、理工小蜜蜂、饿乐送、cooleasy、IOTTEC、纳思云、语雀等平台均受到影响。

随着越来越多的企业上云,从上 IaaS 到上 PaaS 和 SaaS,公有云服务商面临着硬件、软件和服务的多重安全与高可用挑战。

不过,总体来说,公有云出现大面积问题的概率依然很低,公有云仍然是数字化转型的基础设施。而企业上云,特别是大规模核心业务上云的企业,要做好多云战略,选择多个云计算服务商,合理分配资源,做好冗余灾备。那么,如何选一家稳定可靠的云服务商?

搭建稳定可靠的运维体系成为云厂商“必修课”

当前,公有云服务商的规模不断扩大,企业上云进程不断深化,从“业务上云”迈向“深度用云”已经成为行业共识。根据 Gartner 的 2022~2024 全球最终用户公有云支出数据及预测,PaaS、SaaS、BPaaS 和 DaaS 等支出占公有云支出的 75%,其中 PaaS、BPaaS 和 DaaS 支出占了近 40%。也就是说,越来越多的企业用户直接在公有云上开发和部署应用。

对于公有云服务商来说,IT 运维正在面临着颠覆性的变化,正从保障设备稳定的防守型运维转向支撑业务敏捷的进攻型运维,从关注自身平台转向关注客户应用,这个转型的过程对公有云服务商提出了艰巨挑战,特别是当越来越多的政企客户将自身的业务直接连入公有云平台时,如何从硬件、软件和服务等维度,既保证客户业务的快速迭代又保证业务的安全稳定高可用,这是公有云服务商生存和发展的根本。

以华为云为例,过去几年的高速发展,业务量上千倍的增长,经历了从“慢”向“快”的转变,运维如何经受考验?这个过程中也经历了深刻变革。华为云基于 ITIL 标准,打造标准化运维管理体系,引入 SRE 文化,构建 SRE 确定性运维体系,同时实施高可用架构与方案,引入动态风险治理,以及不断探索 AIOps 智能运维。

华为云从 2017 年开始实践 SRE,目前已经成为国内最大的 SRE 团队之一。本质上,SRE 是用软件工程的思维和方法解决复杂的运维问题,从被动响应为主,演进为构建主动预防式运维的软件工程能力为主。在实践积累的基础上,华为云 SRE 提出了“确定性运维”理念,即通过一套完备的工程方法,以华为云 SRE 的高可用架构设计、动态风险治理和高度智能的运维框架,让现网拥有确定性的质量结果,支撑高质量运维实现。

高可用架构是华为云 SRE 的一大亮点,高可用架构让华为云服务的软件在前端就具备高可靠、高可用的能力,具有确定性的失效率、确定性的恢复时长结束、确定性的爆炸半径。从 2017 年起,华为云 SRE 团队积极介入到云服务的开发前端,将后端的运维经验和运维诉求带到前端的开发设计过程中,使得现网在出现非预期的故障时,通过提前预埋的可恢复性和爆炸半径控制能力,迅速隔离影响,实现即时恢复。

此外,华为云高度重视数据中心灾备性能,提供同城 AZ(AvailabilityZone)内、跨 AZ、异地跨 Region 的两地三中心容灾方案和 1000 公里以上的城市级容灾能力,支持流式容灾,保障业务平稳运行,避免单点、多点故障造成客户业务停顿。

京东云则通过混沌工程理论,结合多年稳定性治理经验入手,建成京东云云泰稳定性主动管理平台。实现主动发现和治理业务连续性风险,提供一站式可见、可查、可管、可控的治理方案,力求做到先于用户发现问题、先于感知修复问题,为云平台稳定、云上业务稳定提供商业服务的可用性从 99.975%提升为 99.995%。

可用性的扎实内功,才是云客户的“定心丸”

趣丸科技是一家集兴趣社交、电子竞技、人工智能于一体的创新型科技企业。华为云承载趣丸 70%以上的 IT 业务运行,包含计算、存储和网络等基础底座,业务运行还使用了华为云大量的数据库、中间件等高级服务,华为云为趣丸核心业务的高可靠、高稳定运行提供 7*24 保驾护航。

更进一步,华为云基于确定性运维实践,帮助趣丸在大模型时代下,应对业务上云后的安全可信、稳定可靠、资源高效、业务敏捷等挑战,进一步探索 LLMOps 等,加速企业高质量增长,让运维成为智能世界变革的加速器,推动趣丸科技的用户粘性不断增强。

服务所有“华为”品牌的各类终端的华为终端云更为典型。作为华为云的最大内部客户之一,华为终端云从 2017 年开始全面上云。华为终端云业务承载了全球十亿级用户,业务场景越来越多,运维场景也越来越复杂。通过建设 SRE 能力,华为终端云全球三个运维中心有效协同,保障连续 5 年业务可用性 SLA99.99%,达成无重大连续性和安全事故的挑战目标。

在汽车行业,数字化转型是一个复杂过程,需要解决业务系统庞大、业务系统应用多、分布广、跨系统、跨区域、跨应用的调用频繁等问题,业务所用的系统由成百上千个应用服务组成,服务之间的关系错综复杂。华为云通过应用运维管理服务(AOM)、云日志服务(LTS)、应用性能管理服务(APM)等服务,实现全链路管理,提高运维效率,帮助汽车业务应用系统稳定运行,提升用户体验。

“让稳定可靠成为华为云核心竞争力”,这条横幅挂在松山湖华为云运维中心最醒目的位置,华为云提出的“一切皆服务”之“根”是质量和平台的稳定性。华为公有云业务总裁高江海曾表示,唯有时刻保持敬畏之心,才能真正服务好客户、有质量地“活下去”。

这或许也是所有云厂商未来最核心的竞争力之一。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云服务
    +关注

    关注

    0

    文章

    867

    浏览量

    41132
  • 华为云
    +关注

    关注

    3

    文章

    2837

    浏览量

    19403
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在哪里可以下载 MOSFET 布局?

    “我用MW6S004N设计了一个功率放大器,但在绘制布局时我无法导入它。它表明我的库不包含此设备。我在哪里可以下载它?
    发表于 04-27 07:48

    科技经营模式与价值体系说明

    核心业务科技提供基于软件定义广域网的智能网络连接解决方案,并深度整合各类服务公有、私
    的头像 发表于 03-25 10:02 1508次阅读
    <b class='flag-5'>云</b>边<b class='flag-5'>云</b>科技经营模式与价值体系说明

    贴片都在哪里做的?

    你们贴片都在哪里做的?
    发表于 02-26 18:02

    什么是企业服务器-计算

    企业服务器是指为企业提供的基于计算技术的服务器解决方案。华纳是一家计算
    的头像 发表于 12-29 17:57 1264次阅读

    凯米斯科技:实时水质监测筑牢塘口防线

    ,蓝藻、微生物病害也少了,连水环境都越养越稳——这就是实时水质监测给塘口养殖的“定心丸”。作为塘口养殖水质监测的专业服务商,凯米斯科技针对塘口水质参数多样化的特点
    的头像 发表于 12-04 14:59 453次阅读
    凯米斯科技:实时水质监测筑牢塘口防线

    AcrelCloud-1000变电所运维平台:现代医院安全运行的“定心丸

    安科瑞 王晶淼 咨询家Acrel-wjm 一、背景 医疗配电系统是医院安全稳定运行的核心基础,直接关系到医疗设备的正常运转、生命支持系统的持续稳定以及全院的用电安全。根据《综合医院建筑设计规范》(GB51039-2014)的相关要求,电力信息化系统应具备能源分析、负荷管理、应急供电监测与安防报警等多项功能。 二、项目概况 本项目为江苏省某医院的配电房改造工程。该医院不仅配备了大量诊疗设备,还承担多项科研任务,医疗技术实力突出。在这里,
    的头像 发表于 11-26 16:13 682次阅读
    AcrelCloud-1000变电所运维<b class='flag-5'>云</b>平台:现代医院安全运行的“<b class='flag-5'>定心丸</b>”

    科技报到:AI变革需要‘减脂增肌’

    产业的锚点到底在哪里?
    的头像 发表于 09-25 09:20 590次阅读
    科技<b class='flag-5'>云</b>报到:AI变革需要‘减脂增肌’

    发提问贴在哪里输入标签

    发提问贴在哪里可以输入标签呀
    发表于 09-14 11:30

    实现环境计算真正的瓶颈究竟在哪里

    20世纪90年代初,计算机科学家Mark Weiser提出了“泛在计算”的理念,其核心思想是技术融入日常生活环境中[1]。尽管智能家居组件、传感器网络和智能设备取得了进展,但环境计算这一概念依然难以实现。如今,我们已经拥有了硬件基础和连接能力。那么,真正的瓶颈究竟在哪里
    的头像 发表于 09-10 16:21 1052次阅读

    启源芯动力移动补能方案成山西工地“定心丸”,护航绿色施工

    地输送电力,电动自卸车始终动力满满。这项以应急保障为核心的服务,既助力降本减碳、筑牢绿色施工根基,又像定心丸般守护着工程按计划推进。曾施工方头疼的现场电力条件有限
    的头像 发表于 08-27 09:48 1128次阅读
    启源芯动力移动补能方案成山西工地“<b class='flag-5'>定心丸</b>”,护航绿色施工

    给光伏系统安颗 “定心丸

    安装光伏系统,最怕的就是后期频繁出问题 —— 线路发热、接头进水、冬天冻裂…… 而惟兴科技光伏连接器,就像一位靠谱的 “管家”,从电流传输到环境适应,全方位守护系统安全,用户既省心又安心
    的头像 发表于 07-29 16:46 794次阅读

    请问USB2CAN驱动程序在哪里

    USB2CAN驱动程序在哪里?它没有像说明书中所说的那样附带 SSCB 演示 GUI。CH341SER.exe 在哪里?我在您令人沮丧的支持网站上找不到它。我无法连接到我的 REF_SSCB_AC_DC_1PH_SiC
    发表于 07-24 07:09

    福禄克环境监测产品概述

    "药柜里一片降压药,生产线上一支疫苗,冷链车中的抗癌制剂——它们的质量安全,都始于一个看似简单的数字:温湿度。当药监老师突袭检查时,当海外客户索要环境数据时,当午夜警报器突然响起时...药企人最需要的,正是一颗能对抗环境失控的'定心丸'。
    的头像 发表于 07-22 14:07 1186次阅读
    福禄克环境监测产品概述

    高温季来袭,工业通信设备如何筑牢生产“防波堤”?

    威产品以其可靠的工业品质,夏季生产少一份意外停机的焦虑,多一份全天候运转的底气 —— 这正是高温季里,企业最需要的 “定心丸
    的头像 发表于 07-17 09:35 1764次阅读
    高温季来袭,工业通信设备如何筑牢生产“防波堤”?

    自建私有vs.公有:长期成本建模深度分析

    私有需承担高额初始投资(硬件、软件、数据中心)和长期运维成本,但适合负载稳定、数据敏感的场景;公有以按需付费降低门槛,适合业务波动大或快速增长的需求,但长期使用可能面临规模成本暴增和隐性费用。混合
    的头像 发表于 07-11 09:40 1954次阅读
    自建私有<b class='flag-5'>云</b>vs.<b class='flag-5'>公有</b><b class='flag-5'>云</b>:长期成本建模深度分析