0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云崩了:企业未来该怎么选择云厂商?

YG科技 来源:jf_81200783 作者:jf_81200783 2023-11-23 10:18 次阅读

2023 年 11 月 12 日 17:44 开始,阿里云发生严重故障,导致阿里巴巴大量产品无法连接,一时间,“阿里云盘崩了”、“淘宝又崩了”、“闲鱼崩了”、“钉钉崩了”等话题相继登上热搜。

wKgaomVeA_2AY0gXAAGNlbzRN8g21.jpeg

阿里云出现大规模故障,也成为政企们热议的话题,大家关心的问题在于:公有云到底还安全吗?是否还能继续上云?未来应该采取哪些措施来保障稳定可靠?

不要动摇“上云”的方向

一个不争的事实是:阿里云出现严重故障,给上云企业,特别是核心业务跑在云上的企业带来了损失。

一个是故障波及的范围广,故障期间阿里云控制台无法正常登录,API 调用异常,导致阿里云全系列产品服务及全球区域数据中心都受到了影响;另一个是持续的时间长,故障持续了 3 个多小时才基本完全恢复。据不完全统计,除了阿里系几乎全线产品出现故障外,整数云、理工小蜜蜂、饿乐送、cooleasy、IOTTEC、纳思云、语雀等平台均受到影响。

如此大的影响规模,如此严重的程度,在公有云历史上都非常罕见。于是,有一些人出现了是否继续上云的疑虑,甚至有人说应该退回到过去自建的模式。

笔者首先给出结论:千万不要动摇“上云”的方向。虽然这次阿里云出现的故障很严重,但我们仍不能否认云相比物理主机具有更高的可靠性。

这是因为传统服务器硬件受到厂商品牌、机型、服务器运行时间以及部件型号故障率等诸多因素影响,更容易出现故障,而云服务提供商通常遵循一对多的模型,而且具有专业的基础运维团队和内核团队,能够在出现问题时快速恢复。相比自建机房的方式,公有云不仅运维成本更低,而且运维更专业、可靠。

某电商公司 2018 年投入数百万资金自建物理机房,起初系统稳定性连 90%都达不到,2020 年双 11 大促活动期间,因业务中断两小时,造成高达 100 余万的损失。后来该公司改用移动云云主机,公司业务系统稳定性提高至 99%,建设维护成本下降 60%,问题迎刃而解。

更重要的是,上云相比自建机房更是能为企业带来无可比拟的价值。在数字化转型的大背景下,云作为数字化转型的重要支撑技术,具有按需使用、弹性伸缩、资源共享等优势,可以提升企业的业务敏捷性,降低企业的成本。而且,云计算也是人工智能的基座,只有在云的基础上,企业才能更好地拥抱智能时代。

从千行万业无数企业的实践也能看到这一点。例如,对可靠性要求最为苛刻的金融企业,也在将核心业务上云。以邮储银行为例,其新一代分布式核心系统为全行 6 亿多个人客户提供了日均 20 亿笔的处理能力,联机交易处理效率提升一倍,批处理效率提升 33%。

正如长江黄河不会倒流,上云的大方向也不会因为出现一些坎坷而发生改变。

鸡蛋不要放在一个篮子里

上云的方向没问题,但是上云的路径和具体策略却需要借助阿里云故障时间进行重新审视。

比如对于核心业务上云的企业,就有必要警惕云集中的风险,实施多云战略势在必行。

Gartner 公布的 2023 年三季度新兴风险报告显示,云集中风险连续第二年进入“五大新兴风险”综合榜单,其中中国市场的这种风险尤为突出。正如 Gartner 法律风险与合规实践部门研究总结徐然所说,“云服务集中化风险正在成为大多数企业的共识,许多企业和机构现在面临这样的处境:一旦单个云服务商出现故障,将导致业务发生严重中断。”

破局云集中风险的一个有效途径,就是实施多云战略,就像不要将鸡蛋放在同一个篮子里一样。Flexera 发布的《2021 年云计算市场发展状态报告》显示,有 92%的企业采用了多云战略,就是如此。

采用多云战略的好处显而易见,一方面,企业可以将风险分散,防止出现某个云厂商出现故障时企业业务中断的风险,实现双保险、多保险;另一方面,企业也能选择各领域最优的云服务厂商,形成最佳组合来满足业务需求。

通过这次阿里云宕机事件,还有一个警示意义,那就是必须要重视灾备。事实上,灾备服务也是云相比自建机房的重要优势,云服务提供商通常会提供灾备服务,以满足企业数据安全和业务连续性需求。

但是需要指出的是,不同云厂商的灾备服务能力也是有差异的。例如,华为云就具有同城 AZ(AvailableZone,可用区)内、跨 AZ、异地跨区的两地三中心容灾方案和 1000 公里以上的城市级容灾能力。河钢集团,就采用华为云提供的两地三中心容灾备份方案,实现了系统的平稳可靠运行,任何时候都能实现业务 0 中断。

所以,对于将核心业务放在云上的企业,只有不将鸡蛋放在一个篮子里(多云与多地灾备),才能最大限度保障企业核心数据的安全和业务的平稳运行。

后记:选云,要选可靠的云

毋庸置疑,阿里云这次出现如此大的故障,会对其未来的市场开拓带来负面影响。野村综研(上海)数字化能力中心总监陶旭骏就表示,政府和国企央企市场是云市场的非常重要的客户群,他们对安全性和稳定性的要求是压倒成本和性能的,阿里云会在开拓企业市场时受到挑战。

可以预计,这次事件也会对政企在选择云服务厂商时带来影响,大家会有一个强烈的共识:选云,要选可靠的云。因为,不管是性能,还是成本,都必须有一个前提,那就是高可靠性、高可用性。打个比方,高可靠性和高可用性是 1,其他是 0,如果没有前者,后者也不复存在。

那么什么是可靠的云呢?我觉得,首先要看企业的基因。比如华为云,就根植华为的基因,华为从运营商业务起家,运营商对于产品的可靠性、稳定性有极高的要求,如我们经常听到的电信级要求,要求在不间断运行、高稳定性、可靠性上有 5 个 9 的级别。正是这样严苛的要求,让高可靠性、高可用性刻在了华为、华为云的骨子里,渗透到了血液里。

其次要看企业在高可靠性、高可用性上的技术能力,尤其是运维安全上的内功。事实上,在软硬件迭代加速、企业需求瞬息万变、不确定性加剧的大背景下,云服务的运维也在发生变革,运维既要保稳,也要敏捷。令人欣喜的是,业界的头部厂商正在身体力行地推动运维模式的变革,从运维组织、人员能力、知识体系发展等全维度进行变革,强化稳定可靠性。

稳定可靠一直是各云厂商的业务重点和难点,为此进行了各种组织上和体制上的设计。例如,华为云内部就专门有一种职业,叫做 SRE(SiteReliabllitiyEngineer,站点可用工程师),还系统定义了包括质量管理机制、运维平台等 SRE 的能力体系。京东云通过京东云云泰-稳定性主动管理平台,为客户提供全链路的云上安全保障,其基于混沌工程原理,可以做到先于用户发现问题、先于感知修复问题。金山云服务器带来完善的管理员面板功能,可以让用户快速了解实例情况、配置实例、挂载和扩容硬盘等,随时掌控资源使用情况。

总而言之,针对阿里云出现故障这一事件,需要客观理性看待:既不能因噎废食,改变上云的大方向;也不能置若罔闻,需要对上云的路径和策略进行重新审视,需要对云服务厂商进行全面审视。

只有这样,企业的云上之旅和数字化转型步伐才能既快又稳。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8124

    浏览量

    82538
  • 云服务
    +关注

    关注

    0

    文章

    751

    浏览量

    38631
收藏 人收藏

    评论

    相关推荐

    阿里云大面积宕机,淘宝、饿了么等多产品“崩了”,机房运行面临四大挑战

    电子发烧友网报道(文/吴子鹏)11月12日下午,就在双十一大促的后一天,阿里云疑似发生大规模、大范围故障,导致包括淘宝、闲鱼、阿里云盘、钉钉在内的阿里系产品全线崩溃。一时间,“阿里云盘
    的头像 发表于 11-14 09:05 2220次阅读

    通过STM32+ESP8266 Wifi模块 +服务器,做一个数据收发控制的板子服务器方面如何选择

    通过STM32+ESP8266 Wifi模块 +服务器 做一个数据收发控制的板子 服务器方面如何选择
    发表于 04-25 08:16

    HarmonyOS应用性能与功耗测试

    ,进入到控制台。 选择或者创建一个项目,如果新创建一个项目,注意选择 HarmonyOS。 进入项目空间,在左侧导航栏中选择 测试服务 > HarmonyOS 测试 ,进入
    发表于 12-26 16:39

    【ELF 1开发板试用】+ 8.1 MQTT开发——连接阿里【项目复现】

    MQTT开发——连接阿里【项目复现】 本文基于文档中提供的项目教程,复现ELF 1连接阿里物联网平台,进行MQTT开发;记录ELF1 个人物联网开发的过程,可以提供参考; MQTT
    发表于 12-15 22:00

    突发!阿里崩了:全线产品受影响

    刚刚,看到微博热搜榜,淘宝又崩了、闲鱼崩了阿里云盘崩了、钉钉崩了。。 阿里云公告受影响产品:
    的头像 发表于 11-13 00:26 228次阅读
    突发!<b class='flag-5'>阿里</b>云<b class='flag-5'>崩了</b>:全线产品受影响

    ESP8266-01烧录机智GAgent时SPI Mode选择哪种?

    ESP8266-01烧录机智GAgent时SPI Mode选择哪种?是选择合并的固件还是单独烧写
    发表于 11-10 07:54

    STM32通过NB-IoT连接阿里IOT平台

    NB-IoT技术介绍 整体框架结构 • 硬件连接注意事项 • DEMO运行效果 • 在阿里物联网平台创建并配置产品 • 在平台创建设备 • 常见问题及解决方法 • DEMO运行过程实物演示
    发表于 09-11 07:04

    063. 阿里·无影桌面-试用NX1953 #硬声创作季

    阿里
    充八万
    发布于 :2023年07月06日 02:08:04

    062. 阿里·无影桌面-试用NX1953-续

    阿里
    充八万
    发布于 :2023年07月06日 02:06:55

    【机智物联网低功耗转接板】远程环境数据采集探索

    连接,只接出TXD、RXD两个IO口。机智专注于提供智能服务及物联网的软硬件解决方案 ,帮助传统硬件厂商产品升级,快速实现硬件智能化。机智提供完整的解决方案,让
    发表于 06-27 18:02

    想通过ESP8266连接阿里,固件哪里有?

    想用新唐的板子,通过esp8266连接阿里 有没有测试好的esp8266的固件? 还是说,这个固件要自己修改,自己写?
    发表于 06-27 07:40

    Socionext 利用ZETag ®标签进行资产管理演示实验

    的演示实验,标签采用ZETA LPWA(低功耗广域网)无线通信标准,支持Advanced M-FSK调制方式,即使在无线信号不佳的室内,也能提高通信灵敏度。 2022年9月, ZETA联盟企业在室外
    发表于 05-25 16:31

    f429igt6阿里与iwip对接出现问题怎么解决呢?

    rtt系统使用4.0.1系统。硬件网络选择enc28j60模块 协议栈使用iwip2.0.1 阿里SDK包使用3.0.1 当前通过ping命令测试数据是ping通的。 所以确认网络通信正常。 但是
    发表于 05-17 10:57

    阿里组件的底层HAL TCP相关接口是不是有问题?

    使能AT组件,选择EC200S连接阿里,出现错误,一直解析不出来地址,换的AIR720也是这样,阿里组件的底层HAL TCP相关接口是不
    发表于 05-05 14:41