0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊云服务为何频繁发生宕机事故

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2021-12-14 14:40 次阅读

电子发烧友网报道(文/黄山明)近日,据外媒报道,亚马逊云服务(AWS)发生宕机事故,导致大面积网站、服务和应用程序瘫痪,直接后果是造成亚马逊电商业务交付混乱、货物堆积。而这也不是今年亚马逊第一次发生服务器宕机事故。

据了解,此次AWS的宕机对于亚马逊配送业务造成严重影响,导致许多司机无法获得配送路线,无法为用户配送快递。同时,使用AWS的众多厂商也受到了影响,如Facebook、迪士尼+、Netflix、任天堂等。

不安分的服务器

就在美国时间12月7日,AWS出现宕机,导致旗下的Prime Music、Prime Video、Alexa在内的大量网站和APP无法正常访问,也让许多使用AWS云服务的企业蒙受损失。

如任天堂便在12月8日凌晨宣布旗下Switch网络服务大规模瘫痪,推测主要原因可能是与导入AWS云服务有关。尽管亚马逊方面迅速进行了抢修,但是此次事故仍然给亚马逊云服务带来了不小的损失。

据相关报告统计,此次AWS云服务器故障导致亚马逊带来的损失或将超过1800万美元(折合人民币1.14亿)。并且这也不是亚马逊今年第一次出现服务器宕机,今年的7月份以及10月份都已经出现过服务网络中断的问题。

当然,服务器宕机的情况并不是亚马逊专属,中国的许多企业便经历过服务器宕机事故。2019年3月份,阿里云出现大规模宕机故障,影响了数量众多的华北地区互联网公司,故障原因是IO Hang(即因为IO错误造成的IO路径阻塞,导致数据拷贝异常缓慢),最终也对阿里云造成了较大的经济损失。

华为云在2020年4月份其位于北京区的云服务器发生宕机,花费了近三个小时才得以恢复,也对相关用户及厂商造成了一定影响。此外,今年7月份,包括B站、豆瓣、晋江等多家大型网站都发生了宕机,导致许多用户无法正常登录浏览网页。

宕机是如何产生的?

所谓宕机即英文直译过来的“down机”,通常指网站、游戏或者网络应用服务器处于非正常运行的状态,服务器处于假死、停止使用或者关闭导致无法正常运行,都能称为宕机。

宕机的产生通常有三个原因,一个是由管理人员主动将服务器重启,用于更新维护;第二个是非主动重启所造成的意外,如供电不足、震动、硬件质量、资源冲突、系统文件损坏、病毒等等;第三是用户访问量过大,导致资源耗尽,数据溢出从而宕机。

当然,理论上来说,访问量大并不会造成宕机,不过当服务器内存满了、CPU性能不足无法处理庞大数据,都会导致信息处理速度变慢,或者拒绝新的服务请求。简而言之,配置过低,加钱就能解决。

另一方面,与个人PC不同的地方在于,服务器基本上全年365天都不会关机,这就导致服务器宕机几乎成为必然。

并且在现实生活中,服务器宕机的情况会更加复杂。通常如今云服务器会有多个节点做负载分散,这样一来哪怕是其他节点都死机,只有一个节点能够工作也不会导致服务器的完全宕机。

如果是在普通情况下的确可行,但是万一遇到一波大量数据来袭,导致其中几个节点暂时性负荷变高,反应速度变慢,那么接下来短时间的所有流量都会被导入剩余的节点当中,导致剩余的节点很难处理过量的数据,最终导致服务器宕机。

也就是说,本来许多所有节点共同参与才能完成的工作,其中有几个节点率先阵亡,导致剩下的节点压力飙升,完蛋是迟早的事。

解决宕机问题,是实现元宇宙的关键

已经明白了宕机如何产生,那么解决服务器宕机的方法通常有两个,一个是及时发现服务器宕机的问题,尽快修复,避免不必要的损失,例如在负载节点还能支持的时候解决这一问题;另一个则是额外准备一个备用服务器,存放的内容相同,但IP不同,并且机房的地理位置也不同,这样发现宕机后能够迅速修改服务器域名,切换至备用服务器解决问题。

但有了解决方案却并不意味着所有的问题都能解决,比如最容易让服务器发生宕机的情况就是访问量数据突然过大,导致服务器无法及时处理导致崩溃。而目前讨论火热的元宇宙,将对云服务器提出更为严峻的挑战。

举个例子,近十数年来双十一都是用户网络购物狂欢的节日,但过去许多用户发现,在双十一当晚零点购物支付时,会发生卡顿或者无法弹出相关界面的问题,就是因为访问量数据突然增大,导致后台服务器无法处理造成系统卡顿的情况。

如今双十一的购物卡顿减少,也是因为阿里提前从外界租了许多服务器为了应对这一局面,而平常并没有这么多服务器来维持运行。

如果元宇宙成真,那么支撑元宇宙的服务器或许将每时每刻都要面临超过双十一数千倍甚至上万倍的访问量,更何况元宇宙中的数据更为复杂,处理时需要的资源也更多。

海量的数据意味着海量的服务器,其背后的成本也将不是某个企业甚至某个国家能够单独完成的。如果还需要准备备用服务器,那么成本更是一个天文数字。

但宕机问题也是元宇宙必须要面对的,想要当做人类的第二世界,如果经常发生卡顿、数据无法访问的情况,那么这个游戏永远也无法被称为元宇宙。

原文标题:不解决服务器这一问题,元宇宙不过是泡沫

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8120

    浏览量

    82529
  • 亚马逊
    +关注

    关注

    8

    文章

    2480

    浏览量

    82379
  • 元宇宙
    +关注

    关注

    13

    文章

    1347

    浏览量

    11005

原文标题:不解决服务器这一问题,元宇宙不过是泡沫

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    通过STM32+ESP8266 Wifi模块 +服务器,做一个数据收发控制的板子服务器方面该如何选择?

    通过STM32+ESP8266 Wifi模块 +服务器 做一个数据收发控制的板子 服务器方面该如何选择?
    发表于 04-25 08:16

    LTE中连接亚马逊网络服务的入门指南

    电子发烧友网站提供《LTE中连接亚马逊网络服务的入门指南.pdf》资料免费下载
    发表于 02-22 09:34 0次下载
    LTE中连接<b class='flag-5'>亚马逊</b>网络<b class='flag-5'>服务</b>的入门指南

    边缘计算新篇章:亚马逊云科技海外服务服务成就全球创新

    2022年亚马逊云科技re:Invent盛会于近日在拉斯维加斯成功召开,吸引了众多业界精英和创新者。亚马逊云科技边缘服务副总裁Jan Hofmeyr在演讲中分享了关于亚马逊云科技海外
    的头像 发表于 12-21 15:45 244次阅读
    边缘计算新篇章:<b class='flag-5'>亚马逊</b>云科技海外<b class='flag-5'>服务</b>器<b class='flag-5'>服务</b>成就全球创新

    公有云频繁宕机,从上云到下云备份如何实现?

    11月27日,某龙头出行服务公司底层系统软件发生故障,导致业务宕机近12小时,有消息称此次事故导致该公司直接损失超4亿;
    的头像 发表于 12-06 14:01 328次阅读
    公有云<b class='flag-5'>频繁</b><b class='flag-5'>宕机</b>,从上云到下云备份如何实现?

    亚马逊云科技实操教学带你注册并使用海外服务

    手把手教你注册和使用亚马逊云科技海外服务器。 前置条件 准备: 一个在用邮箱 一张在用的有Visa或者Master标志的信用卡 一部在用的电话 一个支持key文件导入的ssh客户端 注册亚马逊
    的头像 发表于 11-03 11:27 542次阅读
    <b class='flag-5'>亚马逊</b>云科技实操教学带你注册并使用海外<b class='flag-5'>服务</b>器

    R5300 G4服务器网卡频繁闪断的故障处理方法

    本节描述R5300 G4服务器网卡频繁闪断的故障处理方法。
    的头像 发表于 09-25 10:18 385次阅读
    R5300 G4<b class='flag-5'>服务</b>器网卡<b class='flag-5'>频繁</b>闪断的故障处理方法

    亚马逊扩大在线护理服务 可在全美50个州提供视频医生就诊服务

    随着亚马逊扩大其在线护理服务,人们现在已经可以在全美50个州开始使用Amazon Clinic的视频医生问诊,该服务允许患者与“多个远程医疗服务提供商团体”联系,每个团体都设定自己的
    的头像 发表于 08-16 10:44 443次阅读

    ARM Keil Studio用户指南

    服务。 Keil Studio Cloud展示了下一代IDE技术和CMSIS项目格式的新概念。我们支持一系列软件示例,展示了用于亚马逊AWS物联网、微软Azure物联网中心和谷歌的Keil RTX
    发表于 08-08 06:59

    亚马逊美国站要求提供的FCC认证是什么?

    亚马逊
    jf_68417261
    发布于 :2023年08月04日 15:01:57

    如何使用Alexa语音服务集成在受约束的物联网设备上设置语音命令

    的内存密集型和计算密集型任务卸载到亚马逊管理的服务中。将这些任务卸载到云中,允许基于带片上存储器的微控制器的受限设备支持Alexa。 Voice on Arm是一个原型项目,为基于Arm
    发表于 08-02 12:53

    亚马逊磁铁政策需要提供的标准要求

    亚马逊
    jf_38631377
    发布于 :2023年07月10日 10:43:06

    微博服务器为什么会宕机?这几年为什么极少再宕机了?

    其实服务器崩溃的事件并不罕见,国外的网站也会出现这种问题,例如前几年YouTube出现全球范围内宕机事故,YouTube、YouTubeTV和YouTube music都被波及,大约半小时才恢复
    的头像 发表于 06-19 16:43 881次阅读
    微博<b class='flag-5'>服务</b>器为什么会<b class='flag-5'>宕机</b>?这几年为什么极少再<b class='flag-5'>宕机</b>了?

    HarmonyOS元服务一体化开发快速入门(下)

    数据处理位置。 注意: 由于开发目前仅支持中国站点,请确保项目启用的数据处理位置包含中国站点。无论项目启用的默认数据处理位置为哪个站点,后续开发的服务资源都将部署在中国站点。 6.如在当前团队中
    发表于 06-15 15:52

    HarmonyOS元服务一体化开发快速入门(上)

    一、前提条件 您已使用已实名认证的华为开发者帐号登录DevEco Studio。 请确保您的华为开发者帐号余额充足,账户欠费将导致存储服务开通失败。 二、选择开发模板 1.选择以下任一种方式
    发表于 06-14 17:10

    安全光幕的使用可减少危险事故发生及企业财产损失

    随着工业生产的不断进步,日益现代化,工业领域对于机器生产的要求越来越高,操作员需要操作各种机械设备,工伤事故也会时有发生,受伤的几率会比较大。
    发表于 06-09 14:39 47次阅读
    安全光幕的使用可减少危险<b class='flag-5'>事故</b>的<b class='flag-5'>发生</b>及企业财产损失