0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广东电信发生历史性故障,波及全省电信用户,容灾机制不起作用?

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-06-10 00:11 次阅读

电子发烧友网报道(文/吴子鹏)6月8日,广东电信发生重大故障,导致广东电信全省本地及漫游用户通话异常。当天16时左右,陆续有网友在社交媒体上发文指出,使用电信卡的手机无法通话和通信。“故障发生后,自己尝试了拔卡重启、检查手机硬件、充话费等不同方法,依然无法解决问题。”

随后不久,中国电信广东客服回应称,“因网络异常,影响部分移动用户接听电话,我们正在进行抢修,由此给您带来的不便,我们深表歉意,感谢您的理解和支持。”而后在8日18时左右,中国电信广东客服又补充发文表示,“经紧急抢修,自16:30起,受影响的用户正逐步恢复,对在此期间受到影响的客户表示真诚的歉意。”

到了19时左右,此官微又发布了一条消息称,“截至目前,受影响的移动用户接听语音业务已全面恢复,给您带来的不便我们再次深表歉意。”

wKgaomSC-v2AOkPXAAGc2MttXkA970.png
图源:中国电信广东客服官微


对于此次故障的具体原因,中国电信官方还没有公布。不过,针对这起历史性的电信事故,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。

跳出事件本身来看,电信系统到底是如何运营的呢?容灾系统不起作用原因有哪些呢?


解密电信网络系统

对于电信网络的运转,其上方有两套系统,分别是上层IT软件和底层基础硬件

其中IT系统又可以分为BSS、OSS、MSS和EDW。BSS(Business Support System,业务支撑系统)和OSS(Operation Support System,运营支撑系统)合称为BOSS系统,也就是电信业务运营支撑系统。BOSS系统以客户服务、业务运营和管理为核心,支持客户服务和计费等关键事物的运转。

在BOSS系统中,BSS实际上是具有主动式管理能力的。这种能力让运维人员在故障发生之前就能够提前介入处理,消除系统故障带来的潜在风险,是运营商系统层面提升客户满意度的关键功能。不过很显然,在此次广东电信故障事故中,BSS系统并没能起到主动式管理的作用,从这个层面来看,这次的事故突发性很强。

MSS(Management Supporting System,管理支撑系统)负责IT系统的规划和窗口展现,帮助电信运营商实现业务和市场需求更好地结合,并提升企业管理和IT系统升级的效率,也对企业运营效率提升有帮助。

EDW(Enterprise Data Warehouse,企业数据仓库)主要负责数据存储和信息化管理。

IT系统是电信运营商业务的神经枢纽,当然其运转还需要部署在底层的硬件设备上。在介绍底层硬件结构之前,我们先结合下图看一下电信业务是如何运转的。如下图所示,无论是电话业务,还是移动手机业务,最终都需要连接到核心网。

wKgZomSC-0WAKTCAAADAlNCv1Ew772.png
电信业务服务架构示意图,图源:华为培训


再看一下另一张图,宽带业务实际上也是如此,全部业务支撑最终都要回归到核心网层面。

wKgaomSC-1-AAC6fAACTiq1CfBA829.jpg
宽带业务示意图,图源:华为培训


所以,这就是为什么运营商很多时候被称为“管道商”。实际上,所有的电信运营业务都像是水管一样,网络流量由核心网分化而来,每一项业务都是基于管道里的流量,从骨干网分流,如下图所示。

wKgZomSC-2qAADijAAQloGJlo1o863.png
电信网络分流示意图,图源:中国电信


当然,网络是一个相对虚化的概念,具体还是要靠设备来支撑。在整个网络架构中,三种设备最为常见和关键,分别是路由器、交换机和核心交换机。如下图所示,无论网络在核心网、IP传输网还是业务网上传输,依靠的都是交换机来中转。

wKgaomSC-3aAEo_JAAlLlihg17Q604.png
图源:广州移动培训资料


运营商在建设网络时,一般会选择使用多台核心交换器来构建超级节点,超级节点基本只存在北上广等重要节点城市部署,负责国际和省际之间的网络传输,也构成了核心网传输的第一平面。这个平面包括超级节点及其链路,以及各省第一出口链路。当然,骨干网络还有第二层,由普通核心节点到超级节点的链路和各省第二出口链路组成,负责跨大区域间的流量转发,大约全国2/3的流量都在这个网络上跑。如下图所示,为了增加网络接入的效率,在节点上将流量进一步分流,也就到了基站和普通交换机/路由器一端,方便用户的接入。

wKgaomSC-7KATgerAASklQxDEfo455.png
网络接入和传输示意图,图源:华为培训


那么,很显然一个普通的路由器和交换机是很难让一个省的网络全部出现问题的,很可能就是核心交换机出现了问题,影响骨干网的传输,导致一个省没有网络流量入口。

虽然二层网络已经推出很多年,不过目前依然是电信运营商主要采用的骨干网架构。虽然二层网络的扩展性不好,不过其跨域传输的性能很出色。当然,这也造成了一个问题,那就是看似互联互通的网络,会存在一些重要的节点,这些节点是不容有失的。

电信网络的容灾机制

电信网络是一个关系到国计民生的领域,因此在构建的过程中,是需要具有容灾机制的,面对一些突发的挑战。

我们上面已经提到,电信网络基本靠两套系统在运作,一个是IT系统,另外一个是底层设备。由于用户信息和业务高度集中,因此每一个电信业务开始部署时都有一套“plan B”,也被称为容灾措施,主要是为了应对突发的火灾、洪水、飓风和其他突发因素等。

据介绍,除了在BSS系统中加入故障预判的机制以外,电信系统在硬件层面具有多层容灾措施,包括单板主备容灾、设备主备容灾、网元主备容灾、同城异域容灾以及异城异地容灾。通过多维度丰富的容灾措施,一般在重大故障之后,电信运营商都能够很快地恢复网络。

上一次发生地域性大规模断网是在郑州大洪水期间。由于数十年难得一见的洪水,导致郑州骨干核心机房和主备机房全部被水淹。最终,为了让郑州市民能够尽快使用网络,启动了异城异地的容灾机制。

不过,一般而言,异城异地容灾已经是最高规格的电信网络容灾机制了,一旦遇到全省范围内的突发事件,实际上也很难起到作用。

写在最后

此次广东电信的故障是一次历史性的事件,也给国内的主要运营商提了醒。在当前的骨干网络架构里,一些关键节点的重要性与日俱增,一旦出现问题,就会带来大面积的影响。当然,此次广东电信故障还没有公布真正的原因,上述也只是从电信运营商软硬件体系结构下推断出来的。具体原因如何,相信广东电信会给大家一个解释。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电信
    +关注

    关注

    2

    文章

    696

    浏览量

    61535
收藏 人收藏

    评论

    相关推荐

    广东电信携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    在北京举办的2024年云网智联大会上,广东电信与华为联手打造的《基于数字孪生技术打造云网预知系统实现网络配置变更在线仿真与精准评估》项目,一举斩获“2023年度SDN、NFV、网络AI最佳实践案例”。
    的头像 发表于 04-14 10:23 379次阅读
    <b class='flag-5'>广东电信</b>携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    stm32cubemx的功能不起作用是哪里的问题?

    最近几个版本的stm32cubemx的功能不起作用: 在cube上有一个很好用的功能就是点按ctrl和click按键会让alternative pin显示出来,这个功能非常高效率。然而不知道是java的问题还是新版本的问题,目前的按键不起作用
    发表于 04-08 07:28

    TC387不起作用的原因?

    我使用的是 TC387。当我使用 Trace32 下载 *.elf 文件时,它运行良好。但是我使用 Trace32 下载了*.hex 文件,但它不起作用。即使我使用 Trace32 下载 *.elf
    发表于 02-27 08:02

    pwm不起作用是什么情况?

    pwm不起作用什么情况,同样的程序8266却可以
    发表于 11-03 07:15

    KT142C语音芯片配置文件总是不起作用?配置文件的问题集中归纳

    KT142C语音芯片配置文件总是不起作用?配置文件的问题集中归纳
    的头像 发表于 10-20 15:04 281次阅读
    KT142C语音芯片配置文件总是<b class='flag-5'>不起作用</b>?配置文件的问题集中归纳

    SYS_ResetCPU为什么不起作用

    SYS_ResetCPU 不起作用
    发表于 08-24 07:28

    在运营商领域再获突破!联想与广东电信签署战略协议

    8月8日,联想与中国电信股份有限公司广东分公司(简称广东电信)签署战略合作协议。双方将发挥各自优势,促进算网融合、数实融合的加速形成,共建智能化生态,将在智能制造、智慧城市平台、智慧教育、智慧园区
    的头像 发表于 08-09 09:07 603次阅读

    广东全省电信崩溃数小时! 罪魁祸首是思科的设备?

    时事热点行业资讯
    电子发烧友网官方
    发布于 :2023年06月09日 11:23:18

    中国电信广东地区崩了?客服回应正在进行抢修

    中国电信广东地区崩了?客服回应正在进行抢修 突发事件;中国电信广东地区崩了?客服回应称已联系相关部门核实处理,正在进行抢修。 今天下午不少广东电信用
    的头像 发表于 06-08 18:26 1004次阅读

    华为彭松:深化战略合作,华为全面支撑广东电信产数协同快速发展

    2023年5月30日,中国电信广东公司(以下简称广东电信)成功举办以“携手云生态·数创新时代”为主题的2023数字科技生态大会,华为公司高级副总裁、ICT战略与Marketing总裁彭松在合作伙伴
    的头像 发表于 05-31 09:25 325次阅读

    新闻 | 华为彭松:深化战略合作,华为全面支撑广东电信产数协同快速发展

    2023年5月30日,中国电信广东公司(以下简称广东电信)成功举办以“携手云生态·数创新时代”为主题的2023数字科技生态大会,华为公司高级副总裁、ICT战略与Marketing总裁彭松在合作伙伴
    的头像 发表于 05-31 08:15 333次阅读
    新闻 | 华为彭松:深化战略合作,华为全面支撑<b class='flag-5'>广东电信</b>产数协同快速发展

    使用esp8266制作PCB它不起作用的原因?

    使用 esp8266 制作 PCB 它不起作用它在更新后给我重置原因 3 firebase 上的代码 我检查了 esp8266-12E 所需的连接,发现我们需要五个电阻才能正常工作 上 拉电阻到 GPIO0
    发表于 05-25 09:03

    Freemaster记录器不起作用怎么解决?

    我创建了一个记录器,但它不起作用。出现错误 0x80000081(无效命令)。我还添加了 FMSTR_Recorder(0)。
    发表于 05-18 07:40

    ESPlorer命令不起作用是怎么回事?

    我正在使用 Esplorer,我设法在我的 ESP-12E 板上上传和运行 lua 文件。但是,某些命令按钮不起作用: 我认为缺少某些东西,但我无法弄清楚是什么。有人可以给我提示吗?
    发表于 05-04 07:19

    ESPlorer示例不起作用怎么解决?

    我一直在尝试让 ESPlorer 与我的 NodeMCU 一起工作,但 Lua 示例似乎都不起作用。到目前为止,这是我尝试过的: - 刷新了最新的固件并在 IDE 中出现错误,说没有
    发表于 05-04 06:27