0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广东电信发生历史性故障,波及全省电信用户,容灾机制不起作用?

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-06-10 00:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)6月8日,广东电信发生重大故障,导致广东电信全省本地及漫游用户通话异常。当天16时左右,陆续有网友在社交媒体上发文指出,使用电信卡的手机无法通话和通信。“故障发生后,自己尝试了拔卡重启、检查手机硬件、充话费等不同方法,依然无法解决问题。”

随后不久,中国电信广东客服回应称,“因网络异常,影响部分移动用户接听电话,我们正在进行抢修,由此给您带来的不便,我们深表歉意,感谢您的理解和支持。”而后在8日18时左右,中国电信广东客服又补充发文表示,“经紧急抢修,自16:30起,受影响的用户正逐步恢复,对在此期间受到影响的客户表示真诚的歉意。”

到了19时左右,此官微又发布了一条消息称,“截至目前,受影响的移动用户接听语音业务已全面恢复,给您带来的不便我们再次深表歉意。”

wKgaomSC-v2AOkPXAAGc2MttXkA970.png
图源:中国电信广东客服官微


对于此次故障的具体原因,中国电信官方还没有公布。不过,针对这起历史性的电信事故,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。

跳出事件本身来看,电信系统到底是如何运营的呢?容灾系统不起作用原因有哪些呢?


解密电信网络系统

对于电信网络的运转,其上方有两套系统,分别是上层IT软件和底层基础硬件。

其中IT系统又可以分为BSS、OSS、MSS和EDW。BSS(Business Support System,业务支撑系统)和OSS(Operation Support System,运营支撑系统)合称为BOSS系统,也就是电信业务运营支撑系统。BOSS系统以客户服务、业务运营和管理为核心,支持客户服务和计费等关键事物的运转。

在BOSS系统中,BSS实际上是具有主动式管理能力的。这种能力让运维人员在故障发生之前就能够提前介入处理,消除系统故障带来的潜在风险,是运营商系统层面提升客户满意度的关键功能。不过很显然,在此次广东电信故障事故中,BSS系统并没能起到主动式管理的作用,从这个层面来看,这次的事故突发性很强。

MSS(Management Supporting System,管理支撑系统)负责IT系统的规划和窗口展现,帮助电信运营商实现业务和市场需求更好地结合,并提升企业管理和IT系统升级的效率,也对企业运营效率提升有帮助。

EDW(Enterprise Data Warehouse,企业数据仓库)主要负责数据存储和信息化管理。

IT系统是电信运营商业务的神经枢纽,当然其运转还需要部署在底层的硬件设备上。在介绍底层硬件结构之前,我们先结合下图看一下电信业务是如何运转的。如下图所示,无论是电话业务,还是移动手机业务,最终都需要连接到核心网。

wKgZomSC-0WAKTCAAADAlNCv1Ew772.png
电信业务服务架构示意图,图源:华为培训


再看一下另一张图,宽带业务实际上也是如此,全部业务支撑最终都要回归到核心网层面。

wKgaomSC-1-AAC6fAACTiq1CfBA829.jpg
宽带业务示意图,图源:华为培训


所以,这就是为什么运营商很多时候被称为“管道商”。实际上,所有的电信运营业务都像是水管一样,网络流量由核心网分化而来,每一项业务都是基于管道里的流量,从骨干网分流,如下图所示。

wKgZomSC-2qAADijAAQloGJlo1o863.png
电信网络分流示意图,图源:中国电信


当然,网络是一个相对虚化的概念,具体还是要靠设备来支撑。在整个网络架构中,三种设备最为常见和关键,分别是路由器、交换机和核心交换机。如下图所示,无论网络在核心网、IP传输网还是业务网上传输,依靠的都是交换机来中转。

wKgaomSC-3aAEo_JAAlLlihg17Q604.png
图源:广州移动培训资料


运营商在建设网络时,一般会选择使用多台核心交换器来构建超级节点,超级节点基本只存在北上广等重要节点城市部署,负责国际和省际之间的网络传输,也构成了核心网传输的第一平面。这个平面包括超级节点及其链路,以及各省第一出口链路。当然,骨干网络还有第二层,由普通核心节点到超级节点的链路和各省第二出口链路组成,负责跨大区域间的流量转发,大约全国2/3的流量都在这个网络上跑。如下图所示,为了增加网络接入的效率,在节点上将流量进一步分流,也就到了基站和普通交换机/路由器一端,方便用户的接入。

wKgaomSC-7KATgerAASklQxDEfo455.png
网络接入和传输示意图,图源:华为培训


那么,很显然一个普通的路由器和交换机是很难让一个省的网络全部出现问题的,很可能就是核心交换机出现了问题,影响骨干网的传输,导致一个省没有网络流量入口。

虽然二层网络已经推出很多年,不过目前依然是电信运营商主要采用的骨干网架构。虽然二层网络的扩展性不好,不过其跨域传输的性能很出色。当然,这也造成了一个问题,那就是看似互联互通的网络,会存在一些重要的节点,这些节点是不容有失的。

电信网络的容灾机制

电信网络是一个关系到国计民生的领域,因此在构建的过程中,是需要具有容灾机制的,面对一些突发的挑战。

我们上面已经提到,电信网络基本靠两套系统在运作,一个是IT系统,另外一个是底层设备。由于用户信息和业务高度集中,因此每一个电信业务开始部署时都有一套“plan B”,也被称为容灾措施,主要是为了应对突发的火灾、洪水、飓风和其他突发因素等。

据介绍,除了在BSS系统中加入故障预判的机制以外,电信系统在硬件层面具有多层容灾措施,包括单板主备容灾、设备主备容灾、网元主备容灾、同城异域容灾以及异城异地容灾。通过多维度丰富的容灾措施,一般在重大故障之后,电信运营商都能够很快地恢复网络。

上一次发生地域性大规模断网是在郑州大洪水期间。由于数十年难得一见的洪水,导致郑州骨干核心机房和主备机房全部被水淹。最终,为了让郑州市民能够尽快使用网络,启动了异城异地的容灾机制。

不过,一般而言,异城异地容灾已经是最高规格的电信网络容灾机制了,一旦遇到全省范围内的突发事件,实际上也很难起到作用。

写在最后

此次广东电信的故障是一次历史性的事件,也给国内的主要运营商提了醒。在当前的骨干网络架构里,一些关键节点的重要性与日俱增,一旦出现问题,就会带来大面积的影响。当然,此次广东电信故障还没有公布真正的原因,上述也只是从电信运营商软硬件体系结构下推断出来的。具体原因如何,相信广东电信会给大家一个解释。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电信
    +关注

    关注

    2

    文章

    775

    浏览量

    63556
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HDMI 接口在 I.MX8QM 评估板中不起作用是怎么回事?

    HDMI 接口在 I.MX8QM 评估板中不起作用,所有其他接口都正常工作 以前的 HDMI 接口工作正常,我们使用相同的以前的 SD 卡和通过 SD 卡启动的 Board。 现在问题显示为
    发表于 04-28 07:23

    i.mx91 uboot 和 linux 软重置不起作用怎么解决?

    问题 - 我的软件重置不起作用。 在 uboot 中 - 键入 \'重置\' 使系统停滞。 在 Linux 中 - tpying \'重新启动\' 使系统停滞。 我在设备树中启用了 wdog3
    发表于 04-14 07:09

    华阳集团荣登2025年广东省电子信息制造业综合实力百强企业榜单

    1月20日,由广东省电子信息行业协会和东莞市电子行业协会联合举办的广东省电子信息产业发展大会成功举办。大会发布了“2025年广东省电子信息制造业综合实力百强企业榜单”、“2025年广东省电
    的头像 发表于 01-26 15:10 515次阅读

    军工、航天与电信主时钟用 OCXO:L1 级时序基准怎么选?

    。 在以下场景里,这种复杂度和成本是值得的: 雷达与航天载荷 发射 / 接收链路需要长时间保持严格的相位一致 多通道波束形成、脉冲压缩对相位噪声十分敏感 电信主时钟 / PRTC / PRC 需要
    发表于 12-01 15:27

    CW32L010F8P6开发板的复位键不起作用怎么解决?

    拿到手的CW32L010F8P6开发板,在测试过程中发现,复位按键好像是没起作用。不知道是没连接到对应的引脚上,还是线路断开了。原来的板载程序运行中,按复位按键不起作用;程序下载后,按复位按键也不起作用
    发表于 11-26 07:19

    Bluetooth® LE FindMe 示例在CY8C6347LQI-BLD52中不起作用是怎么回事?

    Bluetooth® LE FindMe 示例在CY8C6347LQI-BLD52中不起作用
    发表于 11-11 07:23

    雷曼光电连续六年荣获“广东省守合同重信用企业”称号

    近日,广东省市场协会正式公布2024年度“广东省守合同重信用企业”名单。雷曼光电(股票代码:300162)及其控股子公司康硕展凭借健全的信用管理体系、卓越的合同履约能力以及良好的社会声
    的头像 发表于 10-20 18:11 1353次阅读

    rt-thread使用xshell连接上下键不起作用是怎么回事?

    rt-thread使用xshell连接上下键不起作用,不能进行历史追溯,求问怎么回事
    发表于 10-13 06:27

    中宇联成功入围中国电信广东公司DICT项目合作伙伴

    前言近日,中国电信股份有限公司广东分公司政企信息化合作伙伴2025年第二批次合作引入项目落下帷幕,中宇联凭借在行业内的技术积累、成熟的解决方案及丰富的落地经验,成功入围合作伙伴名单,正式跻身中国电信
    的头像 发表于 09-19 09:43 1769次阅读
    中宇联成功入围中国<b class='flag-5'>电信</b><b class='flag-5'>广东</b>公司DICT项目合作伙伴

    TSLIB 触摸屏校准不起作用是怎么回事?

    我遇到触摸屏校准问题 在触摸屏校准期间我看不到任何窗口,只能在 RS232 中更新 所以我使用我自己创建的模板用于触摸屏校准 实际上它以前有效,但现在不起作用 不知道为什么会这样
    发表于 09-04 06:06

    IR900拨号电信4G专网卡遇到的问题及解决方法

    IR900拨号电信4G专网卡遇到问题及解决方法:目前在使用IR900(包括IR912L-TL00和915L-TL00)时,若遇到使用电信4G专网卡拨号拨不上的时候,可参照以下解决方法:网络-拨号接口
    发表于 08-07 07:13

    CYW920721M2EVK-02与cybt413061模块,HID控件在某些安卓13设备中不起作用怎么解决?

    我们正在使用带有cybt413061模块的 CYW920721M2EVK-02 ,HID控件在三星Android 13和GooglePixel Android 13设备中不起作用。 然而,出于测试
    发表于 07-01 06:00

    wiced_hal_sflash_write在CYW20721B2上不起作用是怎么回事?

    时,写入不起作用。 逻辑分析仪上没有保存命令。 我记得在 CYW20706 中必须通过 *((unsigned char*)(0x00201a14)) = 1 解锁写入能力;
    发表于 06-30 06:22

    rt-thread-studio添加任何的软件包都失败,更改github或者gitee源都不起作用,有什么解决方案吗?

    如图,添加任何的软件包都失败,更改github或者gitee源都不起作用,有什么解决方案吗?
    发表于 06-13 08:17

    信号发生器用途及功能讨论

    和波形的电信号,刺激神经元,观察其反应,从而深入了解神经网络的工作机制。在量子通信、超导电子学等前沿领域,信号发生器同样发挥着重要作用,帮助科研人员突破技术难题,推动科学技术的不断进步
    发表于 06-12 16:25