0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广发证券数据中心网络智能运维实践

华为数据通信 来源:华为数据通信 2025-08-11 10:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

广发证券以“成为具有国际竞争力、品牌影响力和系统重要性的现代投资银行”为战略愿景,秉承“以价值创造成就金融报国之梦”的使命,致力于通过科技创新与国际化布局,打造综合金融服务平台,服务国家战略与实体经济高质量发展。在此战略框架下,数据中心网络作为支撑全球业务高效运转的基石,其重要性愈发凸显。数据中心网络不仅是践行“稳健经营,持续创新”理念的技术载体,更是其实现“科技-金融-产业”良性循环、赋能新质生产力培育的战略性支点,为推进行业创新实践、构建数字化金融生态奠定了坚实基础。

网络运维挑战

广发证券经过多年的持续建设,形成了同城双活、异地灾备体系架构,并逐渐构建分布式多地云化数据中心,有力地支撑生产、办公和管理业务的运行,但同时,数据中心网络设备不断增加,架构复杂化给网络运维带来诸多挑战,传统网络运维无法满足日益增长的网络需求。

01 数据孤岛,检测不精细

在日常监测中,传统多个运维系统的数据相互孤立,数据之间缺乏关联性,依赖人工整合分析,另外,传统SNMP协议采集精度差(通常5分钟粒度),难以主动感知网络微突发类异常(亚秒级粒度)。目前数据中心包括传统业务网络、组播业务网络、GPU业务网络等多种组网,而之前多套传统运维系统及多个视图,存在数据孤岛,无法统一分析和监测,无疑给复杂的运维工作带来更大的困难。

02 隐患难寻,风险缺预防

目前数据中心网络既有传统业务,又有组播业务,大模型相关的智算业务也在建设中,业务扩缩容和网络变更频繁,随之网络中可能存在一些潜在风险,例如,数据中心网络中会采用大量的光模块,光模块器件的可靠性远低于网络设备硬件本身,运维需要系统性地排查网络中的风险,从根源上减少故障的发生。

03 路径不明,镜像成本高

网络流量与业务路径黑盒化,传统NPM镜像部署成本高昂却难以解决数据割裂问题。例如,为了业务平稳运行,数据中心网络普遍采用高可用架构设计,如MLAG和路由ECMP负载等技术,却造成业务流量路径不再唯一。运维人员因此只能在所有业务流量可能经过的设备上进行流量统计,人工逐段定位丢包位置,并且这些动作都必须等待排障窗口期。

数据中心网络智能运维实践

广发证券坚持以科技金融为重大战略之一,持续推进数字化转型。为了更好保障用户体验,广发证券携手华为,基于iMaster NCE-FabricInsight建设统一的数据中心网络智能运维平台,以提升数据中心网络运维效率。智能运维平台重点围绕统一可视化、网络风险预防、智能化故障定界三个方向展开实践。

打造统一数据底座,多Fabric统一监测

针对多系统数据孤岛、检测粒度不精细等问题,网络智能运维平台构建了统一的数据底座,目前已纳管交易区、非交易区、互联网区、大数据区、组播私网区、测试区等Fabric网络,数据对象包含网络设备、全网TCP业务流的特征报文、关键业务流的全包、组播业务流等。通过Telemetry技术实现多种不同架构网络指标的主动订阅与亚秒级数据上报,监测维度更加丰富,包含接口链路、队列缓存、光模块、配置、表项、丢包检测等,实时监测全网资源、故障、性能质量情况,并通过对接微信平台统一告警通知。

从被动到主动,网络风险预测

防火胜于救火,如何系统性排查网络风险也是重点课题之一。目前,广发证券正在构建统一的网络主动预防体系,基于知识图谱的数据底座,进行整网风险建模与特征智能识别,从组网、路由、设备板卡、电源、风扇、链路、光器件等多个维度系统全面地分析网络潜在风险,识别风险原因并提供处理建议,转变传统被动救火的运维模式,降低故障发生概率,支撑网络健康运营。

5829d178-739c-11f0-a18e-92fbcf53809c.jpg

图1 网络健康巡检大屏

三维立体的流镜像,应用异常智能化定界

广发证券正在大力推进网络基础设施的智能化建设。然而,应用质量与网络流量分析割裂、网络路径呈现黑盒状态,网络看不清业务流量路径,故障定位困难。若在所有网络节点部署传统NPM流量镜像,整体建设成本高昂,而且依旧无法解决应用-网络-设备一体化的数据整合与分析,数据割裂导致定位时间长、运维效率低。

为解决上述问题,广发证券通过在网络智能运维平台基础上叠加了xFlow智能全流和xFlow按需抓流技术,网络智能运维平台基于ERSPAN技术轻量级镜像整网全部业务流的TCP建链状态,还原业务流在网络中的真实转发路径,并关联网络设备信息,感知微突发、丢包等KPI指标,实现“网络路况”可视化,就像地图导航感知每条道路的通行质量一样。继而,再在网络最复杂、业务容易出问题的关键位置(例如防火墙、负载均衡、关键路由交换设备前后)部署xFlow全流分析探针,1:1采集业务流的全包数据,检测业务流传输过程中的丢包、时延等关键网络性能,实现分段定界。针对网络指标有异常的分段,结合路况信息,可按需在沿途的网络设备上远程镜像,进一步缩小分段定界的范围,分钟级定位故障点。此方案特点在于:以低成本方案“广撒网”,在重点区域“深挖壕”,再结合设备协同完成“按需补位”,构建立体化、多层次的流分析体系。

58365448-739c-11f0-a18e-92fbcf53809c.png

图2 业务质差问题排障逻辑

下一步发展展望

当前,网络智能运维平台以“数据+算法”为驱动,实现了数据一体化分析,显著提升了网络运维的效率。后续,广发证券一方面将在智能计算、证券组播行情交易、大模型等网络建设运维领域持续探索,另一方面将聚焦应用体验保障,推动运维模式从以网络设备为中心向以应用体验为中心转变,构建应用质量主动保障体系,以新质生产力赋能智能运维,提升金融业务服务体验,为金融创新做出新的贡献。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36194

    浏览量

    262698
  • 数据中心
    +关注

    关注

    18

    文章

    5773

    浏览量

    75209
  • 金融网络
    +关注

    关注

    0

    文章

    11

    浏览量

    6932

原文标题:数通金拍档 | 金融网络运维如何“智”变?广发证券数据中心网络智能运维实践

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    日置专题:数据中心 UPS 电池升级|HIOKI BT3554-50 筑牢供电安全防线

    系列电池测试仪,专为 数据中心 UPS 与铅蓄电池 打造,以 不停机检测、极速测量、智能指引、降噪抗扰、全链路数据管理 ,重构机房电池
    的头像 发表于 04-13 11:15 282次阅读
    日置专题:<b class='flag-5'>数据中心</b> UPS 电池<b class='flag-5'>运</b><b class='flag-5'>维</b>升级|HIOKI BT3554-50 筑牢供电安全防线

    Personal携手华为在MWC 2026展示5G融合核心网智能实践

    在2026年世界移动通信大会期间的智能体核心网峰会上,阿根廷电信的数字服务生态品牌Personal,与华为联合展示了基于ICNMaster(MDAF)解决方案的5G融合核心网智能
    的头像 发表于 03-10 10:04 526次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    预端接配线架:数据中心高效的得力助手

    数据中心作为信息时代的“心脏”,其稳定性和效率直接关系到整个社会的运行和发展。在数据中心的建设和过程中,光纤网络的部署和管理是至关重要的
    的头像 发表于 01-21 10:45 459次阅读

    AR智能机房巡检:引领智慧数据中心维新模式

     在元幂境看来,在数字化浪潮席卷全球的今天,数据中心作为数字经济的 “核心引擎”,承载着企业业务运行、政务数据存储、民生服务支撑等关键使命。机房设备的稳定运行直接关系到社会生产生活的正常秩序,而巡检
    的头像 发表于 01-06 14:49 288次阅读

    双供电 + 强联动!网口温湿度变送器,数据中心效率翻倍

    网口温湿度变送器在数据中心的应用 基于网口温湿度变送器 “POE 供电、以太网直连、高稳定、强联动” 的核心优势,结合数据中心(IDC / 企业机房)的架构特点与需求,以下是其在
    的头像 发表于 12-24 14:14 586次阅读
    双供电 + 强联动!网口温湿度变送器,<b class='flag-5'>数据中心</b><b class='flag-5'>运</b><b class='flag-5'>维</b>效率翻倍

    安科瑞数据中心弱电产品:网络互联与安全防护的智能基石

    与业务的连续性。安科瑞凭借多年在电力监测与管理领域的深耕,推出了一系列针对数据中心的弱电产品,涵盖网络互联与安全防护两大核心领域,为数据中心的稳定运行提供了坚实保障。19821800313 一、
    的头像 发表于 11-20 14:33 397次阅读
    安科瑞<b class='flag-5'>数据中心</b>弱电产品:<b class='flag-5'>网络</b>互联与安全防护的<b class='flag-5'>智能</b>基石

    “一院多区”网络实现跨院区数据中心业务无缝迁移

    面对跨院区协同、数据安全与未来扩展等核心挑战,大连经济技术开发区医院携手锐捷网络,共同 打造医疗数据中心网与新一代园区网络示范样板 ,成功实现了院区间
    的头像 发表于 10-22 16:51 984次阅读
    “一院多区”<b class='flag-5'>网络</b>实现跨院区<b class='flag-5'>数据中心</b>业务无缝迁移

    无人机智能巡检系统在光伏电站中的应用实践

           无人机智能巡检系统在光伏电站中的应用实践        在光伏发电行业快速发展的背景下,智能无人机巡检系统正以其独特的技术
    的头像 发表于 10-21 10:18 561次阅读

    苏州DCIM数据中心基础设施管理维系统简介

    数据中心基础设施管理)系统正是在这样的背景下应运而生,为各类规模的数据中心提供智能化管理解决方案。 传统数据中心
    的头像 发表于 08-01 09:40 1180次阅读
    苏州DCIM<b class='flag-5'>数据中心</b>基础设施管理<b class='flag-5'>运</b>维系统简介

    曙光网络发布新能源集控中心网管业务智能解决方案

    方案以创新的 “全域业务一张图” 可视化和 “AI+语音”智能辅助为核心,旨在破解当前新能源集控中心的深层次痛点,显著提升运营效率与效益。
    的头像 发表于 07-08 09:35 871次阅读

    中型数据中心中的差分晶体振荡器应用与匹配方案

    同步模块等。 2. 高校/科研机构智能计算中心 应用背景: 服务于AI训练、大数据建模与图像处理的科研计算平台,要求高速网络与大容量数据同步
    发表于 07-01 16:33

    开放生态+极简:多租户园区网络的云原生管理实践

    新一代云化园区网解决方案,创新性地将数据中心级的Spine/Leaf架构以及“全三层”、“云架构”、“超堆叠”、“云漫游”等设计理念应用于园区场景,显著提升网络服务质量和水平。面对
    的头像 发表于 06-16 16:28 1032次阅读
    开放生态+极简<b class='flag-5'>运</b><b class='flag-5'>维</b>:多租户园区<b class='flag-5'>网络</b>的云原生管理<b class='flag-5'>实践</b>

    小型数据中心晶振选型关键参数全解

    小型数据中心的定义与应用 小型数据中心通常是为中小型企业、边缘计算、物联网(IoT)设备及其他特定业务需求提供计算、存储和网络服务的设施。与大型数据中心相比,小型
    发表于 06-11 13:37

    曙光数创SLiquid智能维系统解决数据中心难题

    面对数字时代的海量需求,传统数据中心正遭遇系统性挑战:告警风暴引发的故障定位迟滞、能效困局导致的PUE优化瓶颈、资产迷雾造成的资源错配、容量盲区引发的规划失焦。这些问题严重阻碍了数据中心从成本中心向价值
    的头像 发表于 06-03 10:21 1123次阅读