0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器宕机重启原因分析与解决方案

中兴文档 来源:中兴文档 作者:中兴文档 2022-07-10 13:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

问题描述

R5300 G4配置EX710网卡安装VMware系统宕机重启。

适用产品

R5300 G4

原因分析

采集日志分析,结论为PCIE总线异常导致出现CPU错误,引起服务器宕机重启。

服务器配置型号EX710的双口万兆网卡,该网卡在和VMware操作系统配合使用,当开启ASPM(Active State Power Management)功能时会偶发出现CPU错误,Intel建议关闭网卡ASPM功能。没有关闭ASPM功能的机器,容易出现CPU错误,需要通过升级EX710网卡固件解决。

现场网卡固件版本为7.20 0x800079e6,需要升级到7.20 0x800097c6版本。

解决方案

登录服务器BMC进行设置,选择【设置→媒体重定向→VMedia实体设置】,进入VMedia实体设置页面。

根据下图所示,设置相关参数,单击保存按钮。

4f5dc7b6-f95b-11ec-ba43-dac502259ad0.png

在BMC系统上,选择【设置→启动方式设置】,进入启动方式设置页面。

根据下图所示,设置相关参数,单击保存按钮。

4f7d3b82-f95b-11ec-ba43-dac502259ad0.png

在BMC系统上,选择【远程控制→启动KVM(HTML)】,鼠标放至“CD镜像:Browse File(0 KB)”处,单击鼠标,如下图所示。

4f940f24-f95b-11ec-ba43-dac502259ad0.png

选择要加载的镜像文件:053101600842 Ethernet_Inte_EX710DA2G1P5_FW_ 7.2_800097C6_ISO.iso后,单击“打开”,如下图所示。

4fa4cddc-f95b-11ec-ba43-dac502259ad0.png

单击红色方框内的“启动媒体”,如下图所示。

4fafb5ee-f95b-11ec-ba43-dac502259ad0.png

在KVM界面,选择【电源→电源重启】,如下图所示。

4fbef022-f95b-11ec-ba43-dac502259ad0.png

重启后,服务器自动从光驱进行ISO镜像加载及EX710网卡固件升级,不需要手动干预,当出现类似如下图打印消息,表示固件升级完成。

4fdbcdaa-f95b-11ec-ba43-dac502259ad0.png

10. 在显示界面输入“reboot”或者在KVM进行服务器重启,完成固件升级。

11. 服务器重启进入VMware操作系统后,观察一段时间后未发生宕机重启,问题得到解决。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90883
  • 操作系统
    +关注

    关注

    37

    文章

    7328

    浏览量

    128629
  • VMware
    +关注

    关注

    1

    文章

    301

    浏览量

    23014

原文标题:R5300 G4配置EX710网卡安装VMware系统宕机故障问题处理

文章出处:【微信号:ztedoc,微信公众号:中兴文档】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复—硬盘离线致raid5阵列崩溃,数据恢复大揭秘

    公司的一台服务器中有一组数块硬盘组建的raid5阵列。 服务器中有一块硬盘由于未知原因离线,服务器崩溃,存储重要数据的D分区无法识别。 服务器
    的头像 发表于 11-04 15:32 167次阅读

    服务器数据恢复—服务器断电导致raid模块损坏的数据恢复案例

    某品牌服务器中有12块硬盘,组建了一组raid5磁盘阵列,服务器内存储的是普通文件。 机房供电不稳定导致服务器断电,管理员重启服务器后发现
    的头像 发表于 09-04 12:57 456次阅读

    华纳云服务器角色服务器失败的原因和解决办法

    是常见的,这可能导致数据丢失、系统停机和效率降低等严重后果。因此,了解服务器角色故障的原因和影响,并采取有效的预防措施,对于确保业务连续性和数据安全性至关重要。 一、服务器角色故障的原因
    的头像 发表于 07-17 18:18 427次阅读

    恒讯科技分析:Ubuntu云服务器数据共享高效方案

    ,帮助您根据实际需求选择最适合的解决方案。 一、NFS(Network File System)共享方案 NFS是Linux系统中最常用的文件共享协议之一,适用于Linux服务器之间的数据共享。通过NFS,您可以将一台Ubunt
    的头像 发表于 07-09 21:40 1196次阅读

    服务器数据恢复——服务器异常断电导致raid模块损坏的数据恢复案例

    服务器上有一组由12块硬盘组建的raid5磁盘阵列。 机房供电不稳定导致机房中该服务器非正常断电,重启服务器后管理员发现服务器无法正常使
    的头像 发表于 06-24 16:34 386次阅读

    服务器数据恢复—服务器部分数据目录项被破坏的数据恢复案例

    一台安装linux系统的服务器意外断电。管理员重启服务器后进行检测,发现服务器上部分文件丢失。管理员没有进行任何操作,直接将服务器正常关机并
    的头像 发表于 05-08 15:16 356次阅读

    爱普生SG2520HHN晶振数据中心服务器的理想解决方案

    系统宕机。爱普生SG2520HHN差分晶振凭借低抖动、宽频段、高兼容性卓越性能,成为数据中心服务器的理想时钟解决方案。SG2520HHN差分晶振特性与优势:1.超
    的头像 发表于 04-29 17:32 460次阅读
    爱普生SG2520HHN晶振数据中心<b class='flag-5'>服务器</b>的理想<b class='flag-5'>解决方案</b>

    PTP服务器与NTP服务器的对比分析

    随着网络技术的发展,时间同步在各个领域中的重要性日益凸显。在众多的时间同步解决方案中,PTP(精确时间协议)服务器和NTP(网络时间协议)服务器是两个常见的选择。本文将对这两种服务器
    的头像 发表于 04-27 17:15 1023次阅读
    PTP<b class='flag-5'>服务器</b>与NTP<b class='flag-5'>服务器</b>的对比<b class='flag-5'>分析</b>

    新版兆芯服务器应用解决方案发布

    近期,兆芯携手众多产业生态伙伴,充分发挥自主 CPU 在兼容性等方面的显著优势,围绕KH-40000平台服务器等硬件,聚焦云服务、人工智能、数据库、中间件、高性能存储以及灾备等重点应用领域,合作打造了新一批应用解决方案,为信创技
    的头像 发表于 04-03 16:55 963次阅读

    Firefly 服务器系列:覆盖多个领域的高算力解决方案

    Firefly专注于以云计算和大数据为核心的服务器产品开发与应用,陆续推出支持多种计算单元的ARM服务器,覆盖多个行业及领域,为客户提供优质的解决方案。Firefly服务器系列产品AI
    的头像 发表于 02-19 16:34 1354次阅读
    Firefly <b class='flag-5'>服务器</b>系列:覆盖多个领域的高算力<b class='flag-5'>解决方案</b>

    服务器的公网ip无法访问怎么办?

    可能的原因包括安全组配置错误、防火墙设置问题、网络路由异常或服务器故障。解决方法包括检查安全组规则、排查防火墙配置、测试网络连通性以及重启服务器等。云
    的头像 发表于 02-17 11:06 923次阅读

    服务器电源故障原因有哪些,服务器电源故障判断方法

    服务器作为现代数据中心的核心组件,其稳定性和可靠性至关重要。电源作为服务器的“心脏”,其故障可能导致整个系统停机,严重影响业务的连续性和数据的安全性。本文旨在深入探讨服务器电源故障的常见原因
    的头像 发表于 01-30 14:26 2569次阅读

    服务器电源灯绿灯一闪一闪怎么回事

    服务器存在某种问题或异常情况,需要管理员及时排查和解决。本文将从多个角度对服务器电源灯绿灯闪烁的原因进行深入分析,并提供相应的解决方案
    的头像 发表于 01-30 14:23 5321次阅读

    新加坡云服务器网络中断的常见原因有哪些

    新加坡云服务器网络中断的常见原因包括以下几方面: 硬件故障,网络设备故障:数据中心内部的路由、交换机等网络设备出现故障,会导致云服务器无法正常连接网络。例如,设备老化、损坏或配置错误
    的头像 发表于 01-13 17:03 1176次阅读