专业的

致力于提供高质量、低成本的构架方案

我们拥有超过10年的云计算行业经验,致力于为国内各类中小型企业提供高质量、低成本、0运维力的一站式系统构架、采购、部署服务。

记一次双11前某云机房内的网络故障处理情况

网络故障现象

今天接到某客户的运维求助(当然收费了),机房内某些管理平台无法访问,ping包直接丢包。这些平台都上联于一台相同的交换机,怀疑是交换机出现了网络故障。

网络故障

问题定位

站长跑到机房后,首先检查交换机端口,连线的等情况;未有收货。然后通过console直链交换机,查看arp表只显示自己的互联地址。接着将诊断日志收集下来,发现在今天4:00左右,有大量端口出现unavailable异常,且堆叠端口下线。怀疑是因为堆叠分裂导致交换机上下行出现异常。

故障排除

经过和客户协商,首先下线一台交换机,发现网络恢复正常,然后切换另一台交换机下线,网络也运行正常。为避免后期再发生类似故障,给两台交换机之间放了一根心跳线,如果堆叠再次分裂,该线也能保证至少一台机器正常运行;不会影响到业务。

发表评论

Scroll to Top