[故障现象]
公司有两台关键的服务器,一个是主服务器,一个是备用服务器。中间通过心跳线连接,在某台主机一次重启后,网络设置没有任何改动,而心跳功能却不能实现了,两台机器不能同时心跳线互通。
诊断过程
这次事可闹大了,这可是公司关键业务的服务器,连老总都惊动了,他可不管你怎么处理,他只关心机器能否正常运转,现在已经是凌晨2点半了,留给我只有几个小时的时间了在明天早上上班前可一定要搞定,否则后果…….
赶快抓紧时间,一步一步来,首先这次重启只是因为改动了几个配置文件, 要生效就必须要重启系统。不过幸好有备份、先不管三七二十一。恢复配置文件再重启。故障依旧两台机器都可正常运行,心跳线却依然有问题。再查看每台机器心跳线连接的网卡状态及配置 ,状态都是没有问题 ,网卡灯也是亮的。难道是网线没插好。或是有问题。重新用一根确认,网线是好的,可是两个服务器之间还是不通。奇怪,这是什么原因,排除物理问题,那肯定是设置问题。
没办法,只好将两台机器网卡状态一项一项的比较。这是怎么回事,突然我发现两个网卡的速率及状态不一样,一个是100Mb/s全双工,而另一个则是 10Mb/s半双工。比来比去只有这一项不同。难道是这个原因,不管了,死马当活马医了,把两台机器的网卡状态统一设置为10口Mb/s全双工RESET一下。我再Ping,问题解决了。再重新设置配置文件,这次强制网卡状态为100Mb/。全双工,重新启动机器 ,服务器工作一切正常。看看老总紧缩的眉头舒展开,我在想这个月的奖金是不是会……