【故障现象】
笔者筹建过某公司的网络中心,该中心以负责全市各家分公司间信息的交换,实现各分公司间资源的共享。各分公司都通过DDN专线经路由器用TCP/IP协议与主机连接。
网络中心的以太网分为两个网段:192.168.1.x和 192.168 2.x,以下简称网段 1和网段2。其中有用于处理备分公司信息的生产机及开发机各一台,另有二台与各分公司进行远程通信的路由器。另外还有一些用于开发和监控的计算机。网段2中有多台计算机,进行客一端的开发调试。开发机和一台计算机同时连在两个网段上。
某天,网络发现各分公司的数据传输不正常,而旦是采用TCP/IP协议与中心连接的分公司的数据不正常。隔一段时间就发现这些分公司的数据通信室都不能进行,经过几天努力还是无法解决,但是公司正常运转必须借助网络,于是向笔者求助。
诊断过程
笔者赶到现场,仔细观察故障现象,基本上可以判断是通信问题造成的因为无论是在网段1 还是在网段2 上 计算机与生产机的连接都出现了时断时续的现象。而与生产机直接相连(不通过以太网)的主控台与主机的连接则没问题。从主控台上看,无论是内存占用还是CPU利用率等各方面都没有发现异常。而且生产机上的所有进程也都没有发现异常。看来问题出现在以太网上。
既然两个网段与主机的连接都有问题,是不是两个网段都有问题呢?用TCP/IP协议中最基本的测试方法Ping命令测试,结果发现网段2中的各台计算机之间的连接都没有问题,而网段1 中,不只是各台计算机与生产机之间Ping时断时通,而且其他各台计算机之间互Ping也是时断时通。问题肯定出在网段1上。网段2 到生产机的通信有问题,是因为从网段2到生产机必须经过网段1。