许多网管员都清楚,共享式以太网有很大的缺点:网络中任何一点产生问题,都可能造成整个网络的不正常以至瘫痪。本文为一名网管员在实际工作中的经历,也许对网管员们有所帮助。
■发生网络风暴
沈阳信用卡服务中心负责全市各家银行间信用卡信息的交换,使用户可以进行跨行取款和消费,实现各银行间资源的共享。
除两家银行以专线方式用SNA直接与中心主机进行连接外,其它9家银行都通过DDN或X.25经路由器用TCP/IP协议与主机连接。中心的以太网分为两个网段:192.0.1.x 和 192.0.2.x ,以下简称 1网段和 2网段。其中有用于处理各行交易的生产机及开发和调试新程序的开发机各一台,另有两台与各行进行远程通信的路由器。另外还有一些用于开发和监控的微机。2网段中有多台微机,进行客户端的开发调试。开发机和一台微机同时连在两个网段上。
一天,突然发现各行的交易跑得不正常,而且仅是采用TCP/IP协议与中心连接的那些银行的交易不正常。隔一段时间就发现这些行的交易全都不能进行。从出错提示信息可看出,是通信问题造成出错。这时无论是在1网段还是在2网段上,微机与生产机的连接也都出现了时断时续的现象。而与生产机直接相连(不通过以太网)的主控台与主机的连接则没问题。从主控台上看,无论是内存占用还是CPU利用率等各方面都没有发现异常。而且生产机上的所有进程也都没有发现异常。看来问题出现在以太网上。
■好难找的故障点
既然两个网段与主机的连接都有问题,是不是两个网段都有问题呢?用TCP/IP协议中最基本的测试方法 ping 命令测试,结果发现2网段中的各台计算机之间的连接都没有问题,而1网段中,不只是各台机器与生产机之间ping 时断时通,而且其它各台机器之间互ping 也是时断时通。问题肯定出在1网段上。2网段到生产机的通信有问题,是因为从2网段到生产机必须经过1网段。