Mz电信类维护案例分析16-某州委党校网络调试
案例背景:
最近我接到了党校的工程师反应他们的互联网网络不稳定的情况。据描述:经常会出现掉线,平常只有几个人上网时,下载文件也只有100多少KB,已经影响到办公(需与省上进行文件传送)。并怀疑电信是否开够带宽。
问题初步定位及解决:
为落实客户问题,我11:00到了现场进行查看,经调查,用户电脑全部120余台,平常上班人不多,客户工程师说现在上班的人数不到30个;我找一台办公室,进行测试,确实在下载没有限速的网站文件时也只有100K左右,PING 网关
PING 192.168.1.1 -t
结果非常流畅
PING DNS 222.172.200.68
结果也比较流畅,没有丢包,但进延大。
初步判断,此时的用户量不少,取得用户的许可可以直接断开路由器,在电信接入线上测试,发现下载文件的速度达到1.12MB,我向用户解释了电脑下载时,10M网络达到的速率:
10M 单位为bit /s,而电脑上的单位为Btye,而1 Btye=8bit,传输过程加上一定比特控制信息,指令等,每1Mb/S的带宽下载约为100KB/S。
用户认可了电信接入的线路带宽足够,也比较稳定。
为解决问题,我帮助查看了用户的交换机HW3900:
DIS MAC-ADD
竟然有70多个MAC地址透过来,由于党校楼宇较多,办公楼而言已没有几个人上班了,但不排除有其它的楼宇是否有人。
原来用户的拓朴为:
为核实实际网络,我找到另一名客户工程师,发现,原来网络上还挂接着一个党校外包的宾馆以及中信公司的网络,平常的在线用户也比较高,其拓朴如下:
对党校概况进行了调查,原来党校平常上班人数50个,一般不超过90人,另外有一48台电脑的微机机房,平常基本不用。但上个月外包的宾馆也向房客提供上网功能,还向长期租用宾馆的中信公司提供上网,这样上网用户剧增,造成党校自己上网的感知下降。
于是我建议用户将外网带宽提速成20M,用户要求先体验一周提成20M的效果如何。
经申请,我们对党校进行提速20M后,让用户体验一周,提速的第二天,用户反应上网速度仍不如意。
接到通知,我到用户端查看,电信光纤收发器提供的接口可以达到20Mb/S带宽,但一接入用户路由器,速度就只能达到10Mb/S带宽。进入用户路由器AR18-20,其WAN接口只能支持10M速率。
为解决用户问题,提高用户感知,并能增加电信业务收入。电信客户经理与客户谈妥,若核实确实需提速,他们愿意增加提速所需的费用。
我们找来测试用的电信网络无忧设备,更换后,用户的感知确实快了。用户也比较满意,并签下的提速协议。
故障再现
一周后,用户发现8:30到11:00;下午有时掉线,有时又很正常。连续几天,网速频繁出现了掉线,而且经常获不到IP地址或获到IP却无法上网。(更换网络无忧设备后,在该路由器上我们启用DHCP功能,让用户电脑自动获取IP地址。)
根据用户所反馈的信息,我起初怀疑ARP病毒引起,叫用户查杀相关电脑,安装了360 ARP防火墙。
平常网络中,若出现了ARP病毒时,在配置的交换同上,一般会出现相应的报错信息。
如:
%Nov 10 19:05:38 2009 LH6506 ARP/5/DUPIP:Slot=0;IP address 192.168.1.21 collision detected, sourced by 0014-78a6-73cd on Ethernet4/0/18 and 0000-e818-ad80 on Ethernet0/18
%Nov 10 19:06:25 2009 LH6506 ARP/5/DUPIP:Slot=0;IP address 192.168.1.22 collision detected, sourced by 0000-e818-ad80 on Ethernet4/0/18 and 0014-78a6-73cd on Ethernet0/18
而在几台交换机上用DIS LOG查看近期记录, 这些交换机上都没有相似的记录。
而在现场的查询中,也发现有的电脑获到地址上不了网的电脑,在电脑DOS下,用ipconfig/all查看,DNS没有获取到,判断为网络中出现两个DHCP服务器(不排除用电脑配置的DHCP服务器)。但党校方面否认这种情况出现,并说明已经与每位同事落实,党校办公室的每个房间不准私接路由器。这样,我们只有用排除法进行处理。
由于上班时间不能中断他们的网络,我电信人员连续两次去处理,由于属下班时间12:00左右,都发现网络完成正常,好多房间都能正常上网。第三次,取得用户许可,我们选择了问题出现的频繁期9:30至10:00之间进行排查。
经查,发现部分房间电脑上网较为异常,经分析大部分问题集中在一台交换机上,其它交换机也会有问题,但不太频繁。而这台交换机属无配置口的交换机不能用配置线进行查看。据此,我们先将该交换机除上行外的所有线拔出,而接我的电脑PING DNS( X.X.200.68 –t),发现正常,能正常上网,然后一根一根插上,当插上其中一根线时,发现,PING 包中断,拔出后又正常,终于找到问题所在!!!我然后继续插其它线,发现PING包都正常。查询到的这根的“问题网线”原来属1楼政府机关驻党校办公点,这几天的临时使用,3台电脑一条网线不够用,用一小路由接了出来,主线又接在这个小路由器的LAN口,而且了DHCP功能,造成党校网络中出现了两个DHCP服务器。如下面所示。
我拆除小路器后,党校恢复正常,为提高党的稳定性,我又对党校的交换机接口进行了适当限速。一般的用户接口,限制为2M,为不影响党校办公楼上网,将党校外包宾馆限制为10M。
经过以上处理,现党校网络一直正常。
问题总结:
我们在查询主线正常但网络仍有时正常,有时中断的网络故障时,需注重以下几个问题:
1、 客户网络拓朴一定调查清楚,故障发生时间,故障发生的这段时间网络拓朴是否发生改变。
2、 有时我们维护人员到客户端测试时老是正常,有可能意味着故障源由于某些原因被关闭。
3、 在查询此类故障时,我采用排除法进行判断。
4、 我们可以查看路由器、交换机的记录,在问题出现时,我们可借助路由器、交换机上Debug功能进行调测。
5、 对以上类似的故障,我们可以借助,wireshare 等抓包软件进行抓包分析。
6、 对于一般的局域网络,为保证大部分人使用正常,我们应适当对端口进行限速,保证大部分用户的感知。
冯 X
XX股份公司X分公司
2010年3月27日
因篇幅问题不能全部显示,请点此查看更多更全内容