内蒙古电力技术  2015, Vol. 33 Issue (S1): 63-65   PDF    
传输以太网故障原因分析及防范措施
刘文忠    
呼和浩特供电局土左旗供电分局, 呼和浩特 010100
摘要: 土左旗电力有限责任公司传输以太网发生故障,导致光缆网络传输全部中断。按照从外到里、从硬件到软件的故障处理流程,对可能的故障原因进行逐一排查,最终确定故障原因为三两收费所的光猫网口损坏,芯片产生环路。经进一步分析,认为光猫故障是由于雷击过电压导致网络交换机工作不正常,传输设备以太网板收发异常。对此,采取了对每个站点的网络分配不同的VLAN标签、县调度所网络交换机启用3层协议、提高各种设备的防雷性能等措施,预防类似故障发生。
关键词: 光传输     网络交换机     光猫环路     以太网板    
Failure Cause Analysis of Transmission Ethernet and Its Preventive Measures
LIU Wenzhong    
Tuzuoqi Power Supply Branch Office of Hohhot Power Supply Bureau, Hohhot 010100, China

1 故障的发生

2013-08-01,土左旗电力有限责任公司(以下简称土左旗电力公司)信息中心通过传输网络连接的收费网络突然全部瘫痪,各收费营业所终端电脑无法访问收费系统网页、无法PING通网关IP地址,但没有采用光缆通道连接的收费营业所终端运行正常。

2 网络结构介绍2.1 光传输设备组网结构

土左旗电力公司各变电站、收费营业所通过华为技术有限公司的光传输设备及光缆连接形成树状网络结构。光传输设备组网结构如图 1所示。

图 1 光传输设备组网图

2.2 收费系统网络结构

土左旗电力公司调度所(土左县调)配置的传输以太网板(ET1S)有虚拟网桥功能(2层交换),以VP虚拟通道技术VC12的颗粒将10/100Base-TX或100Base-FX以太网业务送至交叉板,通过SDH传输网络[1],将各个变电站及营业所的虚拟以太网通道汇聚,并与县调度所的收费系统交换链接,组成典型的星形网络结构,见图 2所示。

图 2 收费系统网络结构图

三两收费所是通过光猫与铁帽的网络交换机连接,再通过铁帽的传输以太网板汇聚到土左县调。

2.3 VB虚拟网桥结构

VB虚拟网桥是为了方便管理,对管理域进行划分,相当于1个虚拟的L2 Lanswitch,结构图见图 3所示。在城域网的应用中,VB是基于用户划分的,即每个用户都有自己独立的VB,其中包含多个VLAN标签和MAC地址。由于各个VB之间相互隔离,不同的VB可分配相同的VLAN而互不影响,而基于VLAN划分VB的L2芯片不能区分不同用户的相同VLAN。

图 3 VB虚拟网桥结构图

3 故障原因分析

根据从外到里、从硬件到软件的故障处理流程(见图 4所示),对可能发生的故障原因进行了逐一排查。

图 4 故障处理流程

3.1 传输设备、网络交换机电源故障或环境温度过高

通过对机房设备电源及运行指示灯的观察,确定设备运行正常;机房温度计显示温度为20 ℃,正常;手指接触传输设备单板温度未达到30 ℃,未发现异常,所以排除了这种故障的可能。

3.2 传输设备至网络交换机的链接网线中断

通过网线测试仪对ET1S至网络交换机的链接网线进行测试,网线连接正常,排除了链接网线中断的可能。

3.3 光缆中断或传输设备故障

通过华为传输网管T2000的管理功能对传输设备及网络进行分析。

(1) 网络上的所有设备,如光缆中断R-LOS、硬件损坏HARD-BAD、SDH业务中断TU-AIS等告警,均无异常。

(2) 通过网管查看误码性能,经分析,未发现光路误码和支路误码。

3.4 网络交换机端口或ET1S端口损坏

(1) 以太网端口指示灯和数据交换机LINK连接指示灯为绿色,正常;但收发包指示灯闪烁频率非常高,对两侧设备更换端口后发现故障依然存在。

(2) 笔记本电脑和数据交换机用原有的端口与网络连接,PING收费系统服务网关正常,并能登录收费系统网页。

(3) 笔记本电脑与ET1S端口连接后,PING各收费所终端电脑的IP地址,无法PING通;用局域网查看工具LANSEE,无法搜索到终端电脑,初步判断问题可能出在土左县调传输设备的ET1S。

3.5 土左县调传输设备的ET1S运行故障

(1) 对电路板进行硬复位,待ET1S单板运行正常后进行测试,故障依然存在。

(2) 通过传输网管查看ET1S单板内、外部端口参数,以及ET1S单板VB网桥参数等配置数据,未发现数据丢失和更改。

3.6 网络病毒或形成环路

(1) 利用华为传输网管对土左县调传输以太网板RMON性能进行分析时发现,全网每个站点的ET1S端口的收发数据包数量都非常大,吞吐量基本接近虚拟通道VP的捆绑带宽(2 Mbit/s),并且每个长度字节的数据包和错误数据包数量都非常大,所以断定故障是由某一站点终端电脑中毒或网络形成环路导致的[2]。将各站点的ET1S端口逐个关闭、打开观察,当关闭到铁帽站时网路恢复正常,打开端口后故障出现。

(2) 铁帽站对传输设备ET1S、网络交换机及其他设备进行逐一排查。传输设备和交换机指示灯显示正常;三两收费所的光猫运行、连接、告警、收发指示灯闪烁正常。由于铁帽站网络交换机网线较多,可能出现网线环路现象,于是将网络交换机所有网线全部拔出,直接将笔记本电脑连接到ET1S上,打开以太网端口,通过局域网查看工具LANSEE和PING网管的方法测试,发现全网运行正常,ET1S正常。将网线依次恢复,当三两收费所光猫的网线接入网络交换机后,全网中断;拔出网线后,全网又恢复正常,由此确定铁帽站到三两收费所的网络出现故障[3]

(3) 观察三两收费所的光猫,运行指示灯显示正常。将铁帽站和三两收费所的两侧光猫分别连接到笔记本电脑,互相PING,网络不通,证明光猫损坏。经过仔细检查发现,三两收费所的光猫与网络交换机连接的网线线芯7、8芯连接电话线,损坏之前晚上有雷雨,可能是雷电侵入电话线,将光猫网口烧损,导致光猫芯片内部产生环路。更换两侧光猫,接入网络系统后全部网络恢复正常。

4 预防措施

(1) 为了防止类似故障的发生,需要对每个站点的网络分配不同的VLAN标签,互相隔离。

(2) 县调度所网络交换机启用3层协议,当某一站点电脑感染网络病毒或形成环路时,不会影响全网正常通信。

(3) 提高各种设备的防雷性能;交流配电系统安全地、设备工作地和总配线架防雷地应采用联合接地;保护地、信号地等各种地线符合接地电阻的要求;应按照3级防雷设计,直击雷的防护同感应雷的防护同样重要,直击雷会导致感应雷的过电压,从而影响和破坏网络系统,所以避免直击雷的破坏,设备才能有一个相对可靠的运行环境。就本次故障来说,雷电感应过电压从电话线侵入烧坏光猫,光猫端口自环,从而影响到交换机及传输设备,使连接传输设备的光缆用户全部中断,造成网络故障。

5 结束语

从传输以太网故障的分析来看,最初的表现会认为是网络主交换机有故障,将交换机连接的ET1S端口断开后,笔记本电脑与数据交换机用原有的端口和网络连接,PING收费系统服务网关正常,可进入收费系统;然后会认为光端机以太网板故障,但根据网管程序看无任何故障报警,参数重置后,故障依旧;根据以太网板出现收发数据量大,断定网络形成了自环,将所有的ET1S端口人工断开后,重新加载,确定了故障范围;在铁帽站对传输设备ET1S、网络交换机及其他设备进行逐一排查,在光猫显示灯正常的情况下,网线断开又连接后,确定了故障原因[4, 5]

故障原因的分析涉及光缆网络管理软件工作原理、网络交换机的原理及应用性能。在实际工作中,通过解决各类故障,获得不同的经验和方法,可以提高专业技术水平,形成自己的一套解决问题的方法理论。

参考文献
[1] 吴永斌,黄泽伟.计算机网络技术基础[M].北京:中国电力出版社,2009.
[2] 杨尉,李爱国.解决局域网中交换机网络环路问题的经验方法[J].通讯世界,2013(6):49-50.
[3] 吴明.交换机中网络环路常见问题详解[EB/OL].[2011-10-13].http://www.Vlan9.com.
[4] 李寅东,贾红,田崇军.内蒙古电力信息网络常见故障分析及处理[J].内蒙古电力技术,2014,32(4):85-88.
[5] 顾勇涛,葛利宏,剧树春.电力系统信息网络安全架构分析[J].内蒙古电力技术,2010,28(S2):17-19,28.