随着内蒙古电力信息化建设的不断深入,内蒙 古电力信息网络的架构在不断增大,随之而来的网 络故障日渐频繁,给网络的维护工作带来困难。目 前,网络故障极为普遍,故障种类也十分繁杂,因此 有必要将常见故障进行分析归类,为准确地判断故 障原因,迅速解决网络故障,保证网络的稳定安全 运行奠定基础。 1 内蒙古电力信息网络体系架构
内蒙古电力信息网络覆盖蒙西地区10个供电 单位、内蒙古电力科学研究院、内蒙古电力(集团) 有限责任公司(以下简称内蒙古电力公司)机关及 周边电力单位,承载了内蒙古电力公司门户系统、 用电营销系统、财务系统、生产系统、协同办公系 统、法律系统、计划统计系统等多个核心的业务系 统。内蒙古电力信息网络按区域划分为6个区域, 分别是广域网区、局域网区、数据中心区、互联网 区、银行联网区、运营商区。 1.1 广域网区
图 1所示为内蒙古电力信息广域网拓扑图。内 蒙古电力信息网络西起阿拉善电业局,东至锡林郭 勒电业局,广域网在呼和浩特和包头两核心地区各 配置了2台cisco 12000系列路由器,之间的带宽为622Mbit/s,其他单位分别与这4台路由器相连,带 宽为155Mbit/s。
![]() |
图 1 内蒙古电力信息广域网拓扑图 |
局域网部分覆盖了内蒙古电力公司机关及周 边的下属单位(包括外经公司、信通中心、新闻中 心、住房资金、房地产、招标公司、满都拉资产公司、 质监站、行业协会、老干部处、资调中心、监理公司 等单位),信息网络接入机房10个,均采用千兆光纤 接入汇聚核心交换机Cisco6509。 1.3 数据中心区
图 2所示为数据中心网络拓扑图。数据中心区 采用Cisco NEXUS系列交换机组网,配置了2台 NEXUS7000交换机作为数据中心核心交换机,用 于数据中心交换机上联及各业务系统服务器汇聚, 实现了数据中心核心业务万兆互连;在数据中心配 置4台万兆接入交换机NEXUS5000,用于数据中 心万兆光纤接口服务器的接入;配置了若干万兆上 连、千兆接入交换机NEXUS2000,用于机房内千兆 服务器接入。4台NEXUS5000交换机通过冗余链 路上连NEXUS7000交换机, 带宽为万兆,保证了业务的稳 定性;交换机NEXUS2000不 能单独使用,而是作为NEXUS 5000交换机的板卡捆绑使用, 通过4条万兆光纤上连至NEX⁃ US5000。
![]() |
图 2 数据中心网络拓扑图 |
图 3所示为互联网区网络 拓扑图。内蒙古电力信息网络 设置有电信300Mbit/s和联通 200Mbit/s两条链路出口,用户 通过链路负载均衡设备进行流 量分配后经不同出口访问互联 网。流量控制设备串接在网络中,对网络带宽资源 进行分配,保证用户对不同业务的正常访问。
![]() |
图 3 互联网区拓扑图 |
图 4所示为银行联网区网络拓扑图。银行联网 区承载银行的电费代收费业务,与建设银行、农业 银行、工商银行、中国银行、招商银行、中信银行等 多家银行互联。核心交换机采用Cisco4503交换 机,下连3台Cisco3800路由器与各家银行互连。
![]() |
图 4 银行联网区拓扑图 |
运营商区担负着营销短信平台和营销集中抄 表业务,同时和电信、联通、移动3家运营商出口相 连,网络拓扑结构等同银行联网区。 2 信息网络典型故障分析及处理
针对不同的网络区域,常见的网络故障分析处 理方法如下。 2.1 广域网区
广域网区多发故障为个别供电单位与公司本 部网络中断,无法访问公司本部网络资源。该类故 障的原因及处理如下。 2.1.1 网络设备故障 2.1.1.1 配置故障
当发生广域网核心设备或各供电单位核心设 备配置故障导致网络链路中断时,如果信通中心网 络管理员能够登录到设备上进行配置,则由信通中 心网络管理员进行操作,否则由信通中心网络管理 员负责指导,相关单位管理员配合进行。首先将现 有配置和系统日志备份出来,并尽快将最近备份的 配置文件导入故障设备,使得链路在最短时间内恢 复畅通,然后对这2个配置文件进行比较,查找导致 链路中断的原因所在。最后对恢复正常运行的设 备进行最新的配置文件备份。 2.1.1.2 硬件故障
硬件故障可分为整机、引擎、电源风扇、板卡或 端口故障。如果和某台设备连接的一个或少数设 备异常,通常情况下判断为端口故障;如果多个设 备、多个业务发生异常,多数情况为引擎、整机、电 源、风扇、板卡故障。发生端口故障时,迅速将空余 端口进行配置,并将故障端口线缆迁移至新配置的 端口,通知相关业务负责人检查故障是否恢复。若 引擎、整机、电源、风扇、板卡发生故障,迅速用备品 备件替换故障硬件,如需进行相应配置,参照最后 一次备份的配置文件进行配置,并检验连通性[1]。 2.1.2 通信链路故障
如果某单位155Mbit/s广域网络不通,设备正 常且在当地能正常访问,此时用“sh int pos”命令查 看网络中断单位与核心路由器相连端口状态,如果 显示接口“UP”,协议“DOWN”,则故障应为通信链 路故障。此时,应联系通信部门,查询是否存在故 障链路,确认后配合通信部门测试链路通断,在通信 链路故障排除后,即可恢复广域网。 2.2 局域网区
局域网区常见故障为局域网内大量或个别用 户网络中断,无法访问所有网络资源。发生该类故 障的原因及处理方法如下。 2.2.1 大量用户网络故障
发生此类故障,一般原因为楼层接入交换机整 机发生故障,此时应将最近一次故障交换机备份的 配置文件复制到备机中,并逐个将用户网线倒切至 备机相应端口。 2.2.2 个别用户网络故障
个别用户网络故障有以下几种情况。 2.2.2.1 端口故障
由于温度、湿度、机房环境等外界因素导致交 换机发生部分端口硬件故障,处理时要参照原端口 配置,对空闲端口进行VLAN配置、MAC地址绑定, 并将用户网线接至新端口,测试连通性后启用。 2.2.2.2 端口配置故障
在用户接入中常因为VLAN信息配置、MAC地 址绑定等配置错误而导致用户网络中断,此时要认 真核对用户所在的VLAN信息、MAC地址信息,一 般进行重新配置即可排除故障。 2.2.2.3 IP、MAC绑定故障
有的用户在重新绑定MAC地址、重新配置 VLAN信息后仍未能解决故障,此时要查看交换机 的IP和MAC绑定信息,是否存在前后不一致现象。 这种情况一般在用户更换办公室或者更换电脑时 出现。 2.3 数据中心区
数据中心区常见的故障是用户无法访问数个 或某个业务系统,如生产系统、营销系统等,发生此 类故障的原因及处理方法如下。 2.3.1 大量业务同时无法访问
由于不同业务的服务器、服务、数据库同时出 现故障的概率很小,因此大量业务同时无法访问, 故障一般存在于核心交换机、核心防火墙。内蒙古 电力信息网络内网曾经出现过数据中心防火墙死 机导致公司门户网站、生产系统、法律系统、营销系 统等大集中业务同时无法访问的事故。出现此类 故障时,可以在用户PC客户端打开命令提示界面,利用“tracert ip”地址命令跟踪路由,若发现某个IP 地址停止跟踪,重点查看这个地址的设备以及相连 设备的运行情况。如果设备故障,首先重新启动设 备,若故障仍不能排除,迅速将之前备份的配置复 制到备机替代故障设备。 2.3.2 个别业务无法访问
某个业务访问不通,首先查看设备所接交换机 端口信息,包括VLAN、接口状态,如果端口或光纤 模块损坏则需进行更换,否则进一步检查跳线(光 纤跳线或双绞线)故障、服务器故障。 2.4 互联网区
互联网区常见故障为联网用户可以访问局域 网内的网络资源,但不能访问互联网资源,此类故 障的原因查找及处理方法如下。 2.4.1 大量用户无法访问互联网
处理方法如下:
(1)通知所在单位网络管理员使用路由跟踪 命令“tracert www.sina.com.cn”查看路由跟踪结果;
(2)如果IP路由跟踪到100Mbit/s互联网出口 地址222.74.x.x (电信分配的设备互联地址),说明单 位内部链路及配置正常,此时通知电信运营商检查 外部网络情况;
(3)如果路由跟踪无法追踪到100Mbit/s互联 网出口地址222.74.x.x,则说明单位内部网络链路、 设备硬件、防火墙策略或者设备之间的某段跳线出 现故障,需要根据路由跟踪信息中断点逐段检查设 备或链路情况。
(4)如果以上问题均不存在,则考虑是否DNS 服务器出现问题。通过命令提示符中“NSLOOKUP” 命令来解析外网地址,如果能正常解析,说明DNS 服务正常,否则通过检查配置文件或者重启DNS服 务器来解决[2]。 2.4.2 个别用户无法访问互联网
这种情况较为简单,影响范围小,一般情况下 为用户PC软件问题、网络设置问题或硬件故障。通 过检查网卡驱动、操作系统、浏览器等相关配置进 行故障排查。 2.4.3 访问互联网速度变慢
如果访问互联网速度变慢,但还能够访问,可 能的情况为网络内部病毒爆发或者有攻击行为,这 时可以通过出口带宽流量管理设备查看用户流量 排行、应用流量排行,根据反馈结果定位病毒源头, 立即断网进行客户端清理;或者通过核心路由器和 各单位相连的接口流量来判断,如果出现流量异常 偏大的情况,立刻通知相关单位管理员或暂时中断 广域网连接进行查杀病毒、攻击行为[3]。 2.5 银行联网区及运营商区
运营商区部署营销短信平台业务和集中抄表 业务,典型故障现象及处理方法与银行联网区类似, 可参照银行联网区故障处理方法进行。银行联网 区常见故障为多家或个别银行无法正常使用代收 电费业务,此类故障的排除方法如下。 2.5.1 多家银行收费故障
发生多家银行同时无法收费情况,考虑银行联 网区核心路由器、交换机、防火墙发生故障。根据 故障聚集点检查相应设备运行状况,是接口故障则 更换接口,板卡故障则更换板卡,若为整机故障则 利用备机代替。 2.5.2 个别银行收费故障
发生个别银行收费故障时,做以下处理。
(1)首先登录与银行连接的路由器,“ping”对 端互联地址;
(2)若不通,检查互联链路及配置情况,有问 题进行相应处理;
(3)若连通,检查内网方向交换机、防火墙、协 议转换器硬件及配置,有故障进行相应处理;
(4)如果以上均无问题,则通知应用系统管理 员检查应用服务器情况,发现问题进行相应处理。 3 结语
随着内蒙古电力信息网络的不断建设、扩容, 信息网络规模不断扩大,各个区域之间相对独立又 存在一定联系。这就要求运行维护人员在工作中 必须不断学习和积累经验,熟知每一个区域每一台 设备的功能、连接方式、配置方式等,这样在发生故 障时才能够做到判断准确、处理及时,保证内蒙古 电力信息网络的畅通。
[1] | 霍扬,龚俭.计算机网络故障分析及维护研究[J].硅谷, 2008(7):11-15. |
[2] | 高粹红.计算机网络故障分析及维护研究[J].机电信息, 2009(24):9-11. |
[3] | 张东进.探析计算机网络故障与维护策略[J].电脑编程技巧与维护,2011(2):15-18. |