近几年来,随着锡林郭勒电网的迅速发展,传统的变电站集控运行模式已经不能满足电网发展的需要。为此,锡林郭勒电业局建设了一套完善的变电站标准化运维管理体系——DCLive IT运维服务器集中管理系统,以保证变电站各项业务的正常运行。
1 总体设计 1.1 设计思路及原则 1.1.1 设计思路根据锡林郭勒电业局变电站建设与业务发展情况,并结合变电站运维管理现状,变电站的运维管理建设工作的总体指导思想确定为“集中管理、安全可控”,并在此基础上提出了锡林郭勒电业局变电站运维管理总体思路:
(1) 遵循标准,统一规划。锡林郭勒电业局变电站的规划建设必须按照电力行业建设相关标准和规范进行统一部署,制定总体规划,加强集中化管理。
(2) 明确目标,突出重点。明确锡林郭勒电业局变电站运维管理建设目标,在建设目标制定上有主有次,突出重点,优先考虑急需解决的问题。
(3) 模式创新,提高效率。在锡林郭勒电业局变电站原有的运维管理模式基础上进行创新,通过现代化的技术手段实现“集中化、自动化”的运维管理模式,使得IT管理流程化,从而提高运维人员工作效率和服务质量,提供更专业化的业务服务。
(4) 加强监管,保障安全。正确处理锡林郭勒电业局变电站的管理、风险与安全的关系,综合平衡成本和效益,一手抓管理,一手抓安全,加强监管,制定与完善运维与信息安全保障体系。
1.1.2 设计原则在运维管理建设总体思路指导下,结合锡林郭勒电业局的实际情况进行变电站运维管理体系建立,要满足管理的集中性、操作的安全性、人员行为的合规性等要求[1]。该系统基于锡林郭勒电业局变电站基础网建立IT设施运营管理系统,应遵循实用性、先进性、可靠性、安全性、开放性、扩展性等原则。
1.2 设计功能 1.2.1 增加调控中心监视手段通过该技术,调控中心工作人员在调控中心即可查看各变电站运维服务器设备的界面,调取各功能模块中的报警信息,并与调度自动化信息进行比对,提高信息监视的准确度。
1.2.2 远程集中控制通过TCP/IP方式进行管理,用户可以在任何网络连通地点启停、重启和控制每个变电站的各类设备;简单的运维服务器设备系统维护操作可在调度主站进行,提高了设备的维护速度;提高维护效率,有效降低工作量[2]。
1.2.3 设备访问控制通过授权访问审计机制控制运维人员的访问范围,确保运营过程管理规范,使设备维护全程受控。
1.3 总体结构DCLive IT运维服务器集中管理系统由协议代理管理器响应应用代理链接请求,根据策略管理器收到的访问控制ACL执行策略,对允许的合法请求由代理管理器建立客户端与用户端的链接,同时形成审计记录,并通过代理录像监控器进行操作画面的采集及入库,从而实现对代理管理器全生命周期的监控;对于一般的网络访问请求,通过网络报文抓取探针进行侦听,采集后的数据通过协议报文分析器进行处理,如发现非法网络访问的链接请求,由TCP协议阻断控制器实施阻断动作。系统总体结构如图 1所示。
![]() |
图 1 DCLire IT运维服务器集中管理系统总体结构 |
DCLive IT 运维服务器集中管理系统由DCLive IT运维综合管理平台、网络运维安全网关(ICS)、网络风险监控系统(ICA)和数据库4大部分构成,系统硬件构造如图 2所示。
![]() |
图 2 DCLive IT运维服务器集中管理系统硬件构造 |
DCLive IT运维综合管理平台是德讯科技股份有限公司为用户数据中心IT基础设施运维管理开发的集中化综合管理与安全审计平台,集带内、带外管理于一体,包括IT风险控制管理、数字KVM交换机管理、串口管理、能源管理、环境管理等方面,为各种数据中心、分支机构、无人值守机房等提供分布式控制、集中控管的IT设施运维管理手段,以实现环境保障、电源可控、运行可靠、维护便捷、操作安全的IT管理目标。
DCLive IT运维服务器集中管理系统的管理端具有对所有变电站被控设备管理的功能,可以根据管理需要制定访问控制、阻断和审计策略,平台管理端还内置了Telnet、SSH、RDP、VNC等客户端管理工具。另外,该平台提供了丰富的查询和历史画面回放功能。
2.2 网络运维安全网关(ICS)ICS设备用于实现代理应用的集中化管理,对数据中心所有的运维工作进行扎口。在访问某一变电站被控设备时,运维人员必须通过ICS,在通过合法性检查后,系统才会自动建立与被控设备之间的通信会话[3]。在会话建立的同时系统会自动进行全程操作画面的采集和保存。对于未通过合法性检查的网络请求或未通过ICS对被控目标设备直接发起的网络请求,系统会根据定制的策略自动实施阻断。
2.3 网络风险监控系统(ICA)ICA设备主要用于网络侦听、TCP协议阻断和Telnet协议报文捕获。既可与ICS进行联合部署,也可独立部署在网内,通过旁路侦听方式监控内网中的链接请求[4]。对于非法链接,系统可根据阻断策略自动实施阻断操作,同时还可以捕获网内被控节点的Telnet网络报文,通过报文重组后,回放此Tel⁃net实际操作画面。
2.4 数据库数据库分为2种类型:1种是日志审计数据库,用于记录用户信息、策略信息和链接的日志信息等内容;另1种是文件数据库,专门用于记录ICS所记录的每个图形化链接的录像信息,录像信息与日志信息直接关联,通过查询日志信息后播放对应的录像文件,真实再现历史的操作画面。
3 系统部署、特性及结构 3.1 系统部署DCLive IT运维服务器集中管理系统可以根据网络的实际情况进行灵活部署,既可以集中部署,也可以分布式部署。系统拓扑如图 3所示。
![]() |
图 3 DCLive IT运维服务器集中管理系统拓扑图 |
(1) 支持各种操作类型,包括基于命令行的Telnet、SSH和基于图形化的RDP和VNC等多种应用协议,满足运维多样化的操作要求。
(2) 在系统内部提供4A管理体系,实现了用户、认证、授权和审计的统一,既简化了系统管理,又提高了系统的安全性。
(3) 操作方便快捷,采用B/S结构进行设计,在管理端直接通过浏览器进行操作。
(4) 对现有网络结构和用户环境的影响最小。一般情况下,在实现强制集中化管理时,无需调整网络结构,更不需要在被控目标设备上安装代理程序。
(5) 实现对所有代理运维设备操作画面的图形化回放,通过报文重组技术,再现运维过程的操作画面。可根据会话、关键字、输入内容进行画面的定位和回放,克服了以往审计系统逐条查看信息、逐条分析和信息内容不直观的缺陷。
(6) 数据处理能力强大。采用嵌入式开发技术,可达到单台设备支持500路Telnet、100路SSH、50路RDP和20路VNC的并发访问处理能力。
(7) 数据检索查询和画面快速定位的能力强大。系统针对命令行操作方式实现了根据输入的内容和屏幕关键字进行检索的功能,并通过检索内容进行快速定位和画面回放[5]。
(8) 访问控制和阻断策略管理灵活,为数据中心运维管理创造了可控、安全的环境。
3.3 系统结构锡林郭勒电业局DCLive IT运维服务器集中管理系统共分为7大部分:系统设置、报表(访问用户、设备、时长、次数等)、报警、日志、策略、用户管理、设备管理(见图 4所示)。主站通过系统设置对其他模块进行管理。报表模块可以查看访问用户、访问设备、访问时长和次数等。报警模块显示服务器的实时信息,如果有服务器发生故障,会显示服务器的报警情况及报警等级。日志模块包括系统操作日志、审计日志、邮件和短信发送日志等。策略模块主要设置了链接策略、访问阻断策略、账户管理策略和密码修改策略。用户管理模块主要设置了锡林变运维站、温都尔运维站和玉龙运维站3个变电站的账户,并分配其权限,管理各自运维站的设备。设备管理模块涵盖了所有的服务器,模块信息包括服务器的名称、位置、IP地址、操作系统等。各模块的信息均具有导出功能,有利于查看整体配置。
![]() |
图 4 DCLive IT运维服务器集中管理系统控制界面 |
超级管理员拥有最大权限,不仅可以在主站进行各个功能模块设置,而且在紧急情况下还可以在运维站端对系统进行维护,提高了系统的利用率及维护人员的工作效率。
4 应用效果锡林郭勒电业局在DCLive IT运维服务器集中管理系统建设前,变电站数量多、分布广,设备发生故障时,只能依靠点对点的传统运维模式进行处理,运维人员花费几个小时赶到现场,却只是处理服务器重启或软件重新链接等简单故障,浪费财力、物力,劳动力得不到充分利用。而且操作人员对远端变电站的监控后台设备的操作无法进行实时跟踪。
DCLive IT运维服务器集中管理系统建成使用后,实现了服务器本地化维护,避免了在调控一体模式下,站间距离远导致的维护不及时,减少了90%以上的到站维护工作,节约了费用,而且大大提高了工作效率,保证了系统运行的可靠性。另外,对于电网的突发情况如线路跳闸等,可以通过该系统在第一时间内查看最全面的信息,便于进行远程事故分析。
5 结语锡林郭勒电业局变电站采用DCLive IT运维服务器集中管理系统来规范变电站的各项业务,对提升锡林郭勒电业局变电站整体管理水平意义重大,也为其他电业局变电站运维系统管理设计提供借鉴,对工程建设具有一定的指导意义。
[1] | 张帆. KVM技术-服务器机房设备集中远程控制解决方案[J]. 中国煤炭工业 , 2007 (6) :44–45. |
[2] | 续毅. 关于电力调度自动化系统综合运维平台的创新性思考[J]. 中国科技博览 , 2012 (34) :236. |
[3] | 韩胜峰. 调度自动化系统KVM配置方案探讨[J]. 中国科技纵横 , 2012 (16) :52. |
[4] | 夏友斌, 黄晟. 基于KVM、远程桌面和VPN的数据机房远程维护[J]. 安徽电力 , 2010 (2) :54–58. |
[5] | 史英. 浅析调度自动化系统运维存在的问题及建议[J]. 通讯世界 , 2015 (19) :145–146. |