面向可用性的电力通信业务通道路由选择算法
曾庆涛1, 张国翊2, 郭少勇1, 邱雪松1, 孟洛明1    
1. 北京邮电大学 网络与交换技术国家重点实验室, 北京 100876;
2. 中国南方电网有限责任公司 电力调度控制中心通信处, 广州 510623
摘要

针对如何有效地限制网络随机故障对电力通信业务通道可用性的影响展开深入研究, 将业务通道累积故障时间超出规定的概率模型定义为业务通道失效风险度, 并对其作进一步研究.波动变化是导致电力通信事件的根本原因, 并推导出业务通道失效风险度的概率模型.最后, 将上述概率模型作为规划通道路由的决策参数, 提出了面向可用性的电力通信业务通道路由选择算法, 并通过仿真实验验证了其有效性.

关键词: 电力通信业务通道     路由算法     失效风险     随机过程     可用性    
中图分类号:TP393 文献标志码:A 文章编号:1007-5321(2015)增-0024-04 DOI:10.13190/j.jbupt.2015.增.006
Availability-Oriented Routing Algorithm for Planning Power Communication Service Channel
ZENG Qing-tao1, ZHANG Guo-yi2, GUO Shao-yong1, QIU Xue-song1, MENG Luo-ming1    
1. State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Department of Communication Management, China Southern Power Grid Company Limited, Guangzhou 510623, China
Abstract

How to limit impact of the availability of power communication services caused by random failures was presented. The business model of the cumulative probability of failure channel beyond prescribed time is defined as failure risk of service channel. A mathematical model for fluctuations of service channel availability was built and a probabilistic model of service channel failure risk was derived. This model proposed a planning decision parameter of channel routing algorithm based on random selection algorithm of failure risk degree of electric power communication service. Simulations verify the effectiveness of the algorithm.

Key words: power communication services channel     routing algorithm     failure risk     random process     availability    

电力通信部门采用统计可用性(ASPA,statistical path availability)对业务通道(SC,service channel)进行建模,并且对不同种类的业务通道可用性进行了严格的规定[1].在实际中业务通道存在违反可用性规定的风险,即存在业务通道失效风险.针对该问题,主要研究业务通道故障累积时间超出规定的概率模型,即业务通道失效风险度(SVD, service-channel violation-risk degree).在此基础上,提出了面向可用性的电力通信业务通道路由选择算法(AOR_PPCSC,availability-oriented routing algorithm for planning power communication service channel).最后,通过仿真实验,对AOR_PPCSC与面向统计可用性的路由算法(AORA, availability-oriented routing algorithm)进行了对比分析,验证了AOR_PPCSC的有效性.

1 问题模型1.1 问题描述

在建立SVD模型之前,需要分析AAPA(t) (AAPA(t),actual path availability)的变化规律,找出引起ASPAAAPA(t)差异的影响因素.首先从ASPA的定义展开分析,即ASPA被定义为在一段时间T内业务通道不中断的比例[2-5],可在每个时间段结束后依据统计数据经式(1) 计算得到该值.

(1)
(2)
(3)

式中:viV为网络拓扑G (V, E)中的节点(包含SC途经的网络设备),V代表节点的集合;eijEG (V, E)中的边(包括SC途经的光缆),E代表边的集合. A (vi)、MTBF(vi)和MTTR(vi)为节点的统计可用性、平均无故障时间和平均故障修复时间,A (eij)为边的可用性A (eij), MTBF(eij)和MTTR(eij)为边的统计可用性、平均无故障时间和平均故障修复时间.

式(2)、式(3) 中的MTBFMTTR分别由统计周期内无故障时间段(TBF,time between failure)和故障修复时间(TTR,time to repair)共同决定,通过式(1) 可将ASPA表示为

(4)

由于vieij始终处于正常与故障的交替状态,可以通过TBFi与TTRi的转化过程研究AAPA(t)的变化规律.对于该过程可以分3个阶段进行分析.

1) 从t0时刻到发生第1次故障的时刻t1,这段时间内可用性为100%,见式(5).

(5)

当第k次故障出现时,式(4) 中除TTRk外,其余项均为常数,AAPA(t)仅随TTRk变化,见式(6).其变化曲线为图 1(a)中实线部分.

图 1 故障修复前后可用性变化曲线
(6)

2) 当通道从第k次故障中恢复正常后,式(4) 中除TBFk外,其余项均为常数,AAPA(t)仅随TBFk变化,见式(7).其变化曲线为图 1(b)中实线部分.

(7)

通过上面的分析,AAPA(t)随通道正常状态和故障状态转化过程的变化曲线如图 2所示,其中AThr为可用性阀值.

图 2 实际可用性曲线

图 2中,能够清楚地看出业务通道在实际运行环境中AAPA(t)、ASPAAThr三者之间的差异.其中,ASPA是SC的AAPA(t)统计均值,必须始终大于AThr,在图中表示为水平直线,能够从全局描述SC的整体可用性,但ASPA无法反映每次故障及修复时间对AAPA(t)的影响. AAPA(t)是SC的实际可用性,在每次故障之后通过式(4) 可以计算其值.然而,TBFi与TTRi具有随机性,即便SC的ASPA在统计周期内高于其AThr,由于随机性导致AAPA(t)在一段时间内明显高于AThr,也可能因为突发故障而低于AThr.因此,无法避免AAPA(t)违反可用性规定事件,即业务通道失效事件(SFE,service-channel failure events)的发生.如果能够对SVD进行量化,就可以对SFE造成的影响加以控制,从而降低其影响的业务数量.为此,需要建立业务通道的失效风险模型SVD,下面对如何建立SVD的数学模型进行详细论述.

1.2 业务通道的失效风险模型

进一步分析式(4) 可以发现,AAPA(t)由SC的故障次数(FN, failure number)和每次故障的修复时间TTRi共同决定,即SVD等价于SC的累积修复时间TR在统计周期T内超出对应TThr的概率,其等价关系如图 3所示.因此,SVD能够用式(10) 进行量化.

图 3 可用性曲线对比图
(8)
(9)
(10)

在建立SVD的数学模型后,对其性质做进一步分析.首先,文献[6]指出vieij的故障修复时间相互独立,并且服从对数正态分布,见式(12),因此,SC的故障修复时间TTRi相互独立并且服从对数正态分布,从而TR服从的联合分布,由此可知SFE是一个随机过程,PSVD是一个随机概率模型.为了进一步分析PSVD,假设SC的故障次数FN服从平均到达率为λ的泊松分布,见式(11),则在统计周期T内第k次故障造成业务通道失效的风险PSVD(X=k, TRk>TThr)可表示为式(13).

(11)
(12)
(13)

由于vieij的故障是相互独立的,由条件概率公式及n重卷积公式,可将式(13) 展开为

(14)

由全概率公式知,式(15) 表示为

(15)

式(15) 能够通过FN概率母函数、TTRj矩母函数与其分布函数的一一对应关系,对TThr的分布函数进行化简,见式(16).

(16)

式(16) 给出了vi失效风险的近似计算方法,进而能够将其作为决策参数,以选择SC失效风险最小化路由.

2 面向可用性的电力通信业务通道路由分配算法

由于SC由vieij组成,并且vieij相互独立,所以,能够将SC失效风险最小化问题Min(PR(DT>TThr))转化为以SVD(vi)和SVD(eij)为权值的最短路径问题.针对该问题,依据Dijkstra提出了AOR_PPCSC.这里将通道SC经过的节点和边统称为通道段(CS,channel section),则SVD(vi)和SVD(eij)可以由SVD(CSi)表示. AOR_PPCSC具体步骤如下.

步骤1 输入业务的属性向量(sdbar),s为源节点,d为目的节点,b为带宽需求,a为可用性阀值,r (s, d)为sd之间的失效风险度,r0(s, d)=0.当sd之间没有通道时r (s, d)=+∞;令S={s},D=Vs.

步骤2 从拓扑G (N, E)中删去不满足带宽需求b的路径段,生成剩余子图G′(N, E).

步骤3 对于每个CSiG (N, E),由式(36) 计算其失效风险度Pcsi(TR>TThr).

步骤4 从D中选取失效风险度最小的通道段w,将其加入S.

步骤5 对D中其余通道段到s的失效风险度进行修改:如果以w为中间路径,使得从s到CSk的失效风险度缩小,则修改r (s, CSk).

步骤6 重复上述步骤4、步骤5,直到w=d.

步骤7 如果新路由与原路由不同,则创建新的业务通道,经过一个周期后,重复执行步骤2~步骤7.

3 实验分析3.1 仿真场景

实验以某省公司骨干网拓扑为基础,如图 4所示,包含74个节点和104条边.仿真实验的目的是在4种业务强度下(见表 1),对比AOR_PPCSC和AORA 12个月的业务通道失效率变化情况.其中,限定通信业务在14个汇聚节点2跳以内的节点间生成,且业务具有相同的可用性阀值0.995;节点和边的故障到达率在区间[0.006,1.5]随机生成,其修复时间在区间[0.4,0.003]随机生成;用失效业务数与总业务数的比值作为业务通道的失效率;每段光缆的带宽为5 GB.仿真结果如图 4所示.在不同业务强度下,AOR_PPCSC的平均业务通道失效率比AORA低15%以上,并且业务量的变化不影响二者的业务通道失效率.

表 1 业务强度分布

图 4 故障率对比分析
3.2 实验结果

业务通道失效率对比:图 4(a)表示在业务强度1下,AOR_PPCSC和面向统计可用性路由算法的12个月业务通道失效率.由于AOR_PPCSC按SVD寻路,使SC能够依据故障到达率和修复时间的分布规律调整路由以避开部分故障路径,从而能够降低业务通道失效率. 图 4(b)中的结果与图 4(a)类似.

4 结束语

针对电力通信业务路由规划面临的问题,深入研究业务通道失效风险度,并对该模型进行化简.在此基础上,提出AOR_PPCSC,以减小业务通道的失效数量,最小化传输设备和光缆故障导致的风险,提升电力通信业务可用性.最后,通过仿真实验,对AOR_PPCSC和AORA进行对比分析,验证AOR_PPCSC的有效性.

参考文献
[1] 广东电网公司电力调度通信中心. 广东电力通信网安全风险量化评估办法[Z]. 广州市: 广东电网公司, 2010.
Electric Power Dispatching and Communication Center of Guangdong Grid Co. Measures for the appraisal of Guangdong electric power communication network security risk quantification [Z]. Guangzhou: Guangdong Grid Co, 2010.
[2] Xia Ming, Tornatore M, Martel C, et al. Risk-aware routing for optical transport networks[C]//INFOCOM Proceedings 2010. San Diego, CA: [s. n. ], 2010: 1-8.
[3] Clemente R, Bartoli M, Bossi M, et al. Risk management in availability SLA[C]//Proc DRCN 2005. Naples: [s. n. ], 2005: 411-418.
[4] Zhou L, Grover W. A theory for setting the 'safety margin' on availability guarantees in an SLA[C]//Proc DRCN 2005. Naples: [s. n. ], 2005: 403-409.
[5] Ramachandran M, Rani N U, Gonsalves T A. Path computation algorithms for dynamic service provisioning with protection and inverse multiplexing in sdh/sonet networks[J].IEEE/ACM Transactions on Networking, 2010, 18(5): 1492–1504. doi: 10.1109/TNET.2010.2043538
[6] Xia Ming, Biswanath M. Risk-aware provisioning for optical WDM mesh networks[J].IEEE/ACM Transactions on Networking, 2011, 19(3): 921–931. doi: 10.1109/TNET.2010.2095037