基于MDP的群组时延约束的IEEE 802.15.4随机接入控制算法

引用本文

黄玉兰, 刘健, 刘子川, 迟学芬. 基于MDP的群组时延约束的IEEE 802.15.4随机接入控制算法[J]. 北京邮电大学学报, 2015, 38(4): 74-78. 复制到剪切板

HUANG Yu-lan, LIU Jian, LIU Zi-chuan, CHI Xue-fen. A MDP-Based Group Delay Constrained Random Medium Access Control Algorithm in IEEE 802.15.4[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOMMUNICATIONS, 2015, 38(4): 74-78. 复制到剪切板

Permissions

《北京邮电大学学报》编辑部所有

基于MDP的群组时延约束的IEEE 802.15.4随机接入控制算法

黄玉兰, 刘健, 刘子川, 迟学芬

吉林大学通信工程学院, 长春 130012

作者简介: 迟学芬(1962—), 女, 教授, 博士生导师, E-mail: chixf@jlu.edu.cn.

收稿日期: 2014-06-24

基金项目: 吉林省科技发展计划项目(20130413052GH)

摘要

为保证群组时延敏感业务的传输时间限制, 提出了基于马尔可夫决策过程(MDP)的群组时延约束随机接入控制算法.与现有对保证单个数据包时延或平均包时延的研究不同, 以分组的整体时延为研究对象, 将群组时延约束作为该类业务的服务质量指标.该算法动态估计介质访问控制层参数和MDP决策门限, 权衡当前最大回报和未来可能更大的回报制定传输策略.终端选择性地参与信道资源竞争, 缓解数据突发造成的信道拥塞.仿真结果表明, 在业务负荷较大时, 所提算法更能有效保证群组时延敏感业务的服务质量需求.

关键词: IEEE 802.15.4 马尔可夫决策过程群组时延敏感业务群组时延约束

中图分类号:TN929.53 文献标志码:A 文章编号:1007-5321(2015)04-0074-05 DOI:10.13190/j.jbupt.2015.04.016

A MDP-Based Group Delay Constrained Random Medium Access Control Algorithm in IEEE 802.15.4

HUANG Yu-lan, LIU Jian, LIU Zi-chuan, CHI Xue-fen

Department of Communication Engineering, Jilin University, Changchun 130012, China

Abstract

To guarantee the transmission time constraints of group delay constrained services, a group delay constrained random medium access control algorithm for IEEE 802.15.4 was proposed based on Markov decision process (MDP). Different from the existing researches, the delay experienced by a group of packets instead of one single packet in a group was paid attentions. Also, the group delay constraints was used as quality of service indicators for the first time. In the algorithm, the medium access control layer parameters and decision threshold are estimated dynamically, and the optimal policy is used as a trade-off between the highest immediate rewards in the present and a possibly higher reward in the future. With the proposed algorithm, the terminal device will choose the best transmission strategy to overcome the channel congestion resulting from burst data. Simulation results show the efficiency of the proposed algorithm when the traffic load becomes heavy.

Key words: IEEE 802.15.4 Markov decision process group delay constrained services group delay constraints

随着无线传感器网络的快速发展，越来越多机器类通信业务对时延敏感^[1]. IEEE 802.15.4网络中，基于冲突避免的载波侦听多点接入机制和基于先到先服务的保护时隙(GTS, guaranteed time slot)分配策略不能较好地保证时延敏感业务的服务质量(QoS, quality of service)^[2-3]，因此提出一种有效保证时延约束的接入机制十分必要.

群组时延敏感业务(GDCS, group delay constrained services)是指数据包以分组形式成批到达介质访问控制(MAC, medium access control)层，不同分组具有不同包数量，但每个分组有固定时延限制的业务.现有文献均以平均包时延或单个数据包时延作为QoS度量指标^[4-5].与单个数据包的时延约束相比，整组数据的时延约束更能体现GDCS的QoS需求.同一分组的数据只需在分组截止期限之前完成发送即可，不需要单个数据包实时、贪婪地参与信道竞争.因此提出基于马尔可夫决策过程(MDP, Markov decision process)的群组时延约束的分布式最优随机接入算法，保证GDCS的QoS.

1 业务源模型、超帧结构和参数估计1.1 网络模型和业务源模型

设拓扑是由中央协调器和N个节点组成的星形网络，如图 1(a)所示.为节省申请或释放GTS的时间开销，在数据帧帧头中添加固定比特位用于GTS请求和释放. MAC层超帧结构如图 1(b)所示.

图 1 网络拓扑和超帧结构

设每一分组中数据包数量服从2维马尔可夫链调制的泊松过程. ρ₁和ρ₂分别为状态1和状态2的离散到达率，则到达k个数据包的概率函数为

(1)

其中ϑ₁和ϑ₂为对应状态的稳态概率，则平均到达率ρ=ϑ₁ρ₁+ϑ₁ρ₂.设数据包能容忍的最大时间延迟为分组到达时间间隔，等于超帧长度的H倍.当超过时延期限后，新的分组到达，未完成发送的数据包被丢弃.

1.2 MAC层参数估计

设路径损耗函数Q(l, f)为

(2)

其中：l为节点到协调器的距离，f为系统带宽.设阴影衰落F服从均值为0、方差为σ (4.4dB)的对数正态分布.若发送功率为T，则接收功率E=T-Q-F.设接收机门限为ψ，则中断概率P_o为

(3)

其中erfc()为余误差函数.

设α(t)和β(t)分别表示超帧t执行第1次信道空闲评估(CCA, clear channel assessment)和第2次CCA检测信道空闲的概率.载波侦听信道空闲概率为α(t)β(t).设Z(t)为在超帧t的竞争接入阶段(CAP, contention access period)阶段发送1个数据包的平均时间.利用式(4) 迭代更新参数α(t), β(t)和Z(t).

(4)

其中α^*(t-1) 和β^*(t-1) 分别为节点在第t-1超帧进行第1次和第2次CCA检测信道空闲次数与总检测次数的比值，同时统计获得平均服务时间的实时因子Z^*(t-1).在给定的网络参数配置下，利用马尔可夫链建模竞争接入过程可获得相关参数的估计.

P_c(t)表示由于侦听不完善(隐藏终端问题)或多个节点的退避计数器同时减为0造成碰撞的概率.设当β(t) > 0.5时，数据传输产生碰撞的概率P_c(t)=(1-β(t))/β(t)，否则P_c(t)=1.则由碰撞或中断引起重传的概率为

(5)

在CAP阶段数据包成功传输的概率可以表示为

(6)

其中θ为最大重传次数.

2 群组时延约束的MDP最佳策略2.1 MDP状态集

MDP状态集S由数据包剩余可利用时间D、缓存大小B和GTS数量G组成，即S={D, B, G}.其中，B={0, 1, …, b_max}，b_max为缓存的最大容量；D={1, 2, …, H}，H为传输时延期限；G={0, 1, …, g_max}，g_max为能分配的最大时隙数量.第t超帧的节点状态可以表示为

(7)

其中：b(t)∈B，d(t)∈D，g(t)∈G.

2.2 MDP动作集

A表示超帧t期间可能采取的动作集合，有

(8)

其中：a₁表示在CAP阶段发送数据；a₂表示在非竞争接入阶段(CFP, contention free period)发送数据；a₃表示请求GTS；a₄表示请求GTS，并在CFP阶段发送数据；a₅表示同时在CAP和CFP阶段发送数据；a₆表示在CFP阶段释放GTS；a₇表示进入休眠模式.

2.3 状态转移概率

采取动作a(t)由s(t)转移到s(t+1) 的概率为

(9)

1) 缓存量b(t).当d(t)=1时，缓存状态的变化由到达率决定

(10)

当d(t) > 1时，缓存变化由CAP阶段服务数据包个数x和CFP阶段服务数据包个数y决定.设节点在CAP阶段的服务服从均值为μ(t)=(16-M)/Z(t) (M为CFP长度)的泊松分布，则CAP阶段服务x个包的概率为

当d(t) > 1时，执行动作a(t)缓存状态转移概率为

(11)

其中：υ=2^BO－2为每个时隙能发送的数据包数量；为伯努利概率函数，表示CFP阶段成功传输y个数据包的概率.

2) GTS数量g(t).状态转移概率为

(12)

执行其他动作，GTS分配状态不变.当d(t) > 1时，在t+1超帧数据包的剩余可利用时间减1，即d(t+1)=d(t)-1.当d(t)=1时，新的分组到达缓存，则d(t+1)=H.

2.4 MDP回报函数

回报函数Γ(s(t), a(t))用于奖励在超帧t发送数量稳定的数据包，即

(13)

其中k为当前分组到达缓存的数据包数量.回报函数J(s(t), a(t))奖励节点在状态s(t)采取合理的接入方式为

(14)

其中：I()为指示函数；ω₁(t)、ω₂(t)、ω₃(t)和ω₄(t)为在超帧t起始时刻动态更新的决策门限，则

在超帧t起始时刻，在状态s(t)采取动作a(t)获得总的回报值为

(15)

最佳策略π^*是能使得累积折扣回报期望V_π^*(s(t))最大的策略，即

(16)

其中γ为折扣因子.利用值迭代算法求解MDP，获得最佳发包策略π^*，折扣因子γ=0.6保证收敛.

3 仿真分析

当BO=SO≥2时，1个时隙传输120×2^BO-2B^[2]，能传输的数据包个数υ=2^BO－2.仿真参数如表 1所示.

表 1 相关参数

仿真分别运行标准接入机制和改进接入机制，比较分析所提算法性能.设在标准接入机制中每个节点固定分配⌊M/N」个时隙.不同分组到达率时的丢包率和分组成功转移率如图 2和图 3所示.当分组到达率较低时，节点丢包主要由信道衰落造成传输中断和载波侦听不完善造成碰撞引起.随着分组到达率增大，丢包主要由群组时延约束引起.

图 2 2种接入机制丢包率对比

图 3 2种接入机制分组成功转移率对比

仿真结果表明，改进机制能有效减少群组时延约束造成的丢包，提高分组成功转移率，更好地保证GDCS的QoS.当到达率较低时，节点感知到宽松的时延约束进入休眠模式，与每个数据包实时竞争信道资源的标准接入机制相比，所提算法的性能略有降低.标准接入机制和改进接入机制的缓存平均队长如图 4所示.成批到达的大量突发数据包同时竞争信道资源，造成信道拥塞，使分组成功转移率快速降低.改进接入机制能明显降低缓存平均队长，减小数据包平均等待时间.

图 4 2种接入机制缓存平均队长对比

4 结束语

首次将群组时延约束作为GDCS的QoS指标，提出基于MDP的群组时延约束的IEEE 802.15.4随机接入控制算法.节点执行最佳MDP策略，数据包不再实时、贪婪地参与信道竞争，而根据信道状态、群组时延约束和缓存量大小选择性地竞争信道资源，保证GDCS分组的整体时延约束.丢包率、分组成功转移率和平均队长的仿真结果都表明所提算法在业务负荷很大时，能有效保证GDCS的QoS.

参考文献

[1]	Chi Xuefen, Dong Wen, Liu Zichuan. Jitter analysis of H2H services under H2H and M2M mixed services arrival[J].The Journal of China Universities of Posts and Telecommunications, 2014, 21(3): 71–76. doi: 10.1016/S1005-8885(14)60303-4
[2]	IEEE 802. 15 working group. 0738149977—2006. Wireless medium access control (MAC) and physical layer (PHY) specifications for low-rate wireless personal area networks (WPANs)[S]. New York: The Institute of Electrical and Electronics Engineers Inc, 2006: 1-320.
[3]	Kouba A, Alves M, Tovar E. An implicit GTS allocation mechanism in IEEE 802.15.4 for time-sensitive wireless sensor networks theory and practice[J].Real Time System, 2008(1-3): 169–204.
[4]	Shrestha B, Hossain E, Choi K W. A Markov decision process (MDP) based congestion aware medium access strategy for IEEE 802.15.4[C]//GLOBECOM IEEE Global Telecommunications Conference. Houston: Institute of Electrical and Electronics Engineers Inc, 2011: 1-5.
[5]	Chen Hui, Chan H C B, Chan Chikong. QoS-based cross-layer scheduling for wireless multimedia transmissions with adaptive modulation and coding[J].IEEE Transactions on Communications, 2013, 61(11): 4526–4538. doi: 10.1109/TCOMM.2013.092413.120828