扩展功能
文章信息
- 张圣忠, 李继东, 徐赛娜
- ZHANG Sheng-zhong, LI Ji-dong, XU Sai-na
- 城市配送车辆限行政策评价的多代理模型与仿真
- A Multi-agent Model and Simulation of Urban Distribution Vehicle Restriction Policy Evaluation
- 公路交通科技, 2018, 35(6): 87-94
- Journal of Highway and Transportation Research and Denelopment, 2018, 35(6): 87-94
- 10.3969/j.issn.1002-0268.2018.06.013
-
文章历史
- 收稿日期: 2017-08-16
2. 江苏纬信工程咨询有限公司, 江苏 南京 210014
2. Jiangsu Weixin Engineering Consultants Co., Ltd., Nanjing Jiangsu 210014, China
城市配送作为城市交通运输系统的重要组成部分,对于提升城市经济社会运行质量具有显著贡献,但同时也会带来环境污染、交通拥堵等负面影响[1]。为了减少城市配送对城市产生的负外部性,城市交通管理部门通常会对驶入城区的配送车辆实施交通管制措施,其中较为典型的是配送车辆限行。车辆限行能显著减少限行区域(一般为中心区)的货运交通流,从而有效降低限行区域内配送车辆对城市中心购物环境和城市交通的干扰,具有较好的社会效益[2]。但从城市配送企业角度看,城市配送车辆限行会在不同程度上导致配送车辆进城难、通行难、停靠难等问题,会增加配送成本和配送时间,影响配送服务质量[3],甚至会使城市配送在车辆限行政策下成为城市物流的短板[4]。此外,城市配送车辆限行政策还可能引发新问题,如城市配送企业为降低配送成本采用面包车改货运车进行配送,反而会增加限行区域的交通量及环境污染[5]。由此可见,城市配送车辆限行涉及托运人、承运人、收货人、政府、城市居民等诸多利益相关者,且对利益相关者的利益影响不尽相同,政策制定者需要对限行政策进行系统评价,以综合权衡不同利益主体的诉求及影响,并据此制订适当的限行政策。
近年来,研究城市配送问题的一种新方法是通过构建多代理模型来描述各利益相关者在城市配送活动中的交互特性,进而评价城市配送策略、方案或政策,其科学性和优越性得到了验证[6-8]。Teo等基于电商的城市配送问题,构建由车辆调度、拍卖理论、强化学习模型等组成的多代理模型,对城市物流策略(如公路收费策略)进行了评价[9];Duin基于对城市配送中心、承运人、卡车司机、零售商、政府等多个代理的分析,构建了城市配送中心物流方案评价的多代理模型[10]。Taniguchi从利益相关者角度出发,从运输成本、环境污染、通行费收益等方面综合评价了日本城市配送车辆管制政策对各利益相关者的影响[11]。Dai在此基础上建立了多代理模型,将多代理技术引入利益相关者的行为识别、分析及选择中,从运输成本、货车尾气氮氧化物排放等方面评价了日本货车限行、道路收费等政策对城市配送利益相关者的影响[12]。
考虑到我国城市配送车辆限行政策在限行方式、限行标准等方面与国外存在较大差异,本研究借鉴多代理建模方法,从城市配送活动涉及的利益相关者及其利益博弈过程出发,重新构建适用于城市配送车辆限行政策评价的多代理模型,并通过算例进行仿真,验证模型的可行性。
1 城市配送多代理模型的构建城市配送多代理模型是在系统分析城市配送利益相关者构成、利益相关者的目标及行为的基础上,将城市配送系统的利益相关者抽象为各利益代理,并建立利益代理间的信息交互和学习机制,从而达到整个系统的最优。
1.1 利益相关者目标及行为设定城市配送活动中涉及的利益相关者均有各自利益目标,且根据目标决定行为,而了解其利益目标及行为是构建多代理模型的前提。根据城市配送的基础理论,本研究将城市配送多代理系统中的利益代理界定为承运人、托运人、收货人、城市居民和政府管理部门,并对其利益目标及行为做出一般性设定(如表 1所示)。各利益代理在一定状态下,按照既定目标,通过自身行为向环境输出一定的信息,充实环境数据,同时为适应环境变化不断改变自己的行为。
| 利益相关者 | 利益目标 | 行为 |
| 承运人 | 配送利润最大化 | 向托运人提供运输报价并为托运人配送货物 |
| 托运人 | 运输成本(配送费用)最小化 | 选择承运人并要求承运人配送货物 |
| 收货人 | 准时收到所需货物 | 制定收货时间窗,要求承运人在既定时间窗内将货物送达 |
| 城市居民 | 拥有良好的生活环境 | 当尾气排放超标时向政府管理部门投诉 |
| 政府管理部门 | 保障居民生活环境 | 决定是否采取相应限行政策来减少投诉 |
1.2 模型框架
城市配送多代理模型(见图 1)主要由车辆路径选择模型和强化学习模型组成,其中车辆路径选择模型作为承运人代理的行为规则嵌入强化学习模型中,是强化学习模型运行的开端。2个模型需要交替执行以实现城市配送活动持续动态的过程。
|
| 图 1 多代理模型框架图 Fig. 1 Framework of multi-agent model |
| |
1.3 限行政策下带软时间窗的车辆路径选择模型
考虑客户配送时间窗要求、车辆限行政策的限行要求以及城市配送活动的实际情况,借鉴现有研究[13-15],本研究作如下假设:①客户的配送时间窗为软时间窗,即配送活动必须在客户要求时间范围内进行,否则承担违约罚金;②配送活动必须满足限行区域、限行时间、限行车型要求;③配送车辆有多种车型,每种车型数量一定。
设有N位客户,其中i,j表示单个客户点,i, j=(0, 1, 2, …, N),lij表示客户i和客户j间的距离,di表示客户i的需求量,[ei, li]表示客户i的时间窗,si表示车辆到达客户i的时间,fi为车辆在客户i的服务时间,即停留时间,tij表示车辆从客户i到客户j的行驶时间,[Tai, Tbi]表示客户i受限行影响的时间窗。i, j=0表示配送中心,配送中心有P种车型,每种车型的车辆数为np(p=1, 2, 3, …, P),包含所有车型的车辆总数为M,每种车型的载质量记为Qp(p=1, 2, 3, …, P),[To, Td]表示配送中心工作时间窗,即车辆在To后可出发,Td前必须返回。α为车辆单位运输距离的变动成本,β为单位车辆的固定成本,γ, δ分别为车辆等待及延误的单位时间成本。
数学模型如下:
定义车辆的行驶情况:
|
(1) |
|
(2) |
目标函数设置为总配送成本最小。配送总成本包括车辆固定成本、变动成本及时间成本。车辆固定成本包括车辆折旧及司机的日均薪酬,为一个固定值;变动成本主要是燃油费,与行驶里程成正比;时间成本包括等待和延误产生的时间成本。
|
(3) |
s.t:
① 从客户点i到客户点j的车辆与离开客户点j的车辆相同,其中m表示至j的任意一点,用以表示行驶方向:
|
(4) |
② 每个客户有且仅会被某一辆车进行配送服务:
|
(5) |
③ 一辆车完成一个客户点的服务后必须离开该客户点,不得停留:
|
(6) |
④ 每辆车完成所有配送任务后回到配送中心:
|
(7) |
⑤ 配送车辆载重量限制:
|
(8) |
⑥ 配送时间符合客户时间窗限制:
|
(9) |
⑦ 配送车辆出发、返回时间符合配送中心时间限制:
|
(10) |
⑧ 车辆限行的时间窗限制:
|
(11) |
|
(12) |
时间成本函数:
|
(13) |
路径选择模型使用遗传算法进行求解,遗传算法具有强鲁棒性、并行性及强全局搜索能力等特点[16],且运算简单、运算结果可靠。通过设置较高的初始种群规模保证模型的求解效率,同时增加模型的迭代次数优化计算结果。
1.4 强化学习模型Q学习算法广泛应用于强化学习中,能有效优化多代理模型的运行。强化学习的原则是实现自身效用最大,Q学习算法将计算利益相关代理某个状态-行为对下的评价值,以此评价值作为选择行为时获得的效用。其中评价值也称Q值,记为Q(st, at),是在状态st时根据利益目标选择行为at并执行,以此类推循环执行得到的。各代理以累积评价值最大化为目标选择最优行为。Q学习算法较为成熟,收敛性已被证明,本研究直接引用Q值的一般修正公式:
|
(14) |
式中,(st, at)为状态-行为对;参数α称为学习率;γ为折扣率;rt为在状态st下执行动作at时环境反馈的真实效用。
根据各代理利益目标计算各代理在行为中获得的效用,具体效用的含义:
(1) 托运人的报酬函数为配送费用的相反数,计算公式为:
|
(15) |
式中,p(st)为st状态下托运人支付的单位运价;q(st, at)为状态st下执行动作at时托运货物的数量。
(2) 承运人的报酬表现为预期的配送利润,计算公式为:
|
(16) |
式中F(st, at)为状态st下执行动作at时的配送成本。
(3) 政府每个动作-状态对下的报酬值设为尾气排放量的倒数,尾气排放量的计算公式为:
|
(17) |
式中,EQpw为第p类型车,w种尾气的预期排量;Efpw为第p类型车,w种尾气的排放因子;lij为两个客户点之间的路线距离。
尾气主要包括CO,NOx,HC等污染气体,污染物排放因子为一辆机动车行驶单位里程所排放的污染物的质量[17],各排放物的排放因子如表 2所示。
| 排放物 | 微型 | 轻型 | 中型 |
| CO | 18.1 | 1.0 | 4.2 |
| NOx | 1.8 | 1.5 | 1.9 |
| HC | 2.7 | 0.2 | 1.1 |
2 算例与仿真 2.1 情景设置
假设有25 km×25 km的城市区域(由内到外分别为Ⅰ区、Ⅱ区、Ⅲ区,见图 2),区域内纵横各26条主干道,包括625个规格为1 km×1 km的居民区、1个坐标为(20,20)的配送中心和21个随机分布在区域内的客户点。客户点的坐标和需求信息如表 3所示,配送中心各车型的数据如表 4所示,货车配送时间设为4:00~24:00,车辆行驶速度随时段变化,高峰期和非高峰期的平均车速分别设定为26 km/h和46 km/h。
|
| 图 2 城市仿真路网 Fig. 2 Urban simulation road network |
| |
| 编号 | 横轴坐标 | 纵轴坐标 | 初始需求量 | 出发时间(ei) | 到达时间(li) | 服务时间 |
| 0 | 20 | 20 | 0 | 0 | 200 | 0 |
| 1 | 35 | 17 | 5 | 20 | 89 | 5 |
| 2 | 55 | 19 | 6 | 71 | 195 | 5 |
| 3 | 15 | 10 | 10 | 32 | 137 | 5 |
| 4 | 30 | 5 | 8 | 5 | 156 | 5 |
| 5 | 84 | 20 | 9 | 24 | 85 | 5 |
| 6 | 15 | 30 | 7 | 20 | 107 | 5 |
| 7 | 10 | 43 | 8 | 61 | 138 | 5 |
| 8 | 2 | 60 | 7 | 28 | 123 | 5 |
| 9 | 25 | 30 | 6 | 54 | 153 | 5 |
| 10 | 79 | 50 | 6 | 66 | 105 | 5 |
| 11 | 30 | 60 | 5 | 101 | 156 | 5 |
| 12 | 20 | 65 | 7 | 33 | 152 | 5 |
| 13 | 50 | 35 | 6 | 38 | 97 | 5 |
| 14 | 62 | 77 | 8 | 70 | 199 | 5 |
| 15 | 65 | 35 | 6 | 8 | 79 | 5 |
| 16 | 35 | 69 | 9 | 37 | 98 | 5 |
| 17 | 31 | 52 | 10 | 116 | 175 | 5 |
| 18 | 32 | 63 | 7 | 24 | 179 | 5 |
| 19 | 55 | 59 | 8 | 53 | 150 | 5 |
| 20 | 55 | 45 | 9 | 106 | 135 | 5 |
| 21 | 41 | 49 | 6 | 130 | 193 | 5 |
| 车型 | 燃料 | 油耗/ (L·百公里-1) |
油价/ (元·L-1) |
单位车辆固定成本/元 |
| 1 t | 汽油 | 8 | 5.5 | 260 |
| 3.5 t | 柴油 | 11 | 5 | 200 |
| 6 t | 柴油 | 14 | 5 | 150 |
本研究设置3种情景进行仿真:情景1为城市路网内无城市配送车辆限行政策;情景2为目前普遍实施的分区域、时段及车型的限行政策(见表 5),简称区域限行政策;情景3不区域、时段及车型,而是根据排放量和交通拥堵水平对城市配送车辆采取动态调整限行路段方案,简称路段限行政策。
| 车型 | 区域Ⅰ | 区域Ⅱ | 区域Ⅲ | |
| 中型 | 限行条件 | 全天禁入 | 全天禁入 | 全天可入 |
| 可入时间窗 | (0, 0) | (0, 0) | (0,200) | |
| 轻型 | 限行条件 | 全天禁入 | 7:00-20:00禁入 | 全天可入 |
| 可入时间窗 | (0, 0) | (0, 30)∪(160, 200) | (0,200) | |
| 微型 | 限行条件 | 17:00-20:00禁入 | 全天可入 | 全天可入 |
| 可入时间窗 | (0, 130)∪(160, 200) | (0,200) | (0,200) |
2.2 结果分析
仿真平台为Swarm for Java[18],模拟运行180 d,输出总配送成本、配送车辆行驶里程、行驶时间、等待时间、延误时间、居民区排放物超标数量、各区域各排放物的排放量等指标数据,并选取数据的平均值进行限行政策的对比分析。
(1) 限行政策的总体效果分析
以无限行政策为基础对比分析不同限行政策情景下总配送成本、延误时间、各区域尾气排放量、排放超标居民区数量等指标的变化情况(如图 3所示),可以看出,区域限行政策和路段限行政策均会导致总配送成本升高和延误时间增加的负效应,同时会带来总排放量降低的正效应。路段限行政策对配送成本和延误时间的负面影响相对较小,对尾气排放量的控制效果更为理想,且没有表现出明显的区域差异。
|
| 图 3 各情景指标比值图 Fig. 3 Index ratio for each situation |
| |
(2) 限行政策对配送成本的影响分析
从不同限行政策情景下的配送成本构成及其变化情况(如图 4所示)来看,限行政策引致的总配送成本上升主要源于固定成本和时间成本的增加,限行政策对变动成本影响较小。
|
| 图 4 限行政策对配送成本的影响 Fig. 4 Impact of restriction policy on distribution costs |
| |
进一步分析不同限行政策情景下的配送车辆构成情况(如图 5所示)可以发现,面对区域限行政策承运人会选用较多的微型货车(1 t),面对路段限行政策配送企业则更倾向于选择轻型货车(3.5 t)。配送车辆结构的变化与限行政策的取向有关,区域限行政策侧重运用车型限入等手段缓解交通拥堵,路段限行政策则更加注重控制污染物排放,因而承运人会相应地选择使用区域限制较低的微型车或排放因子较低的轻型货车。
|
| 图 5 所用车辆车型比例图 Fig. 5 Proportions of vehicle types |
| |
(3) 限行政策对污染物排放的影响分析
对比区域限行政策和路段限行政策对污染物总排放量的管控效果(如图 6所示),2种政策均能使区域Ⅰ和区域Ⅱ的污染物总排放量有一定减少;但是区域限行政策下区域Ⅲ的污染物总排放量减少程度较低,总体上来看控制效果也不显著;而路段限行政策能很好控制区域Ⅲ的污染物总排放,并能从整体上有效降低污染物总排放水平。由此可见,不同政策对于污染物排放的控制效果呈现一定区域性差异,这主要与2种政策下车辆的配送路径选择有关,区域限行政策限制配送车辆进入城市中心区,能够减少了中心区域的污染物排放,但这也使得更多车辆从外围区域绕行,加重了外围区域的污染物排放,因此总体上污染物管控没有较好的效果;而路段限行政策实施起来更为灵活,也不存在污染排放物转移的情况,所以能有效控制各个区域的污染物排放。
|
| 图 6 限行政策对各区域污染物排放的影响 Fig. 6 Impact of restriction policy on pollutant emission in each region |
| |
进一步分析CO,NOx,HC这3种污染物的变化情况(如图 7所示),和对NOx排放的控制效果相比,区域限行政策对于CO和HC的排放能有更好的控制效果,并且这种控制效果的差异在区域Ⅰ,Ⅱ和Ⅲ中是一致的;路段限行政策在区域Ⅰ中对3种污染物的排放控制效果几乎相同,但是在区域Ⅱ和区域Ⅲ中也出现了一定差异,对CO,HC排放的控制效果要明显好于对于NOx排放的控制效果。
|
| 图 7 限行政策对三种污染物的控制效果 Fig. 7 Control effect of restriction policy on 3 pollutants |
| |
观察污染物超标居民区的分布情况(如图 8所示),可以明显看出区域限行政策使得污染物超标居民区由中心区域转移到了非限行区域,但是总体超标数量并未减少;而路段限行政策下各区域污染物超标居民区数量均有所下降,污染物排放总体上得到有效控制。
|
| 图 8 污染物排放量超标居民区分布图 Fig. 8 Neighborhoods distribution with exceeding pollutant emissions |
| |
3 结论
多代理模型能够定量描述出配送车辆限行政策实施后配送成本、配送准时率、尾气排放等指标的变化趋势,直观反映出限行政策对利益相关者的行为和利益的影响,验证了多代理模型对城市配送车辆限行政策评价的合理性和可行性。此外,仿真分析还得到以下结论:区域限行政策和路段限行政策均能够降低城市配送带来的污染物排放,但却会增加配送成本和延误时间;各类限行政策通常会带来配送活动中固定成本和时间成本的上升,对变动成本影响较小;与区域限行政策相比路段限行政策能带来更好的污染物控制效果,并且对配送成本和延误时间影响较小。
通过多代理模型分析各限行政策对各利益代理的影响,能够帮助政府明确利益各方的行为变化及利益诉求,进而为政府动态或局部调整城市配送车辆限行政策提供借鉴。但不可否认的是,城市的经济发展战略、空间结构布局以及道路交通组织等城市因素都会对城市配送车辆限行政策评价产生一定影响,因此下一步可综合考虑城市因素开展研究,或针对具体案例进行实证分析。
| [1] |
FERNANDEZ-BARCELO I, CAMPOS-CACHEDA J M. Estimate of Social and Environmental Costs for the Urban Distribution of Goods:Practical Case for the City of Barcelona[J]. Procedia-Social and Behavioral Sciences, 2012, 39: 818-830. |
| [2] |
胡云超, 申金升, 黄爱玲. 城市货运交通管制情景下城市配送多目标优化效益研究[J]. 交通运输系统工程与信息, 2012, 12(6): 119-125. HU Yun-chao, SHEN Jin-sheng, HUANG Ai-ling. Multi-objective Optimization for City Distribution under Urban Freight Restriction[J]. Journal of Transportation Systems Engineering and Information Technology, 2012, 12(6): 119-125. |
| [3] |
李彦林, 华光, 孙东泉. 我国城市货运车辆交通管理政策对物流影响分析[J]. 交通建设与管理, 2013(11): 74-77. LI Yan-lin, HUA Guang, SUN Dong-quan. Analysis on Impact of China's Urban Freight Vehicle Traffic Management Policy on Logistics[J]. Transportation Construction & Management, 2013(11): 74-77. |
| [4] |
张玲瑞, 杨扬, 谭慧芳, 等. 城市货运车辆限行政策对城市配送的影响分析及建议-以昆明市为例[J]. 中国物流与采购, 2015(24): 110-111. ZHANG Ling-rui, YANG Yang, TAN Hui-fang, et al. Analysis and Suggestion of Impact of Restricting Urban Freight Vehicles on Urban Distribution[J]. China Logistics & Purchasing, 2015(24): 110-111. |
| [5] |
杨扬, 杨小佳. 基于系统动力学的城市货车限行问题研究[J]. 公路交通科技, 2017, 34(5): 150-158. YANG Yang, YANG Xiao-jia. Study on Travel Restriction of Urban Freight Vehicles Based on System Dynamics[J]. Journal of Highway and Transportation Research and Development, 2017, 34(5): 150-158. |
| [6] |
WANGAPISIT O, TANIGUCHI E, TEO J S E, et al. Multi-agent Systems Modelling for Evaluating Joint Delivery Systems[J]. Procedia-Social and Behavioral Sciences, 2014, 125: 472-483. |
| [7] |
TEO J S E, TANIGUCHI E, QURESHI A G. Evaluation of Load Factor Control and Urban Freight Road Pricing Joint Schemes with Multi-agent Systems Learning Models[J]. Procedia-Social and Behavioral Sciences, 2014, 125: 62-74. |
| [8] |
MACAL C M, NORTH M J. Tutorial on Agent-based Modelling and Simulation[J]. Journal of Simulation, 2010, 4(3): 151-162. |
| [9] |
TEO J S E, TANIGUCHI E, QURESHI A G. Evaluating City Logistics Measure in E-commerce with Multiagent Systems[J]. Procedia-Social and Behavioral Sciences, 2012, 39(2312): 349-359. |
| [10] |
DUIN J H R V, KOLCK A V, ANAND N, et al. Towards an Agent-based Modelling Approach for the Evaluation of Dynamic Usage of Urban Distribution Centres[J]. Procedia-Social and Behavioral Sciences, 2012, 39(4): 333-348. |
| [11] |
TANIGUCHI E, YAMADA T, OKAMOTO M. Multi-agent Modelling for Evaluating Dynamic Vehicle Routing and Scheduling Systems[J]. Journal of the Eastern Asia Society for Transportation Studies, 2007, 7: 933-948. |
| [12] |
DAI T, TANIGUCHI E, YAMADA T. Evaluating City Logistics Measures Using a Multi-agent Model[J]. Procedia-Social and Behavioral Sciences, 2010, 2(3): 6002-6012. |
| [13] |
卢冰原, 吴义生, 程八一. 具有模糊时间约束的城市配送多车型车辆调度问题[J]. 公路交通科技, 2011, 28(11): 152-158. LU Bing-yuan, WU Yi-sheng, CHENG Ba-yi. Multi-type Vehicle Scheduling Problem in City Distribution with Fuzzy Time Restraints[J]. Journal of Highway and Transportation Research and Development, 2011, 28(11): 152-158. |
| [14] |
刘云, 张惠珍. 多目标带时间窗的车辆路径问题的单亲遗传混合蚁群算法[J]. 公路交通科技, 2016, 33(6): 95-100, 106. LIU Yun, ZHANG Hui-zhen. A Partheno-genetic Hybrid Ant Colony Algorithm for Solving Multi-objective Vehicle Routing Problem with Time Window[J]. Journal of Highway and Transportation Research and Development, 2016, 33(6): 95-100, 106. |
| [15] |
叶勇, 张惠珍. 求解带时间窗车辆路径问题的狼群算法[J]. 公路交通科技, 2017, 34(10): 100-107. YE Yong, ZHANG Hui-zhen. Wolf Pack Algorithm for Solving Vehicle Routing Problem with Time Windows[J]. Journal of Highway and Transportation Research and Development, 2017, 34(10): 100-107. |
| [16] |
蒋波. 基于遗传算法的带时间窗车辆路径优化问题研究[D]. 北京: 北京交通大学, 2010. JIANG Bo. Study of Vehicle Routing Optimization Problem with Time Windows Based on Genetic Algorithm[D]. Beijing: Beijing Jiaotong University, 2010. |
| [17] |
陈永林, 曹晓春, 吴柳柳, 等. 汽车尾气排放量的计算方法[J]. 浙江交通职业技术学院学报, 2009, 10(3): 20-25. CHEN Yong-lin, CAO Xiao-chun, WU Liu-liu, et al. Study on the Computational Method about the Exhaust Volume from Automobiles[J]. Journal of Zhejiang Institute of Communications, 2009, 10(3): 20-25. |
| [18] |
陈悦峰, 董原生, 邓立群. 基于Agent仿真平台的比较研究[J]. 系统仿真学报, 2011(增1): 110-116. CHEN Yue-feng, DONG Yuan-sheng, DENG Li-qun. Comparison of Agent-based Simulation Platforms[J]. Journal of System Simulation, 2011(S1): 110-116. |
2018, Vol. 35
