南京农业大学学报  2016, Vol. 39 Issue (4): 688-695   PDF    
http://dx.doi.org/10.7685/jnau.201510042
0

文章信息

吐尔逊·买买提, 丁为民, 谢建华
Tursun MAMAT, DING Weimin, XIE Jianhua
时间序列组合预测模型研究:以农业机械总动力为例
Research of combination prediction model for time series:a case study in total power of agricultural machinery
南京农业大学学报, 2016, 39(4): 688-695
Journal of Nanjing Agricultural University, 2016, 39(4): 688-695.
http://dx.doi.org/10.7685/jnau.201510042

文章历史

收稿日期:2015-10-27
时间序列组合预测模型研究:以农业机械总动力为例
吐尔逊·买买提1,2, 丁为民1, 谢建华2    
1. 南京农业大学工学院, 江苏 南京 210031;
2. 新疆农业大学机械交通学院, 新疆 乌鲁木齐 830052
摘要[目的] 本文旨在提出更有效的时间序列组合预测模型的构建方法,建立预测精度较高的时间序列组合预测模型。[方法] 以1978-2013年新疆农业机械总动力为数据源,建立了源序列的曲线回归、自回归积分滑动平均、3次指数平滑和灰色模型,并构建了预测对象和预测模型的关系数据库。提出了基于百分误差的计算属性重要度方法,依据该方法计算单一模型在组合模型中的权重,构建了单一模型预测值及其权重为输入的组合预测模型,使输出结果中完整的涵盖了时间序列不同单一预测模型的输出值特征。以误差分布特征为指标,对组合预测模型和各单一模型的预测性能进行分析。以组合预测模型拟合优度和预测值平均绝对百分误差(MAPE)作为评价指标,对基于百分误差、粗糙集、Shapley和熵权法的组合预测模型构建方法进行定量分析。[结果] 预测周期内提出的组合预测模型的最大及平均误差与各单一模型最优值相比,分别降低了27.35和6.43,误差平方和(SSE)减少了73%,平均绝对百分误差降低了1.56%。基于百分误差的组合预测模型的拟合优度与基于粗糙集、Shapley和熵权法的组合预测模型拟合优度相比,分别提高了2.40%、5.10%和2.27%,粗糙集、Shapley和熵权法的预测值的平均绝对百分误差分别为1.6730、3.7261和2.7024,而本文提出的模型的平均绝对百分误差为1.2984。[结论] 基于百分误差的组合预测模型在农业机械总动力和类似时间序列预测分析中,降低预测误差波动幅度及提高预测精度方面与其他单一模型和组合模型相比具有显著优势。
关键词农业机械总动力     时间序列     预测     组合模型    
Research of combination prediction model for time series:a case study in total power of agricultural machinery
Tursun MAMAT1,2, DING Weimin1 , XIE Jianhua2     
1. College of Engineering, Nanjing Agricultural University, Nanjing 210031, China;
2. School of Mechanical and Traffic Engineering, Xinjiang Agricultural University, Urumqi 830052, China
Abstract: [Objectives] The combination model have emerged as a possible solution to the challenges associated with time series forecasting. In order to test this hypothesis,advantages and disadvantages of different methods used for combination model development were discussed in the present study. The models were assessed on the basis of prediction accuracy so that more effective approach for combination model for prediction is provided. Keeping in view the assessments,the prediction model for time series with higher accuracy was established.[Methods] The performance of combination prediction model was related with accuracy and weights of single model. According to their prediction accuracy on statistical data from 1978 to 2013 of total power used by agricultural machinery in Xinjiang,the cubic curve model,autoregressive integrated moving average model,cubic exponential smoothing model and grey model were used as member of combination model. Later the results of prediction models were used to develop a relational data model. On the basis of fitting error of every single model on prediction total power data,a new method of computing for importance degree of single model was developed by using the percentage error of each model,then a practicable way for calculating single model's weight was developed by using the importance degree of each model. In the light of that method,percentage error based combination prediction model was used to predict time series data,i.e. the agricultural machinery total power of Xinjiang was fitted on percentage error based combination model. The accuracy of the proposed combination model and every single model was evaluated on the basis of minimum error,maximum error,average error,sum of the squared errors (SSE),mean absolute percent error (MAPE) and goodness of fit. Various combination prediction models on time series especially on the total power were already developed by using rough sets,entropy weights and Shapley based approach. The results generated by using previously developed methods were compared with the results of proposed percentage error based combination prediction model on the basis of MAPE,SSE and goodness of fit.[Results] The results indicated that maximum error,average error,SSE and MAPE of combination model developed in present study were respectively significantly reduced by 27.35,6.43,73% and 1.56% as compared to single model. The results also showed that the minimum fitting error for percentage error based combination model was higher than cubic curves model. But it was acceptable as it was approximately zero. The MAPE of using rough sets,Shapley and entropy weights based approach methods were 1.673 0,3.726 1 and 2.702 4,whereas the MAPE of percentage error based combination model was 1.298 4. Goodness of fit was improved by 2.40%,5.10% and 2.27% by using percentage error combination prediction model.[Conclusions] In this work,we study time series prediction model based on combination prediction model,the agricultural total power of Xinjiang data is used and following conclusions are reached in the light of the results:1) the combination model for time series developed in this paper has better performance than single model on the basis of maximum error,average error,SSE and MAPE;2) the MAPE and goodness of fit indicated that,the percentage based combination model has better accuracy as compared to rough sets,Shapley and entropy weights based approach methods;3) the newly developed percentage error based combination prediction model can more effectively work for agricultural machinery total power and time series data.
Keywords: agricultural machinery total power     time series     forecasting     combination model    

农业机械总动力是内含双向多重因果反馈关系,线性和非线性特征相互作用,以及存在众多不确定因素的复杂时间序列。该序列在其变化当中与农业机械化政策、社会经济环境、人民收入水平等因素之间存在离散的双向影响,其发展规律的复杂性超出了一般的非线性系统。此类非线性系统的一个显著特点是系统各部分之间的相互作用会产生出复杂的、难以预测的行为,包括平衡态的失稳和多平衡态、分岔突变以及混沌和湍流[1]

应用数据挖掘技术对农业机械总动力等时间序列的发展趋势进行研究,挖掘其中隐含的知识并对其进行分析,在此基础上设计相应预测及决策服务模型,为促进农业机械化、提高生产效率、提高决策水平、健全调控和基层服务能力、促进农业机械化进入信息化领域的步伐有很大的推进作用。

目前,建立农业机械总动力或类似的时间序列预测模型常用的方法有两类,一类是单一预测模型,另一类是组合预测模型。单一预测模型有曲线回归分析法、自回归积分滑动平均模型(autoregressive integrated moving average model,ARIMA)、指数平滑法、灰色系统预测法、人工神经网络法、模糊分析法和时间序列法等。单一预测模型虽然具有构造和应用简单等特性,但其具有一定局限性。

曲线回归模型有线性、二次项、复合、增长、对数、立方、S、指数分布、逆、幂和Logistic等形式,此类方法适合于预测时间短、总体变化趋势比较平稳的序列,可以很好地反映事物的总体发展趋势,但对于逼近复杂的非线性函数其有误差波动大等缺点[2, 3]。ARIMA模型在预测相对非平稳序列时具有较大优势,模型被识别后就可以从时间序列的过去值及现在值来预测未来趋势,并常用于时间序列预测中,对数据量无特别的要求[4]。指数平滑模型用于数据需要消除波动的领域,是使用较广泛的用于预测时间序列变化趋势的预测方法,将预测对象随着时间(或空间)推移而形成的数据序列视为一个随机序列,然后用一定的数学模型近似描述这个序列。3次指数平滑预测法能排除特征数据所受的外部偶然干扰,从而能够平稳地反映数据序列的变化趋势,可以适用多数的预测分析[5]。灰色预测模型用于时间短、数据量不大、波动小的问题[6]。BP神经网络有自组织、自学习、自适应、容错能力强、可以任意逼近非线性函数。对时间序列一般采用滑动预测方法,但需要的数据量较大,有时逼近局部最小,从而影响泛化能力[7]

组合预测模型建立方法有基于粗糙集(Rough sets)、Shapley、熵权法(entropy-right method,ERM)、小波分析等。粗糙集是一个刻画不完整、不确定、不精确、不一致的信息,并从中发现隐含的知识和规律的数据分析方法。基于粗糙集的权重计算方法中通过测度依赖度、重要度,求出属性的权重[8]。熵权法的基本原理是通过度量评价指标体系中指标数据所蕴含的信息量来计算各指标的权重。当评价对象在某项指标上的值相差较大时,熵值较小,说明该指标提供的有效信息量较大,从而量化指标权重[9]。Shapley值法是用于解决多人合作对策问题的一种数学方法,它主要集中应用在合作收益在各合作方之间的分配,Shapley值实现的是每个合作成员对该合作联盟的贡献大小,突出反映了各个成员在合作中的重要性,从而可以确定各成员在合作联盟中所得权重[10]。虽然这些方法为建立组合预测模型提供了精度较高的权重计算方法,但仍然在精度、有效信息抽取能力、构造难度和实用性等方面有改进余地。

为此,笔者综合上述各种方法的优缺点,提出一种时间序列组合预测模型,并和其他几种组合预测模型进行对比,为预测时间序列提供新的途径。

1 组合预测模型思想

对于一些复杂的非线性预测系统,采用单一模型的预测方法,难以获得满意的结果。根据近年的理论和实践研究,采用组合预测方法是提高预测精度的有效途径[11, 12]

组合预测方法是由Bates和Granger于1969年首次提出的实用预测方法[13]。它是对同一个预测对象采用不同的单项预测模型,以适当的加权平均形式,在某个准则下求得最优加权系数,从而可以充分利用各种单项预测方法所提供的信息,达到提高预测精度的目的。组合预测模型方法能增强预测的稳定性,具有较高的预测时间序列发展趋势的能力。对时间序列进行预测分析时,可以应用不同函数对系统进行拟合,而不同算法或函数往往有不同的特点。能否将各种不同的模型组合在一起达到更好的预测效果是组合预测思想的出发点。因组合预测方法是通过求个体预测值的加权算术平均而得到它们的组合预测值,因此,建立组合预测模型的关键是,根据预测对象特征,正确选择构建组合模型的每个单一模型和恰当地确定各单一预测模型在组合模型中的权重[14, 15, 16]。组合预测方法的最大特点是从各种模型中提取有效的预测信息,使m种预测模型(m>1)并行工作,根据预测对象的时间序列生成相应的函数。假设m种预测模型对同一序列进行预测,则由这m种单一预测模型构成的组合模型为:

式(1)中:t时刻组合预测模型的预测值;t时刻第i种预测模型的预测值;ki为第i种预测模型的权重系数(i=1,2,…,m),用式(2)求得。组合预测模型中权重的确定是构造模型的关键因素。笔者提出基于百分误差的单一模型权重计算方法并建立组合预测模型,并对该方法与基于粗糙集、Shapley、熵权法等方法进行对照分析。

2 构造单一模型

当把时间作为影响农业机械总动力的各种因素的综合时,可以建立总动力随时间变化的预测模型。不同的单一预测模型、预测函数或算法对预测对象特征的依赖度不同。如:同一个预测对象的历史数据作为数据源,用不同的方法建立预测模型时,因不同预测模型所使用的算法对数据源分布特征的依赖程度有明显差异,导致各模型所获得的预测精度、拟合优度的波动幅度差异较大。因此,建立组合预测模型时,根据单一模型在目标序列的预测精度、预测值的波动幅度作为依据正确选取构建组合模型的单一模型是关键的一步。

经分析可知,农业机械总动力数据具有数据量较少、总体上波动幅度不大等特征,并呈现出逐年递增的趋势。根据以上分析,本文中考虑以曲线回归模型、ARIMA模型、3次指数平滑和灰色模型GM(1,1)为组合模型中的单一模型。

2.1 建立曲线回归模型

本文中应用SPSS(statistical product and service solutions)软件的线性函数等11种函数对农业机械总动力进行曲线拟合[2, 3],对得到的模型进行显著性检验,利用方差分析所提供的F统计量,检验预测模型的总体线性关系的显著性,在F检验通过的情况下选取拟合优度最大的模型为候选模型。拟合优度可以用以下公式计算:

式(3)中:yiy分别代表预测值、源序列和平均值。实践中R2>0.8,则可以认为拟合度较高,在拟合度满足条件情况下,计算每个预测项的平均绝对百分误差(mean absolute percent error,MAPE),从候选模型中选取MAPE小于10%模型为正式的组合预测模型构成元素。依据上述方法,从新疆农机总动力历史数据为源序列的11种曲线模型中筛选3次曲线回归模型,并建立相应的预测模型,见式(4)。式中:为模型在t时刻(t=1,2,…,n)的预测值。

2.2 构造ARIMA模型

ARIMA是由博克思和詹金斯于20世纪70年代初提出的时间序列预测方法。其基本思想是:将预测对象随时间推移而形成的数据序列视为1个随机序列,用一定的数学模型来近似这个序列。具体而言,使用ARIMA模型对时间序列进行建模,主要包括平稳性检验、平稳化处理、模型结构确定、参数估计和模型检验等过程[4]。式(5)为ARIMA(p,d,q)模型的公式。

式(5)中:p为自回归项;d为时间序列成为平稳时所需的差分次数;q为移动平均项。本文在SPSS 20.0 环境下农业机械总动力作为源数据进行试验,应用BIC信息准则函数来确定pq的阶数,通过反复试验确定当p、dq分别为1、2和1时,对应的BIC值为1.024,模型的决定系数R2为0.998,t测验的sig<0.05,表明建立的模型有统计学意义,式(6)为建立的预测模型数学公式。
式中:xt为平稳序列值,其中t=1,2,…,n;ξ为独立分布的随机变量。

2.3 建立3次指数平滑模型

n次指数平滑值的计算公式为:

式中:st[n]t时刻n次指数平滑值(n=1,2,3次);yt是预测对象在t时刻的农业机械总动力;a是指数平滑因数。考虑到本文所讨论的源序列数据量不大,趋势较为稳定,故取a为0.15,并计算1、2和3次平滑预测值。为了消除预测数据的滞后现象,按照二次多项式指数平滑原理对预测值进行修复,使得预测值能够反映序列的非线性特征[17, 18],模型公式为:
其中:Yt+T为模型预测值;at、btct均为平滑系数。平滑系数的计算公式分别为:

在Matlab 2014a环境中编程并计算模型参数at、btct。因农业机械总动力趋势较为稳定,所以从a=0.02~0.30区间内,取不同值进行试验,结果显示,平滑因数a=0.15时MAPE和误差平方和(sum of the squared errors,SSE)取值分别为3.95%和28 252,拟合优度也接近1,模型指标满足要求,可得出预测模型为:

2.4 灰色GM(1,1)模型建立

GM(1,1)模型是灰色系统理论中应用最广泛的一种灰色动态预测模型,该模型由一个单变量的一阶微分方程构成。它主要用于复杂系统某一主导因素特征值的拟合和预测,以揭示主导因素变化规律和未来发展变化态势。设定原时间序列X(0)有n个观测值:

将数列X0经一次累加生成,建立相应GM(1,1)模型的一阶微分方程式(14)。式中:a是发展灰数;u是内生控制灰数。通过带估参数向量,利用最小二乘法求解可得
式(15)中:
求解式(14)后原始序列预测模型为:
按式(18)可获本文所讨论序列的灰色预测模型为:
按式(19)计算出X(1)(k)。再按式(20)进行累减还原便可计算出农业机械总动力预测值[6]

本研究中应用Matlab 2014a实现了GM(1,1)模型,并计算出后验差的比值c=0.116 25<0.35,小误差概率 P=1.00>0.95,模型指标说明建立的模型拟合精度较高,可用于序列未来趋势的预测。

2.5 单一模型预测

应用2.1~2.4节建立的模型对新疆农业机械总动力进行检验性预测,各模型预测值见表 1。其中组合模型值为下一节建立的组合预测模型的预测值。

表 1 不同模型的农业机械总动力拟合值 Table 1 Fitted values of different models for agricultural machinery′s total power104 kW
年份 Year实际动力 Actual value拟合值 Fitted values
曲线回归Cubic curvesARIMA指数平滑Exponential smoothing灰色模型Grey model组合模型Combination model
1978250.20153.46250.20250.20
1979208.00202.48231.21227.80
1980248.50246.44170.47236.14242.57225.27
1981265.30285.84227.42247.44258.29257.79
1982278.20321.17279.40261.34275.03287.41
1983305.40352.92295.38283.32292.85311.96
1984345.20381.59321.22316.41311.83343.59
1985384.60407.67368.09356.78332.04381.29
1986396.00431.66419.57389.20353.56410.93
1987429.00454.04439.27425.23376.47438.07
1988459.90475.31458.97462.47400.87464.61
1989496.30495.96495.51502.65426.85497.30
1990523.10516.49533.68540.18454.51527.42
1991560.80537.39565.60580.37483.97559.31
1992594.00559.16599.94620.08515.33590.85
1993608.30582.28638.25650.62548.73617.19
1994624.90607.26654.27675.48584.29637.74
1995653.80634.57660.97701.77622.16659.93
1996688.90664.73684.94731.82662.48689.71
1997732.70698.21724.19768.38705.42727.89
1998770.70735.52773.63806.79751.13768.72
1999814.40777.15820.73848.89799.81812.38
2000858.50823.58866.09893.56851.65857.59
2001883.10875.33914.79931.02906.84898.83
2002924.20932.86943.94970.63965.61941.27
2003973.90996.69975.391015.501028.19989.34
20041047.901067.311028.951074.861094.821054.11
20051121.001145.201108.801143.751165.781129.46
20061190.001230.871200.251217.081241.331209.92
20071275.501324.791279.881300.441321.781295.89
20081375.601427.481368.271396.871407.441392.97
20091503.271539.421479.341514.211498.651509.73
20101642.931661.101620.731650.821595.781644.04
20111795.941793.021784.751805.891699.201794.25
20121968.271935.671958.631981.361809.321959.09
20132165.872089.552150.262181.071926.582143.02
注:数据来源,《新中国农业60年统计资料》(中国农业出版社)和《新疆统计年鉴》(新疆统计局)。
Note:Data source,60 Years of New Chinese Agriculture Statistics (China Agricultural Press), Xinjiang Statistical Yearbook (Xinjiang Bureau of Statistics).
3 建立组合预测模型

组合预测模型中可以结合不同预测方法的优点,综合利用各种算法提供的信息,从而提高预测精度。构造组合预测模型的关键因素是,除了正确选取单一模型外,还要采取正确的方法和步骤,确定各单一模型对组合模型预测精度的贡献率,即权重[19]

3.1 计算各模型的重要度和权重

单一模型对组合模型的预测值的影响程度依赖其预测值和权重,单一模型权重又取决于各单一模型预测值对预测对象的重要度,如重要度高,则权重较大,反之亦然。基于百分误差的权重计算步骤为:

1) 计算预测周期内各时段拟合值的误差。

2) 根据误差的结果计算百分误差。

3) 计算某个预测模型在某个时段的拟合百分误差在该时段所有模型拟合百分误差之和中所占的比例,确定每个时段的某个模型的重要度。

4) 根据某个预测模型在某个时段的重要度在该时段所有模型重要度之和中所占比例确定每个时段的某个模型的权重。计算公式为:

式中:Vi为第i个模型的重要度;δtmt时刻模型m的百分误差;St时刻所有模型百分误差和。该方法中我们考虑在每个时刻,单一模型的百分误差在所有模型百分误差和中所占的比例,即计算单一模型在每个时刻,对各模型百分误差和的贡献率的大小。从式(21)可知,如模型对百分误差和的贡献率大,则重要度小;贡献率小,则重要度大。计算单一模型的权重用以下公式。
式中:wi为第i个模型的权重。按式(21)和(22)依次计算各单一模型的重要度和权重,结果如表 2所示。

表 2 单一模型重要度及权重系数 Table 2 Importance degree and weight on single model
曲线回归 Cubic curvesARIMA指数平滑 Exponential smoothing灰色模型 Grey model
重要度 Importance degree0.751 40.862 10.773 10.613 4
权重Weight0.250 50.287 40.257 70.204 5

基于百分误差的权重确定方法,根据单一模型预测结果的精度和真实度对预测模型的重要度和权重进行计算和分配,从而在组合模型建立过程中为单一模型的权重确定提供了依据。

3.2 组合预测模型构造

应用表 2中各模型的权重系数即可建立基于百分误差的新疆农业机械总动力组合预测模型。组合预测模型为:

式中:为组合预测模型在t时刻的预测值。是各单一模型的预测值。应用该组合模型预测出的农业机械总动力预测值见表 1。同时应用该模型对新疆农业机械总动力2014至2018年发展趋势做出预测。预测结果(表 3)表明:到2018年新疆农业机械总动力仍然保持快速增长的趋势,但从实践和理论分析可知,时间序列在发展过程中难以长期保持其增长趋势;从时间序列的预测模型角度来看,基于有限的少量样本序列建立的预测模型难以发掘目标序列发展曲线的全部形状。但短期预测可以较为精确地预测其发展趋势。

表 3 2014—2018年新疆农业机械总动力预测趋势 Table 3 The predicted result of total power of agricultural machinery from 2014 to 2018
104 kW
年份 Year
20142015201620172018
总动力Total power2 261.562 435.262 620.322 819.403 032.30
4 模型检验及对照分析 4.1 组合模型检验

建立组合预测模型后,检验组合预测模型是否可行及有效时,常用的检验指标有误差、拟合优度、MAPESSE[20]。依据表 1预测值,计算各单一模型和本文建立的组合模型的误差。由表 4可见:组合模型的最大误差、平均误差及SSE等指标和单一模型相比明显下降。图 1也说明,组合模型的最小、最大和平均误差的波动幅度与单一模型相比缩小。同时该结果也反映出组合模型最小误差大于2个单一模型,但其值接近0,是处在可接受的范围内。应用式(3)计算拟合优度,并计算4个单一模型及组合模型的MAPE。由表 5可知:组合模型和单一模型拟合优度接近1,但组合预测模型MAPE和各单一模型相比明显下降。这也说明组合预测模型预测结果和单一模型相比趋向于更加稳定。

表 4 单一模型和组合模型预测值误差 Table 4 Deviation result on single and combination model
曲线回归Cubic curvesARIMA指数平滑Exponential smoothing灰色模型Grey model组合模型Combination model
最小误差Minimum error0.340.792.573.170.81
最大误差Maximum error96.7478.0350.58239.2923.23
平均误差Average error28.7814.9724.9749.298.54
误差平方和SSE43 63614 92128 252151 8194 065

图 1 模型误差波动 Fig. 1 Model error fluctuation

表 5 各模型拟合优度和百分误差 Table 5 Goodness of fit and MAPE of every model
曲线回归Cubic curvesARIMA指数平滑Exponential smoothing灰色模型Grey model组合模型Combination model
拟合优度 Goodness of fit0.995 30.996 81.029 00.944 30.998 8
MAPE/%5.182.863.956.281.298 4
4.2 不同组合预测模型对照分析

时间序列组合预测模型领域中,研究者提出了多种预测模型的建立方法,这些方法的最大不同点就是单一模型的权重计算所采用的算法不同。为了进行不同组合预测模型之间的对照分析,本文中分别应用基于粗糙集理论、熵权法和Shapley法的特征权重计算方法建立组合预测模型。利用自组织映射(self-organization mapping,SOM)无监督聚类,对由各单一模型预测值和实际总动力组成的时间序列进行聚类,生成离散化的决策表,计算属性依赖度和重要度,在此基础上计算各单一模型的权重,从而构建基于粗糙集的组合预测模型[8]。同时应用文献[9, 10]提出的基于熵权法和Shapley法,计算本文筛选的4种单一模型的权重,并建立组合预测模型。用这3种组合预测模型对新疆农业机械总动力进行预测,并计算3种组合预测模型预测值的MAPE、拟合优度和SSE,并和本文提出的组合预测模型对应指标进行比较。结果表明:基于百分误差的组合预测模型的拟合优度与基于粗糙集、Shapley和熵权法的组合预测模型拟合优度相比,分别提高了2.40%、5.10%和2.27%,预测值的MAPE分别和上述3种方法相比减少了0.37、2.43和1.40(表 6)。

表 6 不同组合预测模型拟合优度和百分误差 Table 6 Goodness of fit and percent error on 4 combination model
粗糙集Rough setsShapley熵权法Entropy weight method组合模型Combination model
拟合优度Goodnees of fit0.974 90.947 90.976 20.998 8
MAPE/%1.673 03.726 12.702 41.298 4
SSE5 927.2919 761.408 725.294 064.53
5 结论

以新疆农业机械总动力数据为研究对象,建立了基于百分误差的时间序列组合预测模型,进行了模型检验,并与4种单一模型的预测精度进行比较,结果表明,预测周期内组合模型的最大和平均误差与各单一模型最优值相比,分别降低了27.35和6.43,SSE减少了73%,MAPE降低了1.56%,减少了预测误差的波动幅度。

以模型拟合优度和MAPE作为评价指标,对本文提出的组合预测模型的拟合优度与基于粗糙集、Shapley和熵权法的组合预测模型进行比较,结果表明:基于百分误差的组合预测模型的拟合优度与基于粗糙集、Shapley和熵权法的组合预测模型拟合优度相比,分别提高了2.40%、5.10%和2.27%,预测值的MAPE分别和上述3种方法相比减少了0.37、 2.43 和 1.40。本文提出的时间序列组合预测方法,在有效预测农业机械总动力,从时间序列中提取有效信息,提高预测精度和减少预测值的波动方面有一定的参考价值。

参考文献(References)
[1] 黄玉祥,郭康权,朱瑞祥.大中型拖拉机需求量混沌特征分析及预测时效研究[J]. 西北农林科技大学学报,2007,23(8):135-139. Huang Y X,Guo K Q,Zhu R X. Analysis of chaos characteristics and forecasting time-scale of the demand for big-medium-sized tractors[J]. Northwest Agriculture and Forestry University,2007,23(8):135-139(in Chinese with English abstract).
[2] Aranildo R L,Alex J C,William W H. Nonlinear regression in environmental sciences using extreme learning machines:a comparative[J]. Evaluation Environmental Modelling and Software,2015,73(5):175-188.
[3] Andreas F.How to determine the unique contributions of input-variables to the nonlinear regression function of a multilayer perceptron[J]. Ecological Modelling,2015,309/310:60-63.
[4] 朱立学,罗锡文,臧英,等.基于3次指数平滑的水稻生产综合机械化发展水平预测[J]. 农机化研究,2007,29(7):51-57. Zhu L X,Luo X W,Zang Y,et al. 3-exponential flatting method based on rice mechanization forecast[J]. Journal of Agricultural Mechanization Research,2007,29(7):51-57(in Chinese with English abstract).
[5] 王国权,王森,刘华勇,等.基于自适应的动态三次指数平滑法的风电场风速预测[J]. 电力系统保护与控制,2014,42(15):117-122. Wang G Q,Wang S,Liu H Y,et al. Self-adaptive and dynamic cubic ES method for wind speed forecasting[J]. Power System Protection and Control,2014,42(15):117-122(in Chinese with English abstract).
[6] Thananchai L. Grey prediction on indoor comfort temperature for HVAC systems[J]. Expert Systems with Applications,2008,34:2284-2289.
[7] 鞠金艳,王金武,王金峰.基于BP神经网络的农机总动力组合预测方法[J]. 农业机械学报,2011,41(6):87-92. Ju J Y,Wang J W,Wang J F. Combined prediction method of total power of agricultural machinery based on BP neural network[J]. Transactions of the Chinese Society for Agricultural Machinery,2011,41(6):87-92(in Chinese with English abstract).
[8] 郑文钟,何勇.基于粗糙集的粮食产量组合预测模型[J]. 农业机械学报,2005,36(11):75-78. Zheng W Z,He Y. Study on evaluation methods for agricultural mechanization developing level based on rough set theory and fuzzy aggregation[J]. Transactions of the Chinese Society for Agricultural Machinery,2005,36(11):75-78(in Chinese with English abstract).
[9] Pan G B,Xu Y P,Yu Z H,et al. Analysis of river health variation under the background of urbanization based on entropy weight and matter-element model:a case study in Huzhou City in the Yangtze River Delta,China[J]. Environmental Research,2015,139(5):31-35.
[10] 李书金,张强.一种基于Shapley值的联盟结构分配方法[J]. 北京理工大学学报,2007,27(8):745-749. Li S J,Zhang Q. A method of allocation among players in coalition structure based on the shapley value[J]. Transactions of Beijing Institute of Technology,2007,27(8):745-749(in Chinese with English abstract).
[11] 江志华,朱国宝.灰色预测模型GM(1,1)及在交通运量预测中的应用[J]. 武汉理工大学学报(交通科学与工程版),2004,28(2):305-307. Jiang Z H,Zhu G B. Grey model-GM(1,1)and its application to predicting transportation volume[J]. Journal of Wuhan University of Technology(Traffic Science and Engineering Edition),2004,28(2):305-307(in Chinese with English abstract).
[12] 邱洪臣,朱瑞祥,李卫,等.基于离散灰色模型的中国农机总动力预测[J]. 农机化研究,2014,36(1):80-83. Qiu H C,Zhu R X,Li W,et al. A forecast for agricultural machinery total power of China using discrete gray model[J]. Journal of Agricultural Mechanization Research,2014,36(1):80-83(in Chinese with English abstract).
[13] Bates J M,Granger C W J.The combination of forecasts[J]. Operational Research Quarterly,1969,20(4):451-468.
[14] 鹿应荣,杨印生,刘洪霞.基于BP神经网络的非线性组合预测模型在粮食物流需求预测中的应用[J]. 吉林大学学报,2008,38(2):61-64. Lu Y R,Yang Y S,Liu H X. Application of nonlinear combination forecasting based on neural networks in grain logistic demand[J]. Journal of Jilin University,2008,38(2):61-64(in Chinese with English abstract).
[15] Ma L,Lin B,Zhen B Y,et al. A new combination prediction model for short-term wind farm output power based on meteorological data collected by WSN[J]. International Journal of Control and Automation,2014,7(1):171-180.
[16] Hong J,Koo H,Kim T. Easy,reliable method for mid-term demand forecasting based on the bass model:a hybrid approach of NLS and OLS[J]. European Journal of Operational Research,2016,248:681-690.
[17] Pektas A O,Cigizoglu H K. ANN hybrid model versus ARIMA and ARIMAX models of runoff coefficient[J]. Journal of Hydrology,2013,500:21-36.
[18] Shi H Y,Zhang X,Su X M,et al. Trend prediction of FDI based on the intervention model and ARIMA-GARCH-M model[J]. AASRI Procedia,2012,3:387-393.
[19] Wang J Z,Hu J M. A robust combination approach for short-term wind speed forecasting and analysis:combination of the ARIMA(Autoregressive Integrated Moving Average),ELM(Extreme Learning Machine),SVM(Support Vector Machine)and LSSVM(Least Square SVM)forecasts using a GPR(Gaussian Process Regression)model[J]. Energy,2015,93:41-56.
[20] Sermpinis G,Stasinakis C,Theofilatos K,et al. Modeling,forecasting and trading the EUR exchange rates with hybrid rolling genetic algorithms:support vector regression forecast combinations[J]. European Journal of Operational Research,2015,247:831-846.