为了规避投资风险,投资者往往将资金分散配置到多种资产上,也就是“不要把所有鸡蛋放到同一个篮子里”的组合投资思想. 1952年Markowitz[1]提出了投资组合问题的均值–方差(Mean-Variance,MV)模型,随后被众多学者进行了广泛的推广[2-4]. 该模型假设股票的收益为随机变量,分别用其均值与方差来量化股票的预期收益与风险. 然而,在实际应用中难以估计股票收益的均值和方差,甚至难以找到合适的概率分布刻画股票的收益. 20世纪90年代初Cover[5]借鉴在线算法与竞争分析理论的思想,建立了在线投资组合模型. 该模型不对未来的股票价格作任何概率假设,允许股价无规律地剧烈波动,仅利用历史数据计算当期的投资比例,克服了MV模型的缺陷,更符合金融管理的实际情况.
Cover[5]提出了第一个在线投资组合策略,并证明了该策略具有与最优定常再调整策略(Best Constant Rebalanced Portfolio,BCRP)相同的渐近收益,称这样的策略为泛证券投资组合策略(Universal Portfolio,UP). Singer[6]研究了根据市场变化的转换策略,提高了投资的收益. Agarwal等[7]运用数学优化中的牛顿方法给出了有效的、计算性能较好的在线投资策略. Helmbold等[8]应用指数更新方法,提出了利用当期获得的股票价格信息确定下一期投资比例的指数梯度策略(Exponential Gradient,EG),该策略对于惯性股票价格序列能够获得较好的收益. 张卫国等[9]基于线性学习函数对EG策略进行了改进,构造了LFM策略,并证明它具有泛证券性. 张永等[10]用有限个静态专家意见代表常见类投资策略,应用弱集成算法设计在线投资组合策略并分析其竞争性能. 刘善存等[11]将交易费用引入UP策略,并证明其仍然是泛证券投资组合策略. Borodin等[12]通过计算组合中两两股票在两个相邻历史窗口上对数收益率之间的相关性,并利用股票价格均值回归的规律调整投资比例,提出了Anticor策略. 虽然没有证明Anticor策略是泛证券投资组合策略,但是实证结果表明该策略不但远远超过了在线的UP、EG等策略,而且超过了离线的BCRP策略. 基于证券价格的反转变化假设,Li等[13-14]利用均值复位的思想,给出了能够实现更多收益的在线投资组合策略. O'Sullivan和Edelman[15]通过定义相对绩效度量因子,提出了适应性泛证券投资组合策略(Adaptive Universal Portfolio,AUP),提升了UP策略的表现.
上述研究均使用获取到的所有历史数据来构造投资比例,然而实际的股票市场往往波动剧烈,过去较长时间的股票价格与当前的股票价格关系不大,甚至会对当前的投资决策产生干扰. 因此,本文考虑利用近期历史数据构造在线投资组合策略. 在策略设计过程中,不考虑投资者的风险偏好,因此所设计的策略是风险中性的. 首先,在每一期的期初,使用固定长度历史数据计算投资比例,设计一种基于移动窗口的在线投资组合策略; 然后,考虑到在实际的投资决策中移动窗口的长度应该随着市场的波动而变化,即适应性地选取合适的移动窗口长度,进一步设计了一种适应性的在线投资组合策略. 最后,采用国内外实际股票市场数据,对策略进行实证分析.
1 相关概念与记号假设投资者选取
${\varDelta _m} = \left\{ {{b} = {{({b_1},{b_2},\cdots,{b_m})}^{\rm{T}}}:{b_i} \geqslant 0,\sum\limits_{i = 1}^m {{b_i} = 1} } \right\}.$ | (1) |
投资者在第
${S_n}({{{b}}_{1:n}}) = {S_0}\prod\limits_{t = 1}^n {{{b}}_t^{\rm{T}}{{{x}}_t}} = {S_0}\prod\limits_{t = 1}^n {\sum\limits_{i = 1}^m {{b_{t,i}}{x_{t,i}}} } .$ | (2) |
一般地,初始投资比例往往采用平均投资的方式,即
若每一期均采用相同的投资比例
${S_n}({\rm{CRP}}({b})) = \prod\limits_{t = 1}^n {{{b}^{\rm{T}}}{{x}_t}} .$ | (3) |
最终累积收益
${{b}^*} = \mathop {\arg \max }\limits_{{b} \in {\varDelta _m}} {S_n}({\rm{CRP}}({b})).$ | (4) |
这是一种事后策略,不能用于实际的投资决策. Cover[5]证明了该策略具有一系列特性,因而往往被选作衡量在线投资组合策略性能的基准策略.
Cover[5]的策略UP是对所有投资比例
${{{b}}_{t + 1}} = \frac{{\int_{{\varDelta _m}} {{{b}}{S_t}({{b}}){\rm{d}}{{b}}} }}{{\int_{{\varDelta _m}} {{S_t}({{b}}){\rm{d}}{{b}}} }}.$ | (5) |
其中
O'Sullivan和Edelman[12]改进了Cover的UP策略,通过赋予较优CRP策略较大的权重,提出了AUP策略. 该策略使用过去所有的历史数据来确定当期投资比例. 为了避免过去较长时间的股价数据对当前投资决策的干扰,本文考虑仅利用近期固定长度窗口数据来确定投资比例.
假设每一期采用的历史数据窗口长度是固定的,用
${S_{t,r}}({{b}}) = \prod\limits_{\tau = t'}^t {{{{b}}^{\rm{T}}}} {{{x}}_\tau }.$ | (6) |
其中
${{{b}}_{t + 1}} = \frac{{\int_{{\varDelta _m}} {{{b}}{\alpha _{t + 1}}({{b}})} {S_{t,r}}({{b}})\operatorname{d} {{b}}}}{{\int_{{\varDelta _m}} {{\alpha _{t + 1}}({{b}}){S_{t,r}}({{b}})\operatorname{d} {{b}}} }}.$ | (7) |
该策略称为基于移动窗口的适应性泛证券投资组合策略(Moving-Window-Based Adaptive Universal Portfolio,MWAUP).
在实际计算中,将投资比例集合
${{{b}}_{t + 1}} = \frac{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{{b}}{\alpha _{t + 1}}({{b}}){S_{t,r}}({{b}})} }}{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{\alpha _{t + 1}}({{b}}){S_{t,r}}({{b}})} }}.$ | (8) |
不同的相对绩效度量因子选取方式,对应不同的MWAUP策略. 在下一节的实证分析中,相对绩效度量因子的选取方式为: 对
该策略的计算流程见算法1.
![]() |
表 |
对于MWAUP策略,首先需要给定一个固定且合适的参数
参数
${{b}}_{t + 1}^r = \frac{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{{b}}{\alpha _{t + 1}}({{b}}){S_{t,r}}({{b}})} }}{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{\alpha _{t + 1}}({{b}}){S_{t,r}}({{b}})} }}.$ | (9) |
在第
${r_{t + 1}} = r_t^* = \mathop {\arg \max }\limits_{r \in {\varGamma }} {S_t}({b}_{1:t}^r).$ | (10) |
相应的投资比例为
${{{b}}_{t + 1}} = \frac{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{{b}}{\alpha _{t + 1}}({{b}}){S_{t,{r_{t + 1}}}}({{b}})} }}{{\displaystyle\sum\nolimits_{{{b}} \in {{\tilde \varDelta }_m}} {{\alpha _{t + 1}}({{b}}){S_{t,{r_{t + 1}}}}({{b}})} }}.$ | (11) |
该策略的计算流程见算法2.
![]() |
表 |
本节采用实际股票价格数据对上一节提出的MWAUP和VMWAUP策略进行实证分析,检验其在实际股票市场中的表现.
3.1 数据本文实证部分选用美国市场纽约证券交易所22年的股票数据(从1962年7月3日到1984年12月31日)和中国市场上证50成份股12年的股票数据(2004年1月2日~2016年6月30日),其中上证50成份股的数据来源于Resset金融研究数据库,已经过向后复权复息处理. 构造了6个股票组合进行测试,分别由3只、4只、5只股票组成,股票名称及组合情况见表1.
![]() |
表 1 股票组合名称 Table 1 Names of stock combinations |
本文构造的策略MWAUP和VMWAUP主要包含移动窗口长度等参数,在测试时可以针对不同的股票市场类型设置相应的参数. 对于本文采用的股票数据,设置参数
为了更好地说明策略MWAUP和VMWAUP的表现,本节将它们与基准策略Market和BCRP以及已有的在线投资组合策略EG、ONS、OLMAR、UP及AUP进行比较. 相关策略介绍如下:
(1) Market:初始时刻平均投资的购买并持有策略;
(2) BCRP:最优定常再调整策略(事后策略);
(3) EG:指数梯度策略,采用Helmbold等[7]的参数设置,即
(4) ONS:在线牛顿梯度策略[9],其中参数设置为
(5) OLMAR:在线移动均值回归策略[11],其中参数设置为
(6) UP:Cover的泛证券投资组合策略[5],其离散化可行策略集的步长设为0.05;
(7) AUP:O'Sullivan和Edelman[12]提出的适应性泛证券投资组合策略.
3.2 结果分析不同策略在6个股票组合上的最终累积收益见表2,其中V/B表示策略VMWAUP与BCRP的最终累积收益的比值; V/M表示VMWAUP与MWAUP的最终累积收益的比值. 另外,为便于比较,将每个股票组合上排在前两位的策略的最终累积收益加粗标出. 从表2可以看出,策略MWAUP和VMWAUP在各个股票组合上的表现明显优于已有的在线投资组合策略,并且从V/B的值可以看出,策略VMWAUP的表现均超过离线的BCRP策略,这说明仅使用近期的历史数据构造的投资策略提升了策略AUP的性能; 同时,V/M的值也超过了1,最高达到了2.03,这表明通过对移动窗口适应性学习可以进一步提升策略MWAUP的性能.
最后,为检验策略的结果是否是由随机因素造成的,表3给出了策略VMWAUP的统计检验结果. 这是在基金行业中较为常见且行之有效的做法. 具体地,因随机因素取得的超额收益的概率最大仅为0.02,均未超过0.05. 这表明策略VMWAUP的累积收益结果是可信的.
![]() |
表 2 不同策略在6个股票组合上的最终累积收益 Table 2 The final cumulative wealth of the different strategies on the six combinations |
![]() |
表 3 策略在6个股票组合上的统计检验结果 Table 3 The strategy's statistical test results on six combinations |
为了进一步说明策略MWAUP和VMWAUP相对于策略BCRP与AUP的性能,本文给出了策略BCRP、AUP、MWAUP以及VMWAUP在组合5和组合6,即两个5只股票组合上的逐日累积收益,见图1. 从图1可以看出,策略MWAUP和VMWAUP不但具有较高的最终累积收益,而且逐日累积收益也稳定地高于策略BCRP与AUP. 这也说明了策略MWAUP和VMWAUP具有更好的性能. 同时,策略MWAUP和VMWAUP的逐日累积收益变化趋势基本保持一致,前者一直稳定地超过后者并且随着投资期数的增加,两者之间的差距也随着扩大,这也说明了适应性学习的策略VMWAUP具有更好的性能.
![]() |
图 1 不同策略在组合5和组合6上的逐日累积收益 Figure 1 Daily cumulative returns of different strategies on combinations 5 and 6 |
为了检验移动窗口长度
![]() |
图 2 参数r 的敏感性分析 Figure 2 Sensitivity analysis of parameter r |
为了检验移动窗口学习集合
![]() |
图 3 参数
|
本文利用近期历史数据,基于移动窗口设计了两个风险中性的在线投资组合策略MWAUP和VMWAUP,避免了过去较长时间的历史数据对当前投资决策产生的干扰. 通过实证分析,说明了它们优于AUP等已有的在线投资组合策略. 另外,与策略MWAUP相比,适应性学习策略VMWAUP具有更好的性能,更适用于非平稳股票市场中的投资决策. 然而,本文存在一定的不足之处,主要是未能从理论上证明所设计策略的性能,这将是我们以后关注的方向.
[1] | MARKOWITZ H M. Portfolio selection[J]. Journal of Finance, 1952, 7(1): 77-91. |
[2] |
王伟, 刘巍. 不确定收益率下投资组合的可拓评价及变换[J].
广东工业大学学报, 2012, 29(1): 83-87.
WANG W, LIU W. Extension evaluation and transformation of the stock under uncertain profit rates[J]. Journal of Guangdong University of Technology, 2012, 29(1): 83-87. |
[3] | BASAK S, CHABAKAURI G. Dynamic mean-variance asset allocation[J]. Review of Financial Studies, 2010, 23(8): 2970-3016. DOI: 10.1093/rfs/hhq028. |
[4] | HUANG X X, QIAO L. A risk index model for multi-period uncertain portfolio selection[J]. Information Sciences, 2012, 217(25): 108-116. |
[5] | COVER T M. Universal portfolios[J]. Mathematical Finance, 1991, 1(1): 1-29. DOI: 10.1111/mafi.1991.1.issue-1. |
[6] | SINGER Y. Switching portfolios[J]. International Journal of Neural Systems, 1997, 8(4): 445-455. DOI: 10.1142/S0129065797000434. |
[7] | AGARWAL A, HAZAN E, KALE S, et al. Algorithms for portfolio management based on the Newton method[C]//Proceedings of International Conference on Machine Learning. Pittsburgh:ACM, 2006: 9-16. |
[8] | HELMBOLD D, SCHAPIR R, SINGER Y, et al. On-line portfolio selection using multiplicative updates[J]. Mathematical Finance, 1998, 8(4): 325-347. DOI: 10.1111/mafi.1998.8.issue-4. |
[9] |
张卫国, 张永, 徐维军, 等. 基于线性学习函数的泛证券投资组合策略[J].
系统工程理论与实践, 2012, 32(8): 1647-1654.
ZHANG W G, ZHANG Y, XU W J, et al. Universal portfolio based on on-line learning of linear function[J]. Systems Engineering—Theory & Practice, 2012, 32(8): 1647-1654. DOI: 10.12011/1000-6788(2012)8-1647. |
[10] |
张永, 张卫国, 徐维军, 等. 集成有限个专家意见的在线投资组合策略[J].
系统工程理论与实践, 2015, 35(1): 57-66.
ZHANG Y, ZHANG W G, XU W J, et al. Online portfolio selection strategy by aggregating finite expert advices[J]. Systems Engineering—Theory & Practice, 2015, 35(1): 57-66. DOI: 10.12011/1000-6788(2015)1-57. |
[11] |
刘善存, 邱菀华, 汪寿阳. 带交易费用的泛证券组合投资策略[J].
系统工程理论与实践, 2003, 23(1): 22-25.
LIU S C, QIU W H, Wang S Y. Universal portfolio selection with transaction Costs[J]. Systems Engineering—Theory & Practice, 2003, 23(1): 22-25. |
[12] | BORODIN A, EL-YANIV R, GOGAN V. Can we learn to beat the best stock[J]. The Journal of Artificial Intelligence Research, 2004, 21: 579-594. |
[13] | LI B, ZHAO P, HOI S C H, et al. PAMR: Passive aggressive mean reversion strategy for portfolio selection[J]. Machine Learning, 2012, 87(2): 221-258. DOI: 10.1007/s10994-012-5281-z. |
[14] | LI B, HOI S C H, SAHOO D, et al. Moving average reversion strategy for on-line portfolio selection[J]. Artificial Intelligence, 2015, 222(1): 104-123. |
[15] | O'SULLIVAN P, EDELMAN D. Adaptive universal portfolios[J]. The European Journal of Finance, 2015, 21(4): 337-351. DOI: 10.1080/1351847X.2013.788534. |