基于活跃专家意见的在线投资组合策略

引用本文

何锦安, 王蓓, 林家星. 基于活跃专家意见的在线投资组合策略[J]. 广东工业大学学报, 2020, 37(4): 59-64. DOI: 10.12052/gdutxb.190091.

He Jin-an, Wang Bei, Lin Jia-xing. An Online Portfolio Strategy Based on Active Expert Advice[J]. JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY, 2020, 37(4): 59-64. DOI: 10.12052/gdutxb.190091.

基金项目:

教育部人文社会科学研究基金资助项目(18YJA630132)

作者简介:

何锦安(1993–)，男，硕士研究生，主要研究方向为在线金融决策。

通信作者

王蓓(1974–)，女，讲师，博士，主要研究方向为决策科学，E-mail：linda@gdut.edu.cn

文章历史

收稿日期：2019-07-05

Contents Abstract Full text Figures/Tables PDF

基于活跃专家意见的在线投资组合策略

何锦安, 王蓓, 林家星

广东工业大学管理学院，广东广州 510520

收稿日期：2019-07-05

基金项目：教育部人文社会科学研究基金资助项目(18YJA630132)

作者简介：何锦安(1993–)，男，硕士研究生，主要研究方向为在线金融决策。

通信作者：王蓓(1974–)，女，讲师，博士，主要研究方向为决策科学，E-mail：linda@gdut.edu.cn.

摘要: 综合考虑专家意见是投资者常用的投资决策方法。通过集成活跃专家意见, 提出了一个新的在线投资组合策略。首先将所有定常再调整策略看作专家, 并通过淘汰近期表现最差的专家构造活跃专家集合; 然后利用弱集成算法集成所有活跃专家的意见, 进而构造弱集成活跃专家策略。采用实际的股票数据对提出的策略进行数值分析, 结果表明该策略具有更好的竞争性能。

关键词: 在线投资组合活跃专家意见弱集成算法移动窗口在线学习

An Online Portfolio Strategy Based on Active Expert Advice

He Jin-an, Wang Bei, Lin Jia-xing

School of Management, Guangdong University of Technology, Guangzhou 510520, China

Abstract: It is a common investment decision-making method for investors to comprehensively consider expert advice. By aggregating active expert advice, a new online portfolio strategy is proposed. First, considering all constant rebalanced portfolio strategies as experts, an active expert set is constructed by eliminating the worst recent performing expert. Second, using the weak aggregating algorithm to aggregate all active expert advice, an online portfolio strategy is then constructed. The proposed strategy is numerically analyzed by using actual stock data. The results show that the strategy has a more competitive performance.

Key words: online portfolio active expert advice weak aggregating algorithm moving window online learning

投资组合选择理论致力于如何在多种资产中分配资金，以帮助投资者实现其投资目标。Markowitz^[1]在1952年提出的均值−方差(Mean-Variance，MV)模型，旨在收益和风险之间取得平衡，即在给定的收益水平下取得最小的预期风险，或者在给定风险水平下取得最大的预期收益。在过去的半个多世纪里，众多研究者通过使用不同的方法对MV模型进行了广泛的扩展^[2-5]。

MV模型假设资产的价格服从某个概率分布或者随机过程，而且均值和协方差矩阵等参数已知。然而，在投资实践中，难以找到合适的概率分布或者随机过程刻画资产的价格或者价格过程；即使找到，也难以准确估计模型的参数。这些缺陷在一定程度上限制了该模型的实际应用。为了克服MV模型的不足，Cover^[6]提出了在线投资组合选择理论。该理论完全基于历史资产数据，在决策过程中不对资产未来的价格做任何概率假设。

近年来，在线投资组合选择理论吸引了众多研究者的关注，取得了丰富的研究成果。Cover^[6]提出了第一个泛证券投资组合策略UP(Universal Portfolio)，其根据每个定常再调整策略(Constant Rebalanced Portfolio, CRP)先前的表现确定投资比例。O’Sullivan和Edelman^[7]通过引入相对绩效因子，改进了Cover的UP策略，提出了适应性的UP策略(Adaptive Universal Portfolio，AUP)，提高了UP策略的早期表现。杨兴雨等^[8]基于移动窗口设计了两个适应性策略。与策略UP相比，Helmbold等^[9]设计出具有更小时间复杂度的指数梯度策略(Exponential Gradient, EG), 并证明了EG策略具有泛证券性。随后，张卫国等^[10]基于线性学习函数对EG策略进行了改进；杨兴雨等^[11]将边信息引入EG策略，有效地提升了策略在实际应用中的性能。将过去证券价格序列对应的最优定常再调整策略(Best Constant Rebalanced Portfolio, BCRP)作为下一期的投资比例，Gaivoronski和Stella^[12]构造了连续定常再调整策略(Successive Constant Rebalanced Portfolio, SCRP)；通过将策略SCRP与上一期的投资比例进行加权平均，得到了加权的连续定常再调整策略(Weighted Successive Constant Rebalanced Portfolio, WSCRP)，并通过实证分析说明加权可以提高策略的性能。张永等^[13]利用弱集成算法(Weak Aggregating Algorithm，WAA)，提出了WAAS和WAAC策略。基于均值回归的特性，黄定江等^[14]使用L₁-中位数来预测股票价格，并通过利用主动被动学习算法来构造策略RMR(Robust Median Reversion)。综合考虑相邻投资比例的L₁范数和极大化期望收益以及交易费用存在的问题，李斌等^[15]设计出模型TCO(Transaction Cost Optimization)，并利用凸优化理论得到了策略的解析表达式。

文献[13]提出的策略WAAC考虑将所有的定常再调整策略看作是专家。投资实践表明，即使是最优的专家，也难以在整个在线序列决策中一直保持高收益。多数专家往往是在一段时期内表现较佳，而在另一段时期内则表现欠佳。称在某一段时期内表现较佳的专家为活跃专家；相反地，称在某一段时期内表现较差的专家为不活跃专家。通过引入末位淘汰不活跃专家的思路，本文提出了弱集成活跃专家策略。首先，将所有的定常再调整策略看作是专家；然后，在每一期期初，末位淘汰近期表现最差的专家进而构造活跃专家集合；最后，使用WAA集成所有活跃专家的意见，进而计算投资比例。选取美国市场的股票价格数据对策略进行了实证分析，结果说明了所构造的策略具有较好的竞争性能。

1 相关概念

设在 $T$ 投资期内投资 $m$ 只股票。用向量 ${{{x}}_t} =({x_{t,1}},$ $ {{x_{t,2}},\; \cdots \;,{x_{t,m}})^ {\rm{T}} } \in {\bf{R}}_ + ^m$ 表示第 $t$ 期的相对价格向量，其中 ${x_{t,i}}$ 表示第 $i$ 只股票在第 $t$ 期的相对价格，即第 $i$ 只股票在第 $t$ 期收盘价与第 $t - 1$ 期收盘价的比值 $(1 \leqslant t \leqslant T)$ 。整个投资期的相对价格向量序列为 $\{ {{{x}}_t}\} _{t = 1}^ {\rm{T}}$ 。投资者在第 $t$ 期的投资比例记为 ${{{b}}_t} = ({b_{t,1}},{b_{t,2}}, \cdots ,{b_{t,m}})$ ，其中 ${b_{t,i}}$ 表示第 $t$ 期投资于第 $i$ 种资产的比例。 ${\Delta _m} = \{ {{b}} = ({b_1},{b_2}, \cdots ,$ ${b_m}):{b_i} \geqslant 0,\sum\nolimits_{i = 1}^m {{b_i}} = 1\}$ 为所有可能的投资比例构成的集合。称整个投资期的投资比例构成的序列 $\left\{ {{{{b}}_t}} \right\}_{t = 1}^ {\rm{T}}$ 为一个在线投资组合策略。

在第1期的期初，采用平均投资的方式，即 ${{{b}}_1} = (1/m, \cdots ,1/m)$ 。整个投资期的最终累积收益为

${S_T} = {S_0}\prod\limits_{t = 1}^T {{{{b}}_t} {{{x}}_t}} = {S_0}\prod\limits_{t = 1}^T {\sum\limits_{i = 1}^m {{b_{t,i}}{x_{t,i}}} } $

(1)

式中， ${S_0}$ 为初始资产值。不失一般性，取 ${S_0} = 1$ 。

若每期均使用相同的投资比例 ${{b}} \in {\Delta _m}$ ，称这样的策略为定常再调整策略，其最终累积收益为 ${S_T}({{b}}) = $ $\prod\nolimits_{t = 1}^T {{{b}} } {{{x}}_t}$ 。称最终累积收益最大的定常再调整策略为最优定常再调整策略(Best CRP, BCRP)，记为 ${{{b}}^ * }$ ，即

${{{b}}^ * } = \mathop {\arg \max }\limits_{{{b}} \in {\Delta _m}} {S_T}({{b}})$

(2)

由式(2)可知，计算策略BCRP需要用到全部价格数据。因此，策略BCRP是一个离线策略，无法用于实际的投资决策。

2 弱集成活跃专家策略(WAAE)

张永与杨兴雨^[14]考虑将所有的CRP策略作为专家，提出了策略WAAC。根据专家过去的表现，该策略首先确定各专家的权重，进而使用WAA集成所有专家给出的意见。

设专家集合为 ${{b}} = {\Delta _m}$ 。每个专家 ${{b}}$ 在第 $t$ 期的累积对数收益为 ${G_t}({{b}}) = \sum\nolimits_{\tau = 1}^t {\ln ({{b}} {{{x}}_t})} $ 。在第 $t{\rm{ + }}1$ 期期初，根据每一专家 ${{b}}$ 的过去累积对数收益计算权重 ${p_{t + 1}}({\rm{d}}{{b}})$ ，即

${p_{t + 1}}({\rm{d}}{{b}}) = \frac{{\beta _{t + 1}^{{G_t}({{b}})}{\rm{d}}{{b}}}}{{\int_{{E}} {\beta _{t + 1}^{{G_t}({{b}})}{\rm{d}}{{b}}} }}$

(3)

式中， ${\;\beta _{t + 1}} = {{\rm{e}}^{1/\sqrt {t + 1} }}\;\;$ 。通过集成专家意见，计算第 $t + 1$ 期的投资比例

${{{b}}_{t + 1}} = \int_{{E}} {{{b}}{p_{t + 1}}} ({\rm{d}}{{b}}) = \frac{{\int_{{E}} {{{b}}\beta _{t + 1}^{{G_t}({{b}})}{\rm{d}}{{b}}} }}{{\int_{{E}} {\beta _{t + 1}^{{G_t}({{b}})}{\rm{d}}{{b}}} }} = \frac{{\int_{{E}} {{{b}}{{({S_t}({{b}}))}^{\frac{1}{{\sqrt {t + 1} }}}}{\rm{d}}{{b}}} }}{{\int_{{E}} {{{({S_t}({{b}}))}^{\frac{1}{{\sqrt {t + 1} }}}}{\rm{d}}{{b}}} }}$

(4)

式中， ${S_t}({{b}}) = \prod\nolimits_{\tau = 1}^t {{{b}} } {{{x}}_\tau }$ 。为便于计算，将集合 ${{E}}$ 均等离散化为可行策略集合 ${\tilde{{E}}}$ ，式(4)则变为

${{{b}}_{t + 1}} = \frac{{\displaystyle\sum\nolimits_{{\tilde{{E}}}} {{{b}}{{({S_t}({{b}}))}^{\frac{1}{{\sqrt {t + 1} }}}}} }}{{\displaystyle\sum\nolimits_{{\tilde{{E}}}} {{{({S_t}({{b}}))}^{\frac{1}{{\sqrt {t + 1} }}}}} }}$

(5)

综合考虑一系列专家意见是投资者在投资决策过程中常用的方法。事实上，即使是最优的专家，也很难做到在整个在线序列决策中一直保持高收益。多数专家往往是在一段时期内表现较佳，而在另一段时期内则表现欠佳。本文称在某一段时期内表现较佳的专家为活跃专家。通过引入末位淘汰不活跃专家的思路，本文提出了弱集成活跃专家策略(Weak Aggregating Active Expert，WAAE)。具体地，在每一期期初，首先，从原始的专家集合中剔除近期表现最差的专家，进而构造活跃专家集合；然后，通过集成所有活跃专家意见，做出投资决策。

设第 $t$ 期的活跃专家集合为 ${\tilde{{E}}}_t^a$ 。本文使用固定长度的窗口数据来确定最差专家，记窗口数据的长度为 $w\;(w \in {{\rm{N}}^ + })$ ，并称包含 $w$ 期相对价格向量的序列为移动窗口(Moving Window)。在第 $t + 1$ 期初，不活跃专家 ${{b}}_{t + 1}^\# $ 可表示为

${{b}}_{t + 1}^\# = \arg \mathop {\min }\limits_{{{b}} \in {\tilde{{E}}}} {\kern 1pt} \prod\nolimits_{\tau {\rm{ = }}t'}^t {{{b}} {{{x}}_\tau }} ,\;t' = \max \{ t - w + 1,1\} $

(6)

因此，此时活跃专家集合为 ${\tilde{{E}}}_{t + 1}^a{\rm{ = }}{\complement _{\;{\tilde{{E}}}}}\{ {{b}}_{t + 1}^\# \} {\rm{ }}$ 。根据每个活跃专家的历史累积对数收益计算权重 ${p_{t + 1}}({{b}})$ ，即

${p_{t + 1}}({{b}}) = \frac{{\beta _{t + 1}^{{G_t}({{b}})}}}{{\displaystyle\sum\nolimits_{i \in {\tilde{{E}}}_{t + 1}^a} {\beta _{t + 1}^{{G_t}({{b}})}} }}$

(7)

通过集成所有活跃专家意见，第 $t + 1$ 期的投资比例可以计算为

$\begin{split}{{{b}}_{t + 1}}=& \displaystyle\sum\limits_{{\bf{b}} \in {\tilde{{E}}}_{t + 1}^a} {{{b}}{p_{t + 1}}({{b}})} = \displaystyle\frac{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {{{b}}\beta _{t + 1}^{{G_t}({{b}})}} }}{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {\beta _{t + 1}^{{G_t}({{b}})}} }} = \\& \displaystyle\frac{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {{{b}}{S\!_t}{{({{b}})}^{1/\sqrt {t + 1} }}} }}{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {{S\!_t}{{({{b}})}^{1/\sqrt {t + 1} }}} }}\end{split}$

(8)

一般地，第1期的投资比例设为 ${{{b}}_1} = (1/m,\;\cdots \;,1/m)$ 。

算法1给出了上述策略的计算流程。

算法1 WAAE策略

输入： $\small\{ {{{x}}_t}\} _{t{\rm{ = }}1}^{\rm{T}}$ ：相对价格向量序列； $w$ ：移动窗口长度。

输出： $\small{S\!_T}$ ：最终累积收益。

1. 初始化： $\small{S_0} = {S_0}({{b}}) = 1,\;{{{b}}_1} = (1/m, \cdots ,1/m)$ ；

2. $\small t = 1,2,\; \cdots \;,T$ 内，循环计算以下流程；

3. 取得第 $t$ 期的相对价格： $\small{{{x}}_t} = {({x_{t,1}},{x_{t,2}},\; \cdots \;,{x_{t,m}})^ {\rm{T}} }$ ；

4. 计算第 $t$ 期的累积收益： $\small{S\!_t} = {S\!_{t - 1}} \times \left( {{{{b}}_t} {{{x}}_t}} \right)$ ；

5. 确定第 $\small t + 1$ 期的不活跃专家： $\small {{b}}_{t + 1}^\# = \arg \mathop {\min }\limits_{{{b}} \in {\tilde{{E}}}} {\kern 1pt} \prod\nolimits_{\tau {\rm{ = }}t'}^t {{{b}} {{{x}}_\tau }} ,$ 　 $\small t' = \max \{ t - w + 1,1\} $ ；

6. 更新活跃专家集合： $\small{\tilde{{E}}}_{t + 1}^a{\rm{ = }}{\complement _{\;{\tilde{{E}}}}}\{ {{b}}_{t + 1}^\# \} {\rm{ }}$ ；

7. 通过集成专家意见，计算第 $\small t + 1$ 期的投资比例：

$\qquad \qquad \quad \small{{{b}}_{t + 1}} = \frac{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {{{b}}{S\!_t}{{({{b}})}^{1/\sqrt {t + 1} }}} }}{{\displaystyle\sum\nolimits_{{{b}} \in {\tilde{{E}}}_{t + 1}^a} {{S\!_t}{{({{b}})}^{1/\sqrt {t + 1} }}} }},$

　其中， $\small {S\!_t}({{b}}) = \prod\nolimits_{\tau = 1}^t {{{b}} } {{{x}}_\tau }$ ；

8. 重复上述步骤至投资结束。

3 数值算例

本节使用美国市场的股票数据，对上节提出的策略WAAE进行数值分析，给出其与基准策略以及已有的在线策略的比较结果，并对策略的参数进行敏感性分析。

3.1 数据

本文分别从NYSE(O)与NYSE(E)两个股票数据集中选取股票构造股票组合。NYSE(O)是Cover从纽约证券交易所中收集并首次使用^[6]，包含了从1962年7月3日至1984年12月31日共5 651个交易日相对价格的数据。NYSE(O)为在线投资组合选择问题研究的标准数据集，被国内外众多研究者采用^{[6, 9, 11]}。NYSE(E)为NYSE(O)的补充版本，包含了从1985年1月1日至2018年12月31日共8 570个交易日相对价格的数据。本文构造了8组股票组合，其中，前4组股票数据来源于NYSE(O)数据集，后4组来源于NYSE(E)数据集。表1列出8组股票组合的具体信息。

表 1 股票组合名称 Table 1 Names of stock combinations

3.2 参数设置

本文提出的策略WAAE包含参数移动窗口长度 $w$ ，除了敏感性分析之外，所有数值实验都设定参数 $w$ 为300。已有的策略所涉及的参数均按照原文献来取值。具体策略介绍如下：

(1) Market：在第1期期初采用平均投资的方式购入股票并一直持有至投资结束的策略；

(2) Best：在组合中最终累积收益最大的股票；

(3) BCRP：最优定常再调整策略；

(4) UP：泛证券投资组合策略，离散化可行策略集 ${\Delta _m}{\rm{ = }}0.05$ ^[6]；

(5) EG：指数梯度策略，参数参照Helmbold等^[9]的设置，即 $\eta = 0.05$ ；

(6) LFM：基于线性学习函数的策略，参数参照张卫国等^[10]的设置，即 $\sigma = 0.0{\rm{1}}$ ；

(7) WAAC：集成所有CRP策略的在线投资组合策略^[14]。

3.3 结果分析

累积收益大小是衡量策略优劣的标准，最终累积收益越大可以表明其竞争性能越优。表2列出了策略WAAE与基准策略以及已有的在线策略在不同组合上最终累积收益。其中，E/C表示策略WAAE与策略WAAC策略的比值。为了便于观察，加粗表示策略在这一组合上取得最大值。与已有的策略相比，策略WAAE在所有的组合上均取得较优的结果，即其最终累积收益在不同的组合上都取得最大值，而且仅次于离线策略BCRP。同时，每组组合的E/C值均大于1，这表明引入末位淘汰不活跃专家的思路能提升策略的性能。

表 2 不同的股票组合上不同策略的最终累积收益的比较 Table 2 Comparison of final cumulative wealth of each strategy on different stock combinations

接着，分析各策略的逐日累积收益表现。图1为策略BCRP，UP，EG和WAAE在组合1，3，5和7上的逐日累积收益。通过观察，随着交易期数的增加，策略WAAE与策略UP和EG保持着一致的走势，但策略WAAE的逐日累积收益几乎能够稳定地高于策略UP和EG并逐渐拉开差距，这进一步说明策略WAAE的竞争性能优于策略UP和EG。

图 1 各策略在不同的股票组合上逐日累积收益的比较 Figure 1 Comparison of daily cumulative wealth of each strategy on different stock combinations

3.4 敏感性分析

本小节分析策略WAAE对移动窗口长度 $w$ 与交易费用率 $\gamma $ 的敏感性。

3.4.1 移动窗口长度的敏感性分析

为分析策略WAAE对移动窗口长度 $w$ 的敏感性，图2给出了当移动窗口长度 $w$ 取不同值时策略WAAE在组合1，3，5和7上的最终累积收益，其中 $w$ 的取值区间为{ $200,220,\cdots,400$ }。为了便于观察，图2增加了策略BCRP，UP和EG的最终累积收益线。从图2可以看出，当移动窗口长度取不同值时，策略WAAE的最终累积收益并没有明显的变化趋势，而且能稳定地高于策略UP和EG，这表明策略WAAE对移动窗口长度的选择并不敏感。因此，在一定范围内，选取不同长度的移动窗口对策略的实际表现影响不大。

图 2 移动窗口长度 $w$ 的敏感性分析 Figure 2 Parameter sensitivity of WAAE with respect to moving window length $w$

3.4.2 交易费用率的敏感性分析

在实际的投资决策中，交易费用是不可避免的。本小节分析交易费用对策略WAAE最终累积收益的影响。在计算时，采用比例交易费用模型^[16]，即每一交易期的交易费用与该期交易额呈线性关系，并设交易费用率为 $\gamma $ 。图3给出了当交易费用率为 $\gamma $ 取不同值时策略WAAE在组合1，3，5和7上的最终累积收益，其中 $\gamma $ 的取值区间为{0,0.05%, $\cdots,0.5$ %}。为了便于观察，图3同时给出了策略BCRP，UP和EG在不同交易费用率取值下的最终累积收益。从图3可以看出，随着交易费用率逐渐增长到0.5%，策略BCRP，UP，EG和WAAE的最终累积收益逐渐减少，而且减少的幅度基本一致，这表明策略BCRP，UP，EG和WAAE对交易费用率的敏感程度基本一样。同时，可以观察到的是，在交易费用率相同的情况下，策略WAAE取得的最终累积收益高于策略UP和EG，这表明在相同交易费用率情况下，策略WAAE的竞争性能优于策略UP和EG。

图 3 交易费用率 $\gamma $ 的敏感性分析 Figure 3 Parameter sensitivity of WAAE with respect to transaction cost rate $\gamma $

4 结论

通过引入末位淘汰不活跃专家的思路，本文提出了弱集成活跃专家策略。使用美国股票市场的数据对策略WAAE进行数值分析。结果表明，与策略WAAC相比，策略WAAE的性能具有一定的提升。这说明不活跃专家意见对投资决策存在一定的干扰影响，而且末位淘汰不活跃专家的方式可以提升策略的性能。然而，本文也存在一些不足之处。本文简单地将近期表现最差的专家看作是不活跃专家，如何设计更为灵活且符合实际的活跃专家判别算法是下一阶段值得思考的问题。另外，本文未能在理论上分析策略WAAE的竞争性能，这也将是未来研究的重要方向。

参考文献

[1]	MARKOWITZ H M. Portfolio selection[J]. The Journal of Finance, 1952, 7(1): 77-91.
[2]	王伟, 刘巍. 不确定收益率下投资组合的可拓评价及变换[J]. 广东工业大学学报, 2012, 29(1): 83-87. WANG W, LIU W. Extension evaluation and transformation of the stock under uncertain profit rates[J]. Journal of Guangdong University of Technology, 2012, 29(1): 83-87. DOI: 10.3969/j.issn.1007-7162.2012.01.021.
[3]	LOTFI S, SALAHI M, MEHRDOUST F. Adjusted robust mean-value-at-risk model: less conservativerobust portfolios[J]. Optimization & Engineering, 2017, 18: 467-497.
[4]	CUI XY, LI D, WANG SY, et al. Better than dynamic mean-variance: time inconsistency and free cash flow stream[J]. Mathematical Finance, 2012, 22(2): 346-378. DOI: 10.1111/j.1467-9965.2010.00461.x.
[5]	LIU YJ, ZHANG WG. A multi-period fuzzy portfolio optimization model with minimum transaction lots[J]. European Journal of Operational Research, 2015, 242(3): 933-941. DOI: 10.1016/j.ejor.2014.10.061.
[6]	COVER T M. Universal portfolios[J]. Mathematical Finance, 1991, 1(1): 1-29. DOI: 10.1111/j.1467-9965.1991.tb00002.x.
[7]	O’SULLIVAN P, EDELMAN D. Adaptive universal portfolios[J]. The European Journal of Finance, 2015, 21(4): 337-351. DOI: 10.1080/1351847X.2013.788534.
[8]	杨兴雨, 何锦安, 沈健华. 基于移动窗口的适应性在线投资组合策略[J]. 广东工业大学学报, 2018, 3(3): 65-70. YANG X Y, HE J A, SHEN J H. An adaptive online portfolio strategy based on moving window[J]. Journal of Guangdong University of Technology, 2018, 3(3): 65-70.
[9]	HELMBOLD P, SCHAPIRE E, SINGER Y. On-line portfolio selection using multiplicative updates[J]. Mathematical Finance, 1998, 8(4): 325-347. DOI: 10.1111/1467-9965.00058.
[10]	张卫国, 张永, 徐维军, 等. 基于线性学习函数的泛证券投资组合策略[J]. 系统工程理论与实践, 2012, 32(8): 1647-1654. ZHANG W G, ZHANG Y, XU W J, et al. Universal portfolio based on on-line learning of linear function[J]. Systems Engineering-Theory & Practice, 2012, 32(8): 1647-1654. DOI: 10.3969/j.issn.1000-6788.2012.08.003.
[11]	杨兴雨, 何锦安, 张永, 等. 考虑边信息的在线投资组合指数梯度策略[J]. 系统工程理论与实践, 2019, 39(1): 60-69. YANG X Y, HE J A, ZHANG Y, et al. Exponential gradient strategy for online portfolio with side information[J]. Systems Engineering-Theory & Practice, 2019, 39(1): 60-69. DOI: 10.12011/1000-6788-2017-1669-10.
[12]	GAIVORONSKI A, STELLA F. Stochastic nonstationary optimization for finding universal portfolios[J]. Annals of Operations Research, 2000, 100(1-4): 165-188.
[13]	ZHANG Y, YANG X Y. Online portfolio selection strategy based on combining experts’ advice[J]. Computational Economics, 2017, 50(1): 141-159. DOI: 10.1007/s10614-016-9585-0.
[14]	HUANG D J, ZHOU J L, LI B, et al. Robust median reversion strategy for on-line portfolio selection[J]. IEEE Transactions on Knowledge and Data Engineering, 2016, 28(9): 2480-2493. DOI: 10.1109/TKDE.2016.2563433.
[15]	LI B, WANG J L, HUANG D J, et al. Transaction cost optimization for online portfolio selection[J]. Quantitative Finance, 2018, 18(8): 1411-1424. DOI: 10.1080/14697688.2017.1357831.
[16]	BLUM A, KALAI A. Universal portfolios with and without transaction costs[J]. Machine Learning, 1999, 35(3): 193-205. DOI: 10.1023/A:1007530728748.