中国股市仅有20多年历史,作为一个新兴市场,由于市场机制不完善、法制建设滞后以及投资者心理不成熟等原因,受政策面和消息面影响较大,呈现出典型的牛短熊长、暴涨暴跌特点。因此,中国股市发生突变的几率更大,研究中国股市的结构突变问题对于投资者风险管理具有重要意义。
从上海证券交易所开业起,中国股市便展现出一种非比寻常的发展状态,中国的股民也经历了一次次惊心动魄的过山车之旅。所谓的经济晴雨表似乎出现了故障,在中国经济以极快速度增长的同时,中国股市却出现另一番景象。上海证券交易所开业以来到2015年8月份上证指数每日开盘价、最高价、最低价、收盘价、成交量、成交额的走势如图 1所示。
近30多年以来,有关金融时间序列结构性变点的实证研究,在国际金融学界方兴未艾。Hsu等最早对时间序列结构性变点进行研究。他们从时间序列方差的角度进行研究,提出了可用在某些不规则时点上方差呈变化的正态分布模型来替代帕累托分布模型。[1]108—113随后,Booth和Smith采用贝叶斯比率(Bayes Ratio)来判断时间序列是否在某一未知时刻存在某一单个方差变点。[2]Hsu等也在其以前研究的基础上进一步对时间序列在某一未知时刻存在的某一方差变点的测量进行了研究。由于测量多个变点的计算量太大,他把重点集中在对单个变点的测量上。[1]108—113Worsley则运用最大似然法检验了以各种独立指数型变量所构成的序列中存在的一个均值变点的情况,他不仅给出了该均值变点的位置,而且还提供了相应的置信区间。[3]Miao研究了斜率存在变点的序列。[4]缪柏其等讨论了变点个数和位置的检测。[5]Ramanayake研究了伽玛分布刻度参数已知条件下形状参数的变点检测问题。[6]谭常春和缪柏其研究了至多一个变点的伽玛分布的统计推断。[7]雷鸣等运用生存分析与变点理论对上证指数进行了研究, 发现连涨和连跌的股指服从伽玛分布, 表明股市是有记忆的并且不服从随机游动假说。[8]杨继平等利用非参数GARCH模型估计样本区间的波动率;最后利用N-W核回归估计对非参数GARCH估计的波动率与收益率进行回归,分析股市结构性波动产生的政策性影响因素。[9]
模型估计利用划分均值和方差变点的迭代累积平方和算法(ICSS:MV)对上证综指和深证成指1996年12月16日至2010年12月31日的日收益率序列进行结构变点的检验,通过将结构变点与重大事件对应选取影响沪深股市结构性波动的政策性事件,并根据选取的事件将样本区间分成13个子区间。
中国股市,作为一个新兴市场,由于法制建设滞后、市场机制不完善以及投资者心理不成熟等原因,导致其易受外界各种因素的影响而呈现出较大的波动。但如前所述,从现有的实证研究看,针对中国股市市场波动的研究,除运用诸如生存分析、GARCH模型等进行拟合检验以及其他相关方面的研究外,至今仍缺乏对股市结构性变动较为系统的实证研究。
文章基于密度函数比估计从一个新的视角来对中国A股市场的结构性突变进行研究。之前大部分研究只考虑了收盘价格序列。然而市场充满不确定性,只考虑收盘价格序列不能全面地反映当前市场的实际情况。为了更加合理、全面地研究中国股票市场的结构,文章充分考虑上证综合指数每日的开高低收价格序列和成交量、成交额序列,基于时间序列样本间的非参数密度函数比[10]估计A股市场的结构性变点。
二、RuLSIF模型考虑一个在t时刻的d维样本时间序列y(t)∈Rd,为了更加合理地综合考虑依赖于时间的样本信息,根据Kawahra和Sugiyama[11]的研究,可以使用t时刻长度为k的子序列Y(t)代替原样本序列y(t):
(1) |
定义Γ(t):
Γ(t)={Y(t), Y(t+1), …, Y(t+n-1)}∈Rdk×n,变点检测就是基于计算两个连续段Γ(t)和Γ(t+n)之间的相异度。
设Γ(t)和Γ(t+n)的概率分布分别为Pt和Pt+n,定义相异度为
(2) |
其中:D(Pt||Pt+n)表示一个非对称相异度函数[12]:
(3) |
其中:f(·)为一个凸函数,f(1)=0,p(Y)>0和p′(Y)>0分别为P和P′的概率密度,D(P||P′)≠D(P′||P),f有多种著名的函数形式,采用Pearson发散度函数:
(4) |
则式(3)可以表达为
(5) |
在实际中密度函数p(Y)和p′(Y)都为未知的,无法直接计算得到相异度的值,分别估计出p(Y)和p′(Y)非常困难且不现实。但是,直接估计出他们的密度函数比值相对来说简单的多,且能克服单独估计各自的密度函数出现的维度灾难问题。RuLSIF模型就是通过直接估计密度函数比来计算相异度。密度函数比
(6) |
其中:θ=(θ1, θ2, …, θn)T是从样本中得到的参数,核基函数K(Y, Yl)为核宽度是σ>0的高斯核函数:
(7) |
核宽度σ为可以通过交叉验证得到。由于密度函数比
(8) |
其中:0≤α < 1,pα′(Y)=αp(Y)+(1-α)p′(Y),从而可以得到α相对密度比
(9) |
综上,α相对变点相异度Dis可以表达为
(10) |
最小化J(Y)可以得到参数θ=(θ1, θ2, …, θn)T的值,其中
(11) |
将式(6)代入可以将最小化问题转化为
(12) |
其中:λ为通过交叉验证选择的参数;H为n×n维矩阵,且
(13) |
h为n×1维矩阵,且
(14) |
从而易得参数θ=(θ1, θ2, …, θn)T为
(15) |
进一步可以得出密度比估计值
(16) |
综上,可以得出α相对变点相异度Dis的近似值为
(17) |
Dis的值越大,该处越有可能为变点。
三、模型的实证分析 (一) 数据的选取与处理为了对中国A股市场的结构性进行系统全面的研究,笔者选用上证综指的每日开盘价、最高价、最低价、收盘价和成交量、成交额组成的六维矩阵作为输入样本。
在数据选取上,笔者结合市场实际情况,而不是单纯的看数据本身,有主观的因素在里面。新中国股市从1990年12月上海证券交易所的成立至今,已有25年历史。然而,在1992年5月以前,上海证券交易所只有延中实业等“老八股”公开挂牌交易,流通量很小,远远难以满足投资者的需求,因此,市场上只买不卖,有价无市,事实上属于一种虚拟的市场,而1992年5月25日新股上市并放开股价后,过去积聚的需求瞬间释放,引起了股市的剧烈波动。为了排除这种股市刚刚创立时的波动的影响,文章排除了1993年以前的数据。文章选取的样本区间为1993年1月4日到2015年8月25日。
笔者首先使用全样本数据从总体全局上分析中国A股市场从1993年1月4日到2015年8月24日之间的结构性突变,再使用样本内数据对样本外的走势进行预测,验证模型对实际投资中的风险管理预先指导的可行性与科学性。
(二) 上证A股全样本数据总体结构性分析使用全样本数据(1993年1月4日到2015年8月25日),模型计算得出的Dis值如图 2所示。
从图 2可知,从1993年1月至今,文章的模型基本上准确地在A股市场每次涨跌趋势改变之前给出了预警信号。其中Dis值超过2 000的共有77个,Dis最大值为13 915.02。挑出Dis值超过10 000的几个代表性变点对最近的股市进行分析。具体结果如表 1所示。
模型计算得出的Dis值最大位置出现在2014年10月16日,说明从2014年10月16日开始,A股市场的市场结构已经发生本质的改变,和之前的市场结构具有很大的不同,投资者在看到模型给出的该信号后,提前做好心理准备,以和以前不同的投资和风控逻辑对待当前的市场。市场结构发生这么大的突变主要是因为之前股市没有非常多的配资资金,而随着互联网金融的发展,现在民间配资非常便捷,越来越多的配资资金进入股市,模型说明从2014年10月16日开始,股市里的杠杆资金已经大幅度地改变了中国A股的内部机构,投资者应该从这时候开始,采用新的视野来看待中国A股市场,相应的风险控制也应该改变。模型显示在2015年6月出现了2次较大的变点,且变点值都很大,说明市场结构在6月份发生突变的概率非常大,投资者应随时做好心理准备和风控措施。之后的走势也验证了模型结果的合理性。
模型较准确地捕捉到了价格走势突变的拐点位置,如图 3所示。
(三) 上证A股样本内数据对样本外结构性变点预测
在验证了模型在样本内具有很好的表现后,用文章的模型对最近的股市结构性变点进行预测,进而在实际中指导投资,提前做好风险控制。
1. 上证A股2015年3月30日之后会继续大涨吗首先截取2014年1月2日至2015年3月30日之间的数据作为样本内数据,来验证在2015年3月30日后上证A股的走势是否会发生突变。模型计算结果如图 4所示。
2015年3月30日之后上证A股真实走势如图 5所示。从图 4可以看出,基于2014年1月2日至2015年3月30日为样本内数据,模型得出的结果显示在2015年3月30日之后的走势仍然延续之前的趋势,没有出现结构性变点,与图 5中的实际情况吻合。
2. 上证A股2015年6月12日之后牛市继续吗
为了更进一步的验证模型的可靠性,截取2014年1月2日至2015年6月12日之间的数据作为样本内数据,预测2015年6月12日之后的走势,如果模型能够在2015年6月12日附近计算出变点,则能与之后的暴跌走势相符合,说明模型在预测结构性变点上具有一定的可靠性和稳定性。模型计算结果如图 6所示。
2015年6月12日之后上证A股真实走势如图 7所示。从图 6可以看出,在2015年6月12日附近出现很大的变点,说明市场走势将会在2015年6月12日之后会很大概率发生改变,即在这之后市场有可能发生大跌,投资者应该在看到模型给出的信号后,尽早改变当前的投资策略和投资组合,防范于未然,避免不必要的损失。模型预测结果与图 7中的实际走势相吻合。
3. 上证A股2015年7月8日是钻石底么
2015年7月8日之后的那一波小反弹,如果模型显示发生改变,说明之后一直会延续大涨趋势,7月8日之后的大跌会终止,又一波牛市到来,则说明模型稳定性存在问题,如果在该处附近没有变点,说明模型结果认为市场根本性结构没有改变,只是短暂的小反弹,市场后期仍然延续下跌走势,说明模型稳定性较好,能够很大概率成功提前预警市场的大涨大跌转变点,模型实际运行结果如图 8所示。
以2014年1月2日至2015年7月8日为样本内数据预测2015年7月8日之后走势如图 8所示,2015年7月8日之后上证A股真实走势如图 9所示。从图 8可以看出,除了之前上文研究的两个变点(2015年6月3日和6月18日)外,之后的Dis值越来越小,说明从6月18日之后市场结构性没有发生改变,仍然维持之前的大跌趋势,即使7月8日之后有波小反弹,但是模型表明这波小反弹没有改变市场的总体下跌趋势,从截止到2015年7月8日的数据来看,后市总体趋势仍然看空。模型结果与图 9中的实际走势相吻合。
4. 上证A股2015年8月17日之后会大反弹吗
截止到2015年8月17日,模型计算如图 10所示。
2015年8月17日之后上证A股真实走势如图 11所示。从图 10可以看到,模型在该点处仍然没有发生突变,说明截止到2015年8月17日,模型计算结果表明,仍然对后市看空,维持之前的大跌趋势,市场结构还没有发生反转。模型计算结果与图 11中的实际情形相吻合。
四、结论与总结
文章基于密度函数比估计从一个新的视角来对中国A股市场的结构性突变进行研究。充分考虑上证综合指数每日的开高低收价格序列和成交量、成交额序列,基于时间序列样本间的非参数密度函数比估计A股市场的结构性变点。
通过以上样本内和样本外分析,可以看到文章的模型计算结果与实际情况符合,更进一步地说明了模型在预警市场趋势大的突变方面具有一定的可行性和稳定性。提前对投资者起到风险预警的作用,有一定的实用价值。模型对未来50天左右的大盘趋势有一定的预警左右,即模型可以较精确地给出未来大盘走势是维持目前现状还是有大的突变行为,可以为投资者提前做好风险控制。比如如果当前是震荡市场,如果模型结果显示未来一段时间没有大的突变行为,那么对于大型机构,未来一段时间可以轻仓或者进行一些套利策略;如果模型显示未来会发生突变,那么可以根据当前宏观经济环境和相关分析,大概率预测未来是上涨趋势还是下跌趋势,运行趋势策略,最大化抓住行情。其他情形类似可推。
模型对大的趋势预测较准确,之后研究方向可以在此模型基础上更进一步地优化模型,使得模型对短期的小趋势也能较准确地预警。
[1] |
HSU D A, MILLER R B, WICHERN D W. On the stable Paretian behavior of stock-market prices[J]. Journal of the American Statistical Association, 1974, 69(345): 108-113. DOI:10.1080/01621459.1974.10480135 |
[2] |
BOOTH N B, SMITH A F M. A bayesian approach to retrospective identification of change-points[J]. Journal of Econometrics, 1982, 19(1): 7-22. DOI:10.1016/0304-4076(82)90048-3 |
[3] |
WORSLEY K J. Confidence regions and tests for a change-point in a sequence of exponential family random variables[J]. Biometrika, 1986, 73(1): 91-104. DOI:10.1093/biomet/73.1.91 |
[4] |
MIAO B Q. Inference in a model with at most one slope-change point[J]. Journal of multivariate analysis, 1988, 27(2): 375-391. DOI:10.1016/0047-259X(88)90136-4 |
[5] |
缪柏其, 赵林城, 谭智平. 关于变点个数及位置的检测和估计[J]. 应用数学学报, 2003, 26(1): 26-39. |
[6] |
RAMANAYAKE A. Tests for a change point in the shape parameter of gamma random variables[J]. Communications in Statistics-Theory and Methods, 2005, 33(4): 821-833. DOI:10.1081/STA-120028728 |
[7] |
谭常春, 缪柏其. 至多一个变点的Г分布的统计推断[J]. 中国科学技术大学学报, 2005, 35(1): 51-58. |
[8] |
雷鸣, 谭常春, 缪柏其. 运用生存分析与变点理论对上证指数的研究[J]. 中国管理科学, 2007, 15(5): 1-8. |
[9] |
杨继平, 陈晓暄, 张春会. 中国沪深股市结构性波动的政策性影响因素[J]. 中国管理科学, 2012, 20(6): 43-51. |
[10] |
LIU S, YAMADA M, COLLIER N, et al. Change-point detection in time-series data by relative density-ratio estimation[J]. Neural Networks, 2013, 43: 72-83. DOI:10.1016/j.neunet.2013.01.012 |
[11] |
KAWAHARA Y, SUGIYAMA M. Sequential change-point detection based on direct density-ratio estimation[J]. Statistical Analysis and Data Mining:The ASA Data Science Journal, 2012, 5(2): 114-127. DOI:10.1002/sam.v5.2 |
[12] |
ALI S M, SILVEY S D. A general class of coefficients of divergence of one distribution from another[J]. Journal of the Royal Statistical Society:Series B (Methodological), 1966, 28(1): 131-142. |