文章快速检索     高级检索
  南方经济  2015, Vol. 33 Issue (11): 36-52  
0

引用本文 

姜杨, 闫相斌. 基于信息结构视角的网络论坛与股票市场之间信息传递关系研究[J]. 南方经济, 2015, 33(11): 36-52.
Jiang Yang, Yan Xiangbin. An Information Structure Perspective: the Information Spillovers between Internet Forum and Stock Market in China[J]. South China Journal of Economics, 2015, 33(11): 36-52.

基金项目

本文得到国家自然科学基金 (71171067,71531013)的资助

作者简介

姜杨,哈尔滨工业大学管理学院博士研究生,E-mail:jiangyanghit@126.com;
闫相斌,哈尔滨工业大学管理学院教授,E-mail: xbyan@hit.edu.cn,通讯地址:黑龙江省哈尔滨市南岗区法院街13号,邮编:150001
基于信息结构视角的网络论坛与股票市场之间信息传递关系研究
姜杨, 闫相斌     
摘要:网络论坛与股票市场之间的信息传递关系对于研究市场信息效率具有积极意义,本文从论坛信息结构视角出发,研究两者之间的信息传递关系。结果表明论坛发帖量与股票市场收益率之间存在信息传递关系:日内发帖量与日内收益率之间存在相互的波动溢出,且由日内发帖量向日内收益率的单向波动溢出显著;隔夜发帖量向次日日内收益率的单向波动溢出显著;仅存在隔夜收益率向日内发帖量的单向波动溢出。此外,网络论坛发帖量和股票市场收益率之间的时变相关系数与情绪倾向变量正相关,与意见差异变量负相关。
关键词波动溢出    信息传递    日内收益率    隔夜收益率    BEKK-GARCH    
An Information Structure Perspective: the Information Spillovers between Internet Forum and Stock Market in China
Jiang Yang , Yan Xiangbin
Abstract: The information spillover effects between the internet forum and stock market is important to market efficiency.This paper investigates these information spillovers between the internet forum postings and stock market return from an information structure perspective.We find that: there are information spillovers effects between internet forum postings and stock market returns. This holds for the intraday information spillovers, especially from the intraday internet forum postings to the intraday stock market return; the overnight information spillovers, especially from the overnight internet forum postings to the following day's intraday stock market return, can be identified; we only find evidence of a spillover from the previous day's overnight stock market return to the intraday internet forum postings; the dynamic correlation coefficient is positive under inter-day settings, and is negative under overnight setting. The proxy for sentiment has a significant positive correlation with the information spillovers, whilst the disagreement proxy is negatively related to the information spillovers.
Key Words: Volatility spillovers    Information transmission    Interday return    Overnight return    BEKK-GARCH    
一、 引言

金融市场的波动不仅受其过去波动的影响,往往也会受其他市场波动的影响,这种市场之间波动的传导关系为波动溢出,是金融市场之间的信息传递效应的体现。已有关于波动溢出效应的研究众多,这些研究从不同视角展开分析,包括不同类型的金融市场之间、金融产品和其基础资产之间(Karolyi,1995Drimbetas et al., 2007, 华仁海和张朋,2012),跨区域或者跨子市场(Antoniou and Holmes, 1995Susmel and Engle, 1994夏天,2008吴吉林和操君,2011) 的信息传递效应等。但是,涉及其中一方带有非金融市场性质的信息传递研究较少。本文将尝试探究网络论坛与股票市场之间的信息传递关系,具体研究不同信息结构下的网络论坛信息量和股票市场收益之间的信息传递效应,探寻两者之间的信息传递路径、传递方向及其影响程度,以最大程度地揭示网络论坛与股票市场之间的信息传递过程和机理。

随着信息技术快速发展,股票市场对于信息的需求更加强烈,聚集了大量的论坛用户、观点及信息的网络论坛成为投资者进行信息交流的重要平台之一。网络论坛与股票市场两者之间形成了密切关系,主要体现在以下两个方面:一方面,论坛信息可以通过信息获取与吸收、信息交流与修正、认知形成与预期三种方式相互作用,影响投资者的投资决策,进而影响股票市场收益。关于信息获取与吸收,股票市场对信息需求高度敏感,而大部分投资者缺少专业能力,同时也受限于时间和精力,只能接触到有限的信息。而网络论坛汇集了大量的信息,成为投资者获取信息的重要来源,他们可以在论坛中搜索到关于特定公司股票的评论和历史观点。关于信息交流与修正,论坛用户不仅仅是被动的信息接受者,股票网络论坛以其自由的形式、简洁非正式对话等特征为他们进行线上交流提供了便利。用户的意见观点可能被其他人接受并采纳,他们也可以采纳其他用户提供的信息来修正自身的意见和看法。关于认知形成与预期,论坛用户在信息获取、交流及修正后会形成基于论坛已有信息的市场预期,增加或降低对于股票市场表现的信心。另一方面,股票市场表现也能够影响网络论坛活动。股票市场收益变动能够引发用户在论坛的讨论,既可以是日内交易时段的同步讨论,也可以是在收盘后对市场收益变动的讨论,上述过程包含两种影响机制。一种是股票市场通过投资者影响网络论坛活动,投资者在论坛交流和分析日内市场行情变动的原因,同时也根据隔夜到达的新信息发表关于其对股票市场行情的预期;另一种是股票市场通过发行股票的公司影响论坛活动,特定股票公司利用舆论来引导关于该公司的积极信息,更重要的是可以通过在论坛中的引导发言,建立领导性观点以减弱关于公司负面新闻带来的影响,增强投资者对公司经营表现的信心,降低次日股票价格的震荡。

关于论坛信息的研究认为论坛信息不仅仅反映了噪声,还能够反映出与公司基本面特征以及股票市场活动有关的信息(Wysocki,1998)。董大勇和肖作平(2011)从信息传递角度考察股票论坛和交易市场渠道之间的关系。另有观点认为论坛中的观点只是噪声,Tumarkin and Whitelaw(2001)指出异常的讨论活动并不能预测超额收益,Antweiler and Frank(2004)研究发现网络论坛上的发帖活动对股票交易量和波动具有影响,没有充分的证据表明发帖活动对于股票市场收益具有显著影响。后一种观点相对于前一观点而言,不够辩证和全面,论坛信息若包含有价值的信息,则可以减少投资者的信息不对称,降低投资风险,若不包含新的信息也可以反应出散户对于整个市场的情绪。因此,股票论坛发帖活动与股票市场收益之间的信息传递关系应该受到重视。

与此同时,在现有的金融市场中,因交易和非交易时段的划分带来了不同时段内信息结构的差异,已有学者对其加以区分。Oldfield and Rogalski(1980)最早在研究中将隔夜数据与日内数据作为不同的数据过程处理。Tsiakas(2008)研究表明交易时段和非交易时段积累的信息对股票市场有着不同的拟合及预测能力。梁艳和徐元华(2011)分析了隔夜信息对上海、深圳及香港三地股市的影响及其对市场价格的预测能力。张一锋和常清(2011)分析了我国期货现货在非同步交易时段相互指引的动态关系。刘庆富和华仁海(2011)构建隔夜信息对日间交易的冲击模型,研究表明在股指期货市场与股票现货市场之间隔夜信息对日间波动具有显著的冲击效应。刘庆富和华仁海(2012)探索我国股指期货与股票现货市场的日内交易和非交易信息日内信息结构,研究发现隔夜信息对日间交易的影响更大。刘庆富和华仁海(2012)探索我国股指期货与股票现货市场的日内交易和非交易信息结构,研究发现隔夜信息对日间交易的影响更大。然而,上述研究共同存在的问题是采用股票市场收益作为信息的代理变量,这种方法在信息获取困难的情况下是合理的,但不可忽视的是其暗含的有效市场假设在现实中不能充分满足,因此需要在变量选取方面进行改进,本文借助于数据挖掘和文本分析可利用网络论坛信息进行研究。

本文将论坛信息划分为日内信息和隔夜信息,给出了日内交易时段和隔夜非交易时段下网络论坛信息量和股票市场收益之间的三种信息传递路径;实证研究了网络论坛发帖量与股票市场收益率之间的信息传递关系的存在性。此外,分析了网络论坛发帖量和股票市场收益率条件方差的时变相关系数,并在论坛发帖量客观信息代理变量的基础上,辅之以反映发帖人情绪倾向及意见差异的信息代理变量,得出了情绪倾向变量、意见差异变量与时变相关系数的相关关系。

文章结构安排如下:首先,剖析网络论坛和股票市场收益之间的信息传递路径,其次,构建关于网络论坛信息量与股票市场收益之间的波动溢出关系的BEKK-GARCH模型,检验上述关系的存在性。最后,分析网络论坛发帖量和股票市场收益率条件方差的时变相关系数,并分析情绪倾向和意见差异变量与波动溢出效应的关系。

二、 研究设计 (一) 网络论坛的信息结构划分及信息传递路径设计

以股票市场的日内交易时段和隔夜非交易时段为划分依据,将股票论坛信息分为日内信息和隔夜信息。本文重点关注股票市场收益和网络论坛信息量两者之间的信息传递路径,具体包括:日内交易时段的论坛信息量与当日股票市场收益之间的相互传递路径(A1)、隔夜非交易时段的论坛信息量向次日股票市场收益的传递路径(A2)、隔夜股票市场收益向次日论坛信息量的传递路径(A3)。图 1给出了网络论坛和股票市场的信息传递路径。

图 1 网络论坛信息结构及信息传递路径图 注:图 1中Layer1表示股票市场,Layer2表示网络论坛;实线箭头代表了从Layer1股票市场层出发的信息传递路径,虚线箭头代表了由Layer2网络论坛层出发的信息传递路径;深色区块为股票市场的非交易时段,浅色区块为日内交易时段。
(二) 模型建立

为了更加有效地描述网络论坛信息量与股票市场收益之间信息传递效应,本文采用多元GARCH模型。具体选取Engle and Kroner(1995)提出的BEKK-GARCH(1, 1) 模型,该模型具有能够保证协方差矩阵的正定性,模型参数数量少以及参数具有时变性的特点。以下将对模型中“网络论坛信息量”和“股票市场收益”这两个主要变量的选取、具体的BEKK-GARCH(1, 1) 模型构建过程进行说明。

设有网络论坛和股票市场收益率两个“市场”,两“市场”的关键指标分别为:论坛发帖量和市场收益率。其中,论坛发帖量是网络论坛信息量的代理变量,本文的具体做法是从每日发帖量中剔除论坛发帖量的基本影响因素,从而将得到的非预期发帖量作为论坛信息量的客观度量。同时,市场收益率指标则用于衡量股票市场收益。开盘对隔夜信息具有揭示效率(梁艳和徐元华,2011张一锋和常清,2011刘庆富和华仁海,2011王春峰等,2011),有别于采用收盘价的对数差分变换得到收益率的方式,本文将论坛日内发帖量信息对应于日内收益率,将论坛隔夜信息对应于隔夜收益率。日内收益率根据股票在当日开盘和收盘期间的收益得到,而隔夜收益率根据当日开盘和前一交易日收盘期间的收益得到,体现了股票在交易时段和非交易时段内的市场交易活动。本文的二元BEKK-GARCH(1, 1) 设定如下:

$\left\{ {\begin{array}{*{20}{l}} {{R_{1,t}} = {\mu _{1,t}} + {\varepsilon _{1,t}}}\\ {{M_{2,t}} = {\mu _{2,t}} + {\varepsilon _{2,t}}} \end{array}} \right.$ (1)
${H_t} = C{C^T} + A{\varepsilon _{t - 1}}\varepsilon _{t - 1}^T{A^T} + B{H_{t - 1}}{B^T}$ (2)

公式(1) 为均值方程,分别刻画了上证综指收益率与网络论坛发帖量的均值形式。其中,R1, t表示t时期上证综指收益率,M2, t表示t时期网络论坛发帖量,μ1, t表示R1, t的条件期望,μ2, t表示M2, t的条件期望。残差项εt在t-1时期的信息集Ωt-1下满足εtt-1~(0, Ht)。针对本文的研究而言,采用公式(1) 形式的均值方程优点在于:其经济意义适合本研究的需要。因为ε1, t表示经过市场平均收益率调整后得到的市场超额收益率,超额收益率可以更好地反映信息冲击对股票市场交易活动的影响,ε2, t表示经过日平均发帖量调整后得到的非预期发帖量,非预期发帖量可以代表新信息的到达。

公式(2) 为条件方差方程的矩阵形式,其中,C为下三角常数矩阵,Ht为2×2对称矩阵,表示条件残差在t时期的方差协方差矩阵,系数矩阵A是2×2矩阵,衡量ARCH效应,即前期残差εt-1对当期条件方差Ht的影响,B是2×2矩阵,衡量GARCH效应,即前期条件方差Ht-1对当期条件方差Ht的影响。公式(3) 是条件方差方程的具体展开式。

$\begin{array}{l} {h_{11,t}} = {c^2}_{11} + {\alpha ^2}_{11}\varepsilon _{1,t - 1}^2 + 2{\alpha _{11}}{\alpha _{12}}{\varepsilon _{1,t - 1}}{\varepsilon _{2,t - 1}} + {\alpha ^2}_{12}\varepsilon _{2,t - 1}^2\\ + {\beta ^2}_{11}{h_{11,t - 1}} + 2{\beta _{11}}{\beta _{12}}{h_{12,t - 1}} + {\beta ^2}_{12}{h_{22,t - 1}}\\ {h_{22,t}} = {c^2}_{22} + {\alpha ^2}_{21}\varepsilon _{1,t - 1}^2 + 2{\alpha _{21}}{\alpha _{22}}{\varepsilon _{1,t - 1}}{\varepsilon _{2,t - 1}} + {\alpha ^2}_{22}\varepsilon _{2,t - 1}^2\\ + {\beta ^2}_{21}{h_{11,t - 1}} + 2{\beta _{21}}{\beta _{22}}{h_{12,t - 1}} + {\beta ^2}_{22}{h_{22,t - 1}}\\ {h_{12,t}} = {c_{11}}{c_{21}} + {\alpha _{11}}{\alpha _{12}}\varepsilon _{1,t - 1}^2 + {\alpha _{12}}{\alpha _{21}} + {\alpha _{11}}{\alpha _{22}}{\varepsilon _{1,t - 1}}{\varepsilon _{2,t - 1}} + {\alpha _{21}}{\alpha _{22}}\varepsilon _{2,t - 1}^2\\ + {\beta _{11}}{\beta _{12}}{h_{11,t - 1}} + {\beta _{12}}{\beta _{21}} + {\beta _{11}}{\beta _{22}}{h_{12,t - 1}} + {\beta _{21}}{\beta _{22}}{h_{22,t - 1}} \end{array}$ (3)

公式(3) 中的h11, t表示市场收益率的条件方差,h22, t表示网络论坛发帖量的条件方差,h12, t表示市场收益率与网络论坛发帖量之间的条件协方差。α12表示t-1时期的网络论坛发帖量冲击ε2, t-1对t时期市场收益率条件方差h11, t的短期影响,β12表示t-1时期的网络论坛发帖量的条件方差h22, t-1对t时期市场收益率条件方差h11, t的长期影响;α21表示t-1时期的市场收益率的冲击ε1, t-1对t时期网络论坛发帖量的条件方差h22, t的短期影响,β21表示t-1时期的市场收益率的条件方差h11, t-1对t时期网络论坛发帖量的条件方差h22, t的长期影响。由公式(3) 可知,若α12=0,β12=0,则h11, t=c112+α112ε1, t-12+β112h11, t-1,市场收益率的条件方差仅受其自身t-1时期残差和条件方差的影响,不存在论坛发帖量向市场收益率的波动溢出效应;若α21=0,β21=0,则h22, t=c222+α222ε2, t-12+β222h22, t-1,论坛发帖量的条件方差仅受其自身t-1时期残差和条件方差的影响,不存在市场收益率向论坛发帖量的波动溢出效应,而当α12=0,β12=0,α21=0,β21=0时,市场收益率和论坛发帖量之间不存在波动溢出效应。

依据网络论坛信息量和股票市场收益之间信息传递路径分析,所构建的模型要能够分别考察以下三种波动溢出关系:日内交易时段的论坛信息量与当日股票市场收益之间的相互波动溢出(A1)、隔夜非交易时段的论坛信息量向次日股票市场收益的波动溢出(A2)、隔夜市场收益向次日论坛信息量的波动溢出(A3),具体模型如下:

论坛日内发帖量与市场日内收益率的信息传递模型(M1),该模型用以检验t时期交易时段内论坛发帖量与股票市场收益率之间的相互的波动溢出关系,见公式(4):

$\left\{ {\begin{array}{*{20}{l}} {{M_{posd,t}} = {\mu _{posd,t}} + {\varepsilon _{posd,t}}}\\ {{R_{retd,t}} = {\mu _{retd,t}} + {\varepsilon _{retd,t}}}\\ {{H_t} = C{C^T} + A{\varepsilon _{t - 1}}\varepsilon _{t - 1}^T{A^T} + B{H_{t - 1}}{B^T}} \end{array}} \right.$ (4)

公式(4) 中Mposd, t表示论坛日内发帖量,Rretd, t表示上证综指日内收益率,εposd, tεretd, t分别为日内发帖量和日内收益率均值方程的残差项,且εposd, tt-1~(0, Hposd, t),εretd, tt-1~(0, Hretd, t)。

论坛隔夜发帖量与市场隔夜收益率的信息传递模型(M2),该模型用以检验t时期收盘至t+1时期开盘之间的论坛隔夜发帖量与t+1时期交易时段股票市场收益率之间的波动溢出关系,见公式(5):

$\left\{ {\begin{array}{*{20}{l}} {{M_{posn,t}} = {\mu _{posn,t}} + {\varepsilon _{posn,t}}}\\ {{R_{retd,t + 1}} = {\mu _{retd,t + 1}} + {\varepsilon _{retd,t + 1}}}\\ {{H_t} = C{C^T} + A{\varepsilon _{t - 1}}\varepsilon _{t - 1}^T{A^T} + B{H_{t - 1}}{B^T}} \end{array}} \right.$ (5)

公式(5) 中Mposn, t表示t时期论坛隔夜发帖量,Rretd, t表示t+1时期上证综指隔夜收益率,εposn, tεretd, t+1分别为均值方程的残差项,且εposn, tt-1~(0, Hposn, t),εretd, t+1t~(0, Hretd, t+1)。

市场隔夜收益率向论坛日内发帖量的信息传递模型(M3),该模型用以检验t时期收盘至t+1时期开盘之间的隔夜收益率与t时期交易时段论坛发帖量之间的波动溢出关系,见公式(6):

$\left\{ {\begin{array}{*{20}{l}} {{M_{posd,t + 1}} = {\mu _{posd,t + 1}} + {\varepsilon _{posd,t + 1}}}\\ {{R_{retn,t}} = {\mu _{retn,t}} + {\varepsilon _{retn,t}}}\\ {{H_t} = C{C^T} + A{\varepsilon _{t - 1}}\varepsilon _{t - 1}^T{A^T} + B{H_{t - 1}}{B^T}} \end{array}} \right.$ (6)

公式(6) 中Rretd, t表示t时期上证综指隔夜收益率,Mposd, t+1表示t+1时期论坛日内发帖量,εposd, tεretn, t分别为均值方程的残差项,且εposd, tt-1~(0, Hposd, t),εretn, tt-1~(0, Hretn, t)。

(三) 样本及变量 1. 样本选取

本文选取上证综指作为整体市场的代理变量,样本区间为2009年6月1日至2010年9月30日,共取得330个交易日样本。上证综指的交易数据来自于锐思金融数据库。本文选取新浪网的财经论坛“谈股论今”板块作为研究对象,新浪门户网站覆盖的用户群体相当较大,新浪财经论坛也是投资者关注的重要资讯来源之一,该板块可以作为论坛信息对市场表现的总体反应,这与本文关注论坛信息和股票市场收益之间整体波动溢出关系是一致的。网络论坛信息变量主要有两大类,客观论坛信息变量和主观信息变量。其中,论坛发帖量是论坛信息数量的直接反映,能够在一定程度上避免语意的模糊性,被用于作为论坛信息的代理变量。而论坛信息的内容也是论坛信息不可忽视的部分,论坛内容可能带有发帖人对市场交易表现的主观判断,因而信息的内容也会影响市场表现Tetlock(2007)。因此,本文选取日发帖量作为主要的信息代理变量,辅之以论坛发帖人情绪倾向和意见差异两个主观代理变量。其中,情绪倾向和意见差异变量的处理方法如下:首先,采用ICTCLAS汉语词法分析系统对论坛帖子内容进行分词处理,为了更好地体现金融词汇的特征以及提高分类的准确性,同时加入了涵盖2万多条金融领域的常用词汇的词汇库(梁循,2009),然后采用WEKA提供的SVM分类算法对论坛帖子内容进行分类,以获取每条帖子内容的情感,具体分为看涨、看跌、中性及无关,最后在此基础上定义主观代理变量。本文在选定的样本区间内共取得27552条帖子。数据处理采用S-Plus 8.0软件。

2. 论坛信息变量

本文采用发帖量作为帖量为每个交易日的9:30至15:00时段内的论坛发帖量,本文主要研究不同信息结构下的信论坛信息的客观度量,并且根据信息结构将其分解为日内发帖量和隔夜发帖量。其中,日内发息传递效应,而非进行高频数据的分析,而午休时段相对于隔夜非交易时段而言时间较短,同时也为与后文日内收益率收益的计算相一致,因此本文未对其进行单独划分;隔夜发帖量为每个交易日的收盘后至下一交易日开盘前论坛的发帖量,包括下午15:00至次日上午9:30的非交易时段内的论坛发帖量。论坛中第t个交易量的日内发帖量记做Mposd, t;论坛中第t个交易量的日内发帖量记做Mposn, t

考虑到帖子内容能够反映发帖人关于市场的态度和观点等信息,本文选取度量情感倾向和意见差异的两个主观论坛信息变量,$Bul{l_t} = \frac{{{M_{opt,t}} - {M_{pess,t}}}}{{{M_{opt,t}} + {M_{pess,t}}}}$。其中,Mopt, t为t时期论坛中具有看涨倾向的帖子数量,Mpess, t为t时期论坛中具有看跌倾向的帖子数量,Bullt为t时期论坛对股票市场看涨的指数,其取值范围在[-1, 1]之间,按照Antweiler and Frank(2004),得到经论坛中帖子总数量Mt调整后的情感倾向变量见公式(7):

$Sen{t_t} = Bul{l_t}ln(1 + {M_t}) = \left( {\frac{{{M_{opt,t}} - {M_{pess,t}}}}{{{M_{opt,t}} + {M_{pess,t}}}}} \right){\rm{ln}}(1 + {M_t})$ (7)

情感倾向变量值越趋近于1表示论坛发帖人对股票市场表现倾向于乐观态度。反之,值越趋近于-1表示论坛发帖人对股票市场表现倾向于悲观态度。该变量的绝对值越接近1表示发帖人的情感越强烈,反之,绝对值越接近0表示发帖人的情感越平淡。

通过对情感倾向变量Sentt取平方并计算偏离得到意见差异变量如公式(8) 所示:

$DI{S_t} = \left| {1 - {{(Bul{l_i})}^2}} \right| = \left| {1 - {{\left( {\frac{{{M_{opt,t}} - {M_{pess,t}}}}{{{M_{opt,t}} + {M_{pess,t}}}}} \right)}^2}} \right|$ (8)

意见差异变量的取值在[0, 1]之间,取值越接近于0,表明论坛发帖人对股票市场表现的情感倾向越一致;取值越接近1,表明论坛发帖人对股票市场表现的情感倾向分歧越大。

3. 市场收益率

股票在t时期的日内收益率为上证综指当日收盘价与当日开盘价计算得到的对数收益率,记做Rretd, t=log(Pclose, t/Popen, t)×100;股票在t时期的隔夜收益率为上证综指当日开盘价与前一交易日收盘价计算得到的对数收益率,记做Rretd, t=log(Popen, t/Pclose, t-1)×100,其中Pclose, tPopen, t分别为第t个交易日的收盘价和开盘价。

三、 实证结果与分析 (一) 基本统计描述

表 1为本文主要变量的描述性统计结果。从序列的统计特征看,上证综指的日内收益率和隔夜收益率序列的偏度值均小于0,表现为左偏。收益率序列的峰度值均大于正态分布下的峰度值3,且隔夜收益率的峰度值更大为8.548。Jarque-Bera统计量在1%的置信度下拒绝了收益率序列分布为正态分布的原假设。可见,上证综指收益率序列的分布显著异于正态分布,且存在“尖峰厚尾”特征。论坛发帖量序列的Jarque-Bera统计量表明其分布不同于正态分布,并且偏度值和峰度值表明序列存在右偏和尖峰特征。此外,ADF平稳性检验结果显示,上证综指收益率序列和论坛发帖量序列均通过单位根检验,说明序列是平稳序列。因而可以采用ARCH族模型进行建模分析。

表 1 基本统计描述

从本文的研究样本来看,网络论坛发帖主要有以下特点:论坛隔夜发帖量大于日内发帖量,论坛发帖在隔夜非交易时段内量大,这一方面与隔夜非交易时段较长有关,同时也可以反映出该时段论坛用户论坛发帖和讨论活跃。表外进一步的统计表明与市场相关但无明显倾向性的中性帖子占帖子的比重最大,中性帖子的均值为60.935,远大于看涨和看跌的帖子数,说明有相当一部分的论坛发帖内容并没有表示出明显的情感倾向;此外,除此之外具有看涨情绪的帖子要多于具有看跌情绪的帖子,看涨帖子的均值为7.405大于看跌帖子的均值5.987。

图 2 论坛日内发帖量与隔夜发帖量 注:左侧主坐标轴为论坛日内发帖量,右侧次坐标轴为论坛隔夜发帖量

图 2进一步补充了样本区间内网络论坛的日内发帖量和隔夜发帖量的情况。平均而言,隔夜发帖量大于日内发帖量,其中隔夜发帖量在0到500之间波动,日内发帖量在0到60之间波动。日内发帖量序列的波动比隔夜发帖量序列波动更大。

(二) 信息传递模型检验结果及分析 1. BEKK-GARCH(1, 1) 模型的系数检验

由BEKK-GARCH(1, 1) 模型得到如下检验结果。其中,表 2为论坛日内发帖量和日内上证综指收益率之间波动溢出关系的检验结果,表 3为论坛隔夜发帖量和日内上证综指收益率之间波动溢出关系的检验结果,表 4为上证综指隔夜收益率和论坛日内发帖量之间波动溢出关系的检验结果。

表 2 论坛日内发帖量与市场日内收益率的模型检验结果(M1)
表 3 论坛隔夜发帖量向日内收益率的模型检验结果(M2)
表 4 隔夜收益率向日内论坛发帖量的模型检验结果(M3)

表 2可知,论坛日内发帖量和日内收益率的条件方差均受到自身前期残差的显著影响,系数α11α22分别为0.664、0.209且均在5%的水平下显著。论坛日内发帖量和日内收益率具有波动持续性,其自身前期条件方差对当期条件方差的影响也是显著的,系数β11β22分别为0.733、0.956,且在5%的水平下显著为正。非对角元的系数α12在5%的水平下显著为负值-1.531,这表明短期内论坛日内发帖量的波动能够加快信息流动,减少信息的不对称,从而降低日内收益率的波动,而系数β12在5%的水平下显著为正,表明在长期来看论坛日内发帖量的波动增加了日内收益率的波动,即信息冲击加剧股票市场的交易活动。系数α21β21不显著,这表明日内收益率的波动对论坛日发帖量的变化影响不显著。模型拟合后的论坛日发帖量和日内收益率的Q2(12) 分别为0.815和6.290,p值近似为1.00和0.90,不能拒绝相关系数为零的原假设,两序列均不存在高阶自相关。同时,White异方差检验的TR2结果分别为0.812和5.855,p值分别近似为1.00和0.93,这表明序列不存在异方差。

表 2关于模型M1的检验结果表明,日内信息结构下,在论坛发帖量和市场收益率内部各自存在波动持续性,而在论坛发帖量和市场收益率两者之间,仅由论坛日内发帖量向日内市场收益率的信息传递效应较显著。

表 3可知,对角元系数α11α22分别为0.891、0.155且均在5%的水平下显著,这表明两序列的条件方差均受到自身前期残差的影响,与模型M1的结果一致。对角元系数β11β22分别为0.561、0.972,且在5%的水平下显著为正,这表明论坛隔夜发帖量和日内收益率均具有波动持续性。非对角元系数α12在5%的水平下显著为正,这表明论坛隔夜发帖量对日内收益率波动的短期影响较大。系数β12不显著,这表明论坛隔夜发帖量的变化对隔夜收益率的波动长期影响并不显著。系数α21不显著,系数β21虽然在5%的水平下显著,但其系数值接近于0,这表明日内收益率的波动对论坛隔夜发帖量的变化的影响很小。

表 3关于模型M2的检验结果表明,在论坛隔夜发帖量和日内市场收益率内部各自存在波动持续性,而在论坛隔夜发帖量和日内市场收益率之间,由论坛隔夜发帖量向日内市场收益率的信息传递效应显著。

表 4可知,论坛日内发帖量和隔夜收益率的条件方差均受到自身前期残差的显著影响,系数α11α22分别为0.598、0.568且均在5%的水平下显著。论坛日内发帖量和隔夜收益率具有波动持续性,其自身前期条件方差对当期条件方差的影响也是显著的,系数β11β22分别为0.778和0.436,且在5%的水平下显著为正。系数α12β12不显著,表明论坛日内发帖量对隔夜收益率的波动影响不显著。非对角元的系数α21在5%的水平下显著为负值-0.0013,表明短期内隔夜收益率对论坛日内发帖量有反向作用,系数β21不显著说明长期来看隔夜收益率对论坛日内发帖量的波动没有显著影响。

表 4关于模型M3的检验结果表明,在隔夜收益率和论坛日内发帖量内部各自存在波动持续性,而在论坛发帖量和市场收益率之间,仅由隔夜收益率向论坛日内发帖量的信息传递效应较显著。

2. 波动溢出效应存在性的Wald检验

在检验了基于BEKK-GARCH(1, 1) 的信息传递模型的系数显著性的基础上,本文继续采用Wald检验来验证网络论坛发帖量和上证综指收益率之间波动溢出效应的存在性。检验的基本思想是,若网络论坛发帖量和上证综指收益率之间不存在信息传递效应,则网络论坛发帖量和上证综指收益率各自的条件方差仅受到自身过去ARCH项和GARCH项的影响,而没有来自对方的交叉影响。在检验两者之间不存在相互的波动溢出效应时,考虑到对公式(3) 中h12, t系数施加限制的同时也就给h11, th22, t系数施加了一定的限制,本文仅针对矩阵元素进行检验,而不是针对矩阵元素的线性组合进行检验。Wald检验的原假设和检验结果如表 5所示。

表 5 波动溢出效应的Wald检验结果

由模型系数检验和波动溢出存在性的检验结果可知:论坛日内发帖量与日内收益率之间存在相互的波动溢出效应(M1的假设1),且仅由论坛日内发帖量向日内收益率的单向波动溢出效应显著(M1的假设3);论坛隔夜发帖量与日内收益率之间存在波动溢出(M2的假设1),且仅由论坛隔夜发帖量向日内收益率的单向波动溢出显著;不能得出论坛日内发帖量与隔夜收益率之间存在相互的波动溢出(M3的假设1),仅存在隔夜收益率向次日论坛发帖量的波动溢出。

(三) 网络论坛发帖量和股票市场收益率条件方差的时变相关系数

由BEKK-GARCH(1, 1) 模型的估计结果可以得出条件方差的时变相关系数,该系数刻画了论坛发帖量的条件方差和市场收益率的条件方差之间的相关性,表 6对本文所构建的三种信息传递模型中的时变相关系数进行了描述性统计。

表 6 模型时变相关系数的描述性统计

表 6可知,论坛日内发帖量与日内收益率(M1) 的时变相关系数的最大值为0.318,最小值为-0.348,均值为0.002,标准差为0.118。论坛隔夜发帖量与日内收益率(M2) 的时变相关系数的最大值为0.358,最小值为-0.476,均值为-0.020,标准差为0.139。隔夜收益率与次日论坛发帖量(M3) 的时变相关系数的最大值为0.550,最小值为-0.741,均值为-0.103,标准差为0.207。从均值来看,论坛发帖量的条件方差和收益率的条件方差之间的时变相关系数在M1中为正值,表示论坛日内发帖量与日内市场收益率的条件方差呈正相关关系;时变相关系数在M2和M3中为负值,分别表示论坛隔夜发帖量与日内市场收益率的条件方差负相关,隔夜收益率与论坛日内发帖量的条件方差负相关。这说明论坛信息是有价值的而非仅仅是噪声,股票市场能够实时快速对日内的论坛信息进行反应,体现在股票价格和收益率的变动上,同时市场也有较长的时间来消化、吸收以及处理隔夜的论坛信息。从标准差来看,时变相关系数的标准差在M3中最大,其次是M2,而在M1中最为稳定,由图 3论坛发帖量和收益率条件方差的时变相关系数图也可以看出。

图 3 论坛发帖量和收益率的条件方差之间的时变相关系数 注:图 3为论坛发帖量和收益率条件方差的时变相关系数,顶部为论坛日内发帖量与隔夜收益率条件方差的时变相关系数的曲线(M3),中间部分为论坛隔夜发帖量与日内收益率条件方差的时变相关系数的曲线(M2),底部为论坛日内发帖量与日内收益率条件方差的时变相关系数的曲线(M1)。

此外,本文分析了主观论坛信息代理变量与网络论坛发帖量和股票市场收益率之间信息传递关系的相关性,采用的是非参数Spearman检验,该检验对原始变量的分布不作要求,具有适用范围广的特点。具体方法是分别计算前文构造的发帖人情绪倾向和意见差异两个主观信息代理变量与条件方差的时变相关系数的Spearman相关系数,如表 7所示。

表 7 主观论坛信息代理变量与时变相关系数的相关性

表 7可知,情绪倾向变量与时变相关系数正相关,而意见差异变量与时变相关系数负相关,且上述作用对论坛日内发帖量和日内收益率之间的信息传递效应影响最小(M1),而对论坛隔夜发帖量与日内收益率之间的信息传递效应影响最大(M2)。含义如下:一方面,情绪倾向变量与时变相关系数正相关,这表明乐观态度的发帖会增强论坛发帖量与市场收益率之间的信息传递效应,而悲观态度的发帖则会降低论坛发帖量与市场收益率之间的信息传递效应。表 7中M2的时变相关系数与情绪倾向变量相关性最大,现以M2为例进行解释。平均而言,论坛隔夜发帖量与日内收益率条件方差的时变相关系数为负,即论坛隔夜发帖量的波动越大,次日日内收益率的波动越小。上述波动关系在乐观态度下更强的原因是:隔夜发帖量的较大波动代表了大量信息的到来,乐观态度下投资者更可能有主动性会对其中传递的信息积极进行分析解读、处理和吸收,从而在次日交易中表现出相对稳定的投资行为,市场收益率波动相对较小。而悲观的态度下,投资者可能较为盲目和恐慌,不能有效分析解读并吸收处理隔夜大量信息,无法形成理智的预期和判断,从而表现为次日市场收益率的较大波动。另一方面,意见差异变量与时变相关系数负相关,这表明发帖人的意见差异能够降低论坛发帖量与市场收益率之间的信息传递效应,而发帖人对市场表现的看法一致性,则会增强论坛发帖量与市场收益率之间的信息传递效应。同样,以表 7中意见差异变量与时变相关系数之间相关性最大的M2为例进行解释。平均而言,论坛隔夜发帖量的波动越大,次日日内收益率的波动越小。较大的意见差异能够减弱上述波动关系原因是:若发帖人意见差异大,则其对于隔夜到达的信息的处理越不一致,越不容易形成对于次日股票市场表现的一致预期,次日的股票市场的投资行为和交易活动则受到发帖人各自看法的影响,从而表现为市场收益率波动大。而在发帖人意见差异较为一致的情况下,尽管隔夜非交易时段有大量的信息到达,发帖人对于信息的解读和理解更为一致,信息被充分的吸收的长度差异小,从而在次日股票市场交易中表现出相对一致的投资行为,市场收益率波动相对较小。

四、 结论

本文从信息结构视角出发对网络论坛信息量和股票市场收益率之间的信息传递关系进行了研究。主要分析了网络论坛信息的信息结构,构建了网络论坛和股票市场之间的信息传递路径三种信息传递路径及相应的BEKK-GARCH的信息传递模型,具体包括日内交易时段的论坛信息量与当日股票市场收益之间的相互信息传递、隔夜非交易时段的论坛信息量向次日股票市场收益的信息传递以及隔夜市场收益向次日论坛信息量的信息传递。本文通过实证检验得出以下结论:

(1) 在网络论坛信息量和股票市场收益率之间存在信息传递关系。由论坛日内发帖量向日内收益率、由论坛隔夜发帖量向次日的日内收益率的单向波动溢出效应更加显著;而在隔夜收益率和论坛日内发帖量之间仅存在隔夜收益率向论坛日内发帖量的单向波动溢出效应。

(2) 网络论坛发帖量和股票市场收益率条件方差的时变相关系数分析得出,日内论坛发帖量的波动能够影响日内市场收益率的波动,股票市场能够实时快速对日内的论坛信息进行反应,进而体现在股票价格和收益率的变动上,同时市场也能够消化、吸收以及处理隔夜的论坛信息对收益率的冲击。

(3) 情绪倾向变量与意见差异变量的检验表明,持有乐观态度的发帖会增强论坛发帖量与市场收益率之间的信息传递效应,而持有悲观态度的发帖则会降低论坛发帖量与市场收益率之间的信息传递效应。此外,发帖人的意见差异能够降低论坛发帖量与市场收益率之间的信息传递效应,而发帖人对市场表现的看法一致性,则会增强论坛发帖量与市场收益率之间的信息传递效应。

本文旨在从整体上考察网络论坛信息量与股票市场收益率之间信息传递关系,今后可以扩大样本的容量,在数据频率上采用高频数据开展进一步研究,并可以考虑不同形式的波动溢出模型刻画论坛信息量和市场收益率之间的作用关系、深入挖掘乐观和悲观两类不同情绪倾向对信息传递效应的不对称作用等。

参考文献
[] Antoniou A., Holmes P., 1995, "Futures trading, information and spot price volatility: evidence for the FTSE-100 stock index futures contract using GARCH,". Journal of Banking & Finance, 19(1), 117–129.
[] Antweiler W., F. M., 2004, "Is All That Talk Just Noise? The Information Content of Internet Stock Message Boards,". The Journal of Finance, 59(3), 1259–1294. DOI:10.1111/j.1540-6261.2004.00662.x
[] Drimbetas E, Sariannidis N and Porfiris N., 2007, "The effect of derivatives trading on volatility of the underlying asset: evidence from the Greek stock market,". Applied financial economics, 17(2), 139–148. DOI:10.1080/09603100500461702
[] Engle R.F., K , 1995, "Multivariate simultaneous generalized ARCH,". Econometric Theory, 11(1), 122–150. DOI:10.1017/S0266466600009063
[] Karolyi G.A., 1995, "A multivariate GARCH model of international transmissions of stock returns and volatility: the case of the United States and Canada,". Journal of business & economic statistics, 13(1), 11–25.
[] Oldfield G S, R J , 1980, "A Theory of Common Stock Returns Over Trading and Non-Trading Periods,". The Journal of Finance,, 35(3), 729–751. DOI:10.1111/j.1540-6261.1980.tb03495.x
[] Susmel R., Engle R F., 1994, "Hourly volatility spillovers between international equity markets,". Journal of International Money and Finance, 13(1), 3–25. DOI:10.1016/0261-5606(94)90021-3
[] Tetlock P.C., 2007, "Giving Content to Investor Sentiment: The Role of Media in the Stock Market,". The Journal of Finance, 62(3), 1139–1168. DOI:10.1111/j.1540-6261.2007.01232.x
[] Tsiakas I., 2008, "Overnight information and stochastic volatility: a study of European and US stock exchanges,". Journal of banking & finance, 32(2), 251–268.
[] Tumarkin R., Whitelaw R.F, 2001, "News or Noise? Internet Postings and Stock Prices,". Financial Analysts Journal, 57(3), 41–51. DOI:10.2469/faj.v57.n3.2449
[] Wysocki, P. D. ,1998, “Cheap Talk on the Web: The Determinants of Postings on Stock Message Boards,” University of Michigan Business School Working Paper, No. 98025.
[] 董大勇、肖作平, 2011, 《交易市场与网络论坛间存在信息传递吗?》, 《管理评论》, 第 11 期, 第 3–11 页。
[] 华仁海、张朋, 2012, 《我国股指期货的推出对股票现货市场波动的影响研究—基于Markov-Switching-GARCH模型》, 《南方经济》, 第 10 期, 第 115–122 页。
[] 梁循, 2009, 《互联网金融信息智能挖掘基础》. 北京: 北京大学出版社, 第 31-40 页.
[] 梁艳、徐元华, 2011, 《基于不对称SV模型的隔夜信息对股市影响研究》, 《大连理工大学学报(社会科学版)》, 第 3 期, 第 34–38 页。
[] 刘庆富、华仁海, 2011, 《中国股指期货与股票现货市场之间的风险传递效应研究》, 《统计研究》, 第 11 期, 第 84–90 页。
[] 刘庆富、华仁海, 2012, 《中国股指期货与股票现货市场的日内信息结构研究——基于交易和非交易时段的视角》, 《复旦学报(社会科学版),》, 第 3 期, 第 10–19 页。
[] 王春峰、张颖洁、房振明, 2011, 《开盘对隔夜信息的揭示效率——基于A股和H股的实证研究》, 《北京理工大学学报(社会科学版)》, 第 2 期, 第 43–48 页。
[] 吴吉林、操君, 2011, 《中国A、B、H股间市场一体化进程研究——基于SKEWED-T-GJR-COPULA方法的实证检验》, 《南方经济》, 第 5 期, 第 43–53 页。
[] 夏天, 2008, 《国内外股指期货与股票指数之间的关联性研究——基于日经225指数期现货市场的实证分析》, 《南方经济》, 第 4 期, 第 66–74 页。
[] 张一锋、常清, 2011, 《非同步交易时段我国股指期现货动态关系分析》, 《价格理论与实践》, 第 7 期, 第 65–66 页。