YAN Fei, Department of Sociology, Tsinghua University; The Walter H. Shorenstein Asia-Pacific Research Center, Stanford University
舆情如何导致一定的经济、社会或政治后果,是新闻传播学与社会学、经济学、政治学的交叉领域。互联网,尤其是Web 2.0的快速发展,进一步提升了舆情传播对经济社会过程的影响能力。尤其是微博、微信等新网络平台的出现,使得虚拟空间中的信息传播具备了对真实世界更为快速和深刻的渗透力。从社会学的角度看,微博等新网络媒体平台实际上已经成为观察当代社会微观层次的个人决策何以一跃成为宏观层次社会现象的重要途径,为社会科学理论化的跨层次研究提供了重要工具 (Coleman,1986)。
在经济生活中,股市行情的深刻变化影响着人们的日常生活,而网络舆情对股票市场的影响也日益凸显。不仅投资者在各式各样的股票论坛和包括微博在内的网络平台上通过日常的交流讨论进行投资判断,上市公司也越来越多地利用网络平台在第一时间发布公司信息,帮助决策者进行投资判断。这种发展变化促使我们去思考:网络舆情如何影响股市行情,并且这种影响又如何在社会学层面上得到解释。另一方面,由于中国股市中机构在投资者中所占比例较小,且市场信息披露机制和监管手段不够完善,因此,投资者之间信息不对称现象比较严重 (赵涛、郑祖玄,2002)。这进一步使大量股市投资者,尤其是散户既依赖正式渠道的企业信息披露 (曾颖、陆正非,2006),也更容易被非正式渠道的网络信息影响。
在本文中,我们旨在分析以微博为载体的网络舆情对股市行情的影响。海外的相关研究表明,在和微博类似的推特 (Twitter) 平台中,用户在投资领域的集体情绪倾向和美国“道琼斯指数”的总体涨跌高度相关 (Bollen et al., 2011)。国内的相关研究也在金融和传播等不同领域取得重要进展。不过,囿于数据,现有的国内研究或将视野集中于某个 (些) 股票的个体行情 (史青春、徐露莹,2014;张栋凯、齐佳音,2015),或仅仅分析采集自某个财经网站及论坛的局部舆情 (金雪军等,2013;易洪波等,2015)。而本文试图从微博总体舆情和股市总体行情的宏观层次把握传播与经济现象的关联。
我们强调,和领域专业、受众较少且异质性低的单个财经网站或论坛不同,微博平台具有前者远远不及的开放、实时、影响面广、使用者异质性强的重要特征 (谢耘耕、荣婷,2011)。正是这种人人都是自媒体的碎片化特征使微博中的股市信息代表了足够“大”的样本,代表了海量股民的心态、观念和决策信息,也因此,微博舆情更适合作为全社会心态的间接测度。而微博中带有明确利空和利好导向的热议,从逻辑角度更可能对真实的股市走势产生影响。而某个网站或论坛中所反映的投资舆情或讨论偏好,即便在统计上存在与股市行情的关联,在因果机制上也较难作为舆情影响行情的真正案例。因此,在前人研究的基础上,我们把网络舆情的载体从单个的网站或论坛拓展到可以代表社会舆情的微博空间,把分析视野从股票个体行情、局部行情,拓展到股市全局。
我们将使用新浪微博这一国内规模最大、最具代表性的微博平台作为舆情数据来源。利用具有“利好”和“利空”不同含义信号的股市术语,我们构建股市每日“微博信心指数”,并将其与每日“上证指数”进行时间序列分析。我们使用了基于“Toda-Yamamoto”过程的“格兰杰因果检验”和基于“自回归分布滞后模型”(Autoregressive Distributed Lag,ARDL)“边限检验的协整分析”(Bounds Test using Autoregressive Distributed Lag Model),以观察微博舆情是否真正影响股市行情。考虑到舆情影响决策过程的复杂性,我们分别对股市“震荡期”和“平稳期”进行分段考察。本文是利用大数据对虚拟空间舆情影响真实世界经济社会结果的实证分析,有助于我们从宏观层次上进一步理解传播对于经济社会过程的重要影响。
一、 文献回顾 (一) 网络舆情影响股市的实证文献随着信息技术的不断发展,网络信息的扩散模式以及投资者在网络社交媒体上的互动行为都愈发对股票市场的波动产生影响。1一般而言,人们在做出决策前都会预设一个参考标准,然后衡量每个決定的结果与这个参考标准的差别有多大,如果预期与标准状态的差距越大,人们就越倾向于做出正向的决策。在投资领域,当投资者对于市场的期待认知越高,就越可能选择忽略负面消息或对正面消息产生过度反应,导致股价被高估,市场成交活跃;当投资者对于市场的期待认知越低,就可能选择忽略正面消息或对负面消息产生过度反应,导致股价被低估,市场成交低迷 (De Long et al., 1990;Fisher and Statman, 2000;Brown and Cliff, 2005)。也就是说,投资者情绪可以影响个股的波动率。即当利空发生时,投资者情绪低迷会导致股票市场波动率减小;而利好发生时,投资者情绪高涨就会导致股票波动率增大。
1. 除了推特等网络平台之外,研究者还关注了网络搜索行为的金融意义。例如,通过测量在谷歌中针对标准普尔500指数 (S & P 500) 中所列出的企业名录进行关键词搜索,研究者发现,搜索强度可以有效预测股票市场短期收益率、短期交易量及累积收益率 (Joseph,Wintoki and Zhang, 2011)。国内学者的研究也发现,网络搜索与股市间存在重要关联,投资者网络搜索行为会对股票的资产定价产生影响 (张谊浩等,2014)。
在国际研究中,卫索基 (Wysocki,1999) 对雅虎财经论坛帖子提及数量最多的50家公司进行分析后发现,帖子数量的确能预测次日股票的交易量和超额收益。特玛钦和魏特劳 (Tumarkin and Whitelaw, 2001) 分析了怒牛 (Raging Bull) 股票论坛中异常发帖量和内容倾向变化与股市异常交易量、异常收益的统计关联。安特卫勒和弗兰克 (Antweiler and Frank, 2004) 从雅虎财经论坛帖子中生成看多、持平及看空的投资者情绪指数,发现其对“道琼斯指数”波动具有预测能力。戴斯和陈 (Das and Chen, 2007) 利用语义分析方法从一个股票论坛中提取出中小投资者的意见以生成投资者情绪指标,并发现这一指标与股市行情存在关联。除了论坛,网站新闻也具有对股市行情的影响。例如,梁勋 (音)(Liang,2005) 发现,雅虎、怒牛和精财 (Smartmoney) 等三家财经网站上股票新闻内容和数量与相关股票的收益率、价格波动和交易量均存在关联。
在国内研究中,周翠玲、邹高峰 (2013)针对新浪财经股票论坛的帖子内容构建投资者乐观情绪和意见分歧指数,发现这些指标对IPO抑价及交易量有显著影响。另外三组针对同一个股票专业论坛——东方财富网股吧——的实证研究则证实,投资者在专业论坛的帖子对于股市和股票有众多影响。其中,林振兴 (2011)发现,投资者对一个股票的关注度与其IPO抑价显著正相关,并且与上市首日换手率也显著正相关;而金雪军等 (2013)发现,论坛发帖量对股票的市场成交量和相关股票收益率有显著的正向影响,投资者在论坛讨论中所表现出的看涨情绪对第二日的股市收益率具有预测作用;易洪波等 (2015)进一步发现,投资者多空双方的情绪对交易市场成交量和收益率存在非对称影响,投资者空方情绪比多方情绪对市场成交量的影响明显;孔翔宇等 (2016)利用数据挖掘技术,发现新闻中的国际贸易以及城市化相关主题与股市变动关系密切。
不过,以上这些研究大多针对某个或几个网站,特别是针对专业论坛进行。而新近的国际金融研究开始把分析对象从单一的网站和论坛转到代表更为广泛舆情的类似微博的自媒体平台。针对推特的研究表明,推特用户在投资领域对某个股票的集体情绪倾向指标可以预测该股票的收益率 (Sprenger et al., 2013;Bartov et al., 2015),而且这种关系对于小股票或小公司更为明显。此外,国外相关研究开始从宏观层面对推特情绪与股市总体行情进行关联。研究发现,推特中的集体情绪倾向指标可以预测第二日美国“道琼斯指数”的涨跌,预测准确率达到87.6%(Bollen et al., 2011)。此外,推特情绪还和股市成交量波动密切相关 (Zhang et al., 2011)。更重要的是,推特中前一两天的26个财经词汇出现词频和后市美国股市总体收益率显著相关 (Mao et al., 2011)。这意味着,推特中的舆情,特别是术语热词,对股市行情所有影响。
现在,国内研究也开始对微博舆情与股市行情的关联有所关注。例如,张栋凯、齐佳音 (2015)分析了味千 (中国)“骨汤门”事件中微博舆情对该股票的负面冲击。不过,现有的研究既少且仅仅关注某支股票的个体行情,未能展示代表社会舆情的微博与股市总体走势的宏观层次关联。
我们强调的是,和领域专业、受众较少且用户同质性单一的单个网站或BBS论坛不同,微博社交平台具有前者远远不及的开放、实时、影响面广、使用者异质性强等重要特征,因此,微博舆情更适合作为全社会心态的间接测度。微博中带有明确利空和利好导向的股市热议,从逻辑角度更可能对真实的股市走势产生影响。此外,恰恰因为微博在一定程度上能对社会总体舆情有所代表,因此,用微博舆情和股市总体走势进行关联是值得重点关注的研究领域。
(二) 股市术语与舆情信号现有文献对舆论的看涨或看跌情绪主要是通过帖子的字面含义来界定并计算,可利用人工判断或辅助以计算机学习的方式来进行 (金雪军等,2013)。本文主要利用微博中股市术语的市场信号来构建社会舆情指数。股市术语指的是股票市场的专有名词。无论是微博还是其他媒体,凡是和股市有关的讨论,都必然大量使用这些术语。重要的是,不少股市术语本身带有明显的行情判断信号。我们认为,对于在微博上被海量热议和大量提及的股市术语,用词频统计的方法可以构建整个微博中关于股市走势的总体判断。
一个显而易见的问题在于,某个词汇带有明显利好和利空信号,并不意味着这个词汇所在的语句和帖子本身具有完全相同的信号。例如,“现在可以建仓”和“现在不能建仓”,虽然都使用“建仓”这个关键词,但含义显然完全相反。因此,词频似乎不能代表舆情的指向。此外,即便是用人工解读来取代词频统计似乎也不能解决这个问题。由于互联网的匿名性和虚假信息惩戒机制的缺乏,理论上人们无法可靠地判断发布者本身是否带有其他目的。例如,试图出售手头股票的发布者,可能会散布虚假的利好信息,也因此同样一则消息会有截然相反的市场预期解读。因此,字面含义明确的关键词,其在宏观层次上的统计量 (例如,词频加总) 是否仍然能构成表达同样信号的指标?
根据微博传播的特点,我们提出分析层次、语法结构、测量方法和文献证据等四个方面的理由。这些理由使我们可以利用被海量热议且信号明确的股市术语词频构建舆情信心的指标。
第一,分析层次方面。被大量热议的术语,本身就能够直接体现舆情对市场的基本判断和共识。例如,“股灾”一词,当置于单个句子的微观层次中时,我们无法判断其代表的信号方向。但如果“股灾”被大量讨论,在宏观层次上就映射股市已经出现持续下跌。换句话说,即便是在大家纷纷争论2015年6月份的股市动荡是不是“股灾”时,不管是支持者还是不支持者,其对行情的判断仍然具有基本的共识:起码此时股市处于下跌的走势。同样,“建仓”一词的反复出现和海量热议意味着市场已经不再最高点。实际上,在推特中,学者发现推特语句的含义可以用关键词直接代替 (Yang et al., 2012)。
第二,语法结构方面。互联网,特别是微博的文本,往往在语法上具有直接和明晰的特点。这一特点主要来自微博对文字长度的限制和移动互联网设备的普及。换句话说,发微博有文字限制,在移动设备上输入文字又不方便,这导致人们在微博上表达一个意思的时候,更倾向于使用直接句式,而不是否定句式。为支撑这一推测,我们专门对本文所使用的微博股市术语做了分析。例如,我们发现,以“抄底”为例,“不抄底”“不能抄底”“不要抄底”占“抄底”总词频总数的比例不到10%。其他的重要术语也都存在这一特征。这意味着,大量的“抄底”热议就是人们积极进场的信号。
第三,测量方法方面。即便无法完全证明具有看涨信号的术语词频代表真实的看涨信心,我们仍然可以通过数学方法来尽量解决这一问题。最直接的方式就是在量纲统一的情况下,把看涨术语总词频指数和看跌术语总词频指数相减或相除。如果人们对看涨和看跌两类词汇的否定式与肯定式使用比例是大致相当的,那么就可以通过计算差或商的形式得到可以回避否定式表达的信心指数。基于这样一个工作假设,我们可以获得对舆情信心的测量并用于探索性分析。
第四,文献证据方面。近年来,不少金融和传播学实证研究已经证明,基于词汇字面直接含义所构建的舆情信号指标和真实的股市涨跌有正向关联。例如,在对谷歌检索的研究中,对“萧条”“破产”等词汇的网络检索和后市看空显著相关 (Da et al., 2010);对“债务”一词的网络检索和相关股票行情有重要关联,甚至可以用来预测后市 (Preis et al., 2013)。在对推特的研究中,研究者发现情绪关键词的词频和其字面所代表的社会情绪等高度相关 (Kim et al., 2013),人们常用语和各自在网络社区的层次身份高度相关 (Bryden et al., 2013)。在中国股市研究中,来自和讯网、新浪网等包含“债务”字样的新闻报道会从负面影响相关股票的行情 (Zhao et al., 2011)。这些研究结果均表明,单个或一系列带有明确市场信号的股市术语,其词频在宏观层次上和代表其字面含义的经济社会结果存在正向统计关联。
二、 研究假说通过微博传播的平台整合,原本分处不同地域、发布自不同时间、来自不同个体的海量股市信息,会实时、高速、多层次地在全社会流布。对微博所展示、传播和汇聚的大量碎片化消息和观点,个体参与者会进行基于真实性的解读和判断,完成社会学习的过程,同时还会加入信息发布行列。当从网络中获知的他人股票买卖行动或信息量达到一定的门槛时,个体参与者就会做出新的股票买卖决定。在这个过程中,由于股市个体对自身掌握信息不足的认识,会进一步凸显所谓的“投资者情绪”(investor sentiment):投资者情绪越高,个股行情就越高;投资者情绪波动越大,个股波动率就越高 (张丹、廖士光,2009;游家兴、吴静,2012;何平等,2014;刘维奇、闫汾娟,2014),从而使得网络舆情虽不至于风声鹤唳,但对个体的信念更新和决策仍能产生重要的影响。
基于相关理论和文献,我们认为,当某个股市术语被大量提及时,其字面含义本身就开始具备群体层次上的导向信号指向。基于信息影响行为的理论和微博的扩散机制,我们预判,微博中的股市术语的热议和汇聚 (以下简称“股市热词”),在互联网乃至全社会层面可以形成一种市场信心的信号。由此,我们就可以提出本文的核心假说:
H1:微博中股市热词的总体涨跌信号,可以有助于预测股市的后市行情。
H2:微博中股市热词的总体涨跌信号,与股市的后市行情之间存在稳定的正向关联。
从计量角度看,检验H1就相当于检验微博舆情是否构成股市行情的“格兰杰原因”(Granger Causality)。这个计量经济学术语并非指反事实框架下的因果机制,而是指在Y的模型中,如果加入的早前变量X (也即X的滞后值) 有助于解释Y,则认为变量X是引致变量Y的“格兰杰原因”。同时,检验H2则相当于检验微博舆情与股市行情之间是否存在正向的协整关系。所谓“协整”,就是两个时间序列之间的长期均衡关系。实际上,H1和H2具有递进关系。这是因为,在两个时间序列数据之间,只要存在协整关系,必然可以检测到“格兰杰因果关系”。
此外,我们进一步预测,在股市的剧烈震荡期和平稳期,舆情对于行情的影响可能存在较大差异。这主要是因为,基于“预期理论”(Kahneman and Tversky, 1979),人们总是规避风险、高估损失和低估收益。换句话说,在股市中,因为一笔增收得到的幸福程度要比同样损失带来的痛苦程度小。因此,越是剧烈起伏的市场,人们心理对损失越敏感,舆情对于人们的信心影响力就越大,进而对股市行情的影响力也就越大。这样,对H1假说和H2假说的检验,应该分别针对股市震荡期和平稳期来进行。
三、 数据和变量在经济学领域的股市实证研究中,月度数据、周数据和日数据都有被使用,但格伦哲和帕瑟伦 (Granger and Pesaran, 2000) 明确指出,逐日数据更合适分析资本市场变化,是进行单位根检验、协整检验更为适当的根据。因此,本文提取股市每日行情和微博每日舆情进行时间序列分析。
(一) 因变量:上证指数我们使用上海证券市场的每日开盘价和收盘价的均值作为日均指数 (以下简称“上证指数”) 来测量股市行情。图 1展示了2015年1月到7月上旬的“上证指数”走势 (深色为开盘价,浅色为收盘价)。在时间段方面,我们选取了2015年5月4日 (周一) 到7月13日 (周一) 之间的70日作为震荡期。此间,股市在5月中旬大幅下跌后反弹,在6月中下旬则连续暴跌,其中6月中下旬短短3周内沪指下跌近30%,跌幅创造了1992年以来之最,至7月上旬逐步回暖趋稳。从图形上也可看出,在这段时间内,“上证指数”的最高点和最低点差距超过1 500点。为进行股市平稳期的对照研究,我们另外选择了2015年1月5日 (周一) 到3月16日 (周一) 同样70天的时间段进行分析。在这一时间段中,股市波澜不惊,最高点和最低点仅仅相差约500点。
新浪微博是一个由新浪网推出并提供微博客的信息分享、传播和获取信息的平台。用户可以通过网页、WAP页面、外部程序和手机短信、彩信等发布140个汉字 (280字符) 以内的信息,并可上传图片和链接视频,实现即时分享。根据新浪网官方的统计,截至2014年9月30日,新浪微博注册用户已超过5亿,日活跃用户数达到7 660万,用户每日发博量超过1亿条,目前占据了中国微博用户总量的57%和中国微博活动总量的87%,是中国大陆地区访问量最大的网站之一。2
2. 参见:2014年新浪微博用户发展报告 (http://data.weibo.com/report/reportDetail?id=215)。
新浪微博提供了用于检索社会关注和热议程度的“热词指数”,这样我们可以直接获得相关股市术语在微博中的词频数据。新浪搜集了约100万个入库热词。3入库与否对本研究具有重要意义,这是因为,与一般的股市术语相比,作为热词的股市术语对社会心态具有更广泛和更深刻的影响,更适合作为词频分析对象。这些热词的微指数代表了新浪微博中它们每日出现频率的指标。该指标在加权计算过程中考虑了每日微博总量和分布等特征。4
3. 参见:热词 (http://help.weibo.com/faq/q/1549/12689)。
4. 参见:热词指数 (http://help.weibo.com/faq/q/1549/12687)。
我们使用了新浪微博热词指数,而非简单直接的词频数,原因有三。第一,与跨界学习的社会学家自行获得词频数据相比,有技术团队支撑的大型平台提供的官方词频数据更为科学和可靠。更重要的是,新浪微博官方专业团队在计算过程中考虑了每日微博总量和时空分布等特征,进行了加权处理,这与个人在对这些信息难以充分掌握的情况下直接获取的词频相比更为可靠。第二,使用官方提供的词频等二手数据是国际、国内大数据分析文献广泛使用的方法 (如谷歌趋势、推特第三方词频工具等)。5第三,本文利用新浪大数据的目标是获取词频指标,而非统计精确的词频数本身。我们更无意把本文的研究结果作为一种准金融工具,因此不关心词频指数每上升一个点对股市能有几个点的精确拉动作用,而是关心这种统计关联是否存在。
5. 具体的实证分析参见相关研究 (Preis et al., 2013;Kim et al., 2013;Bryden et al., 2013;Curme et al., 2014;Da et al., 2015),直接关于数据的文献回顾和讨论参见另一部分相关研究 (Scheitle,2011;Mellon, 2013, 2014;Nuti et al., 2014)。
虽然新浪微博可能会因营销需要而将特定的关键词 (如明星名字、企业商标) 有意识地推广,甚至直接设为热词,热词数据就可能不准确。或者,商业水军的运作会使词频受到人为干扰。但我们所检索的关键词均为技术性的股市用语,而不是具体的哪只股票或哪个产品,并没有商业性导向,所以被新浪处于商业利益修改的概率极低。另一方面,水军的信息同样是市场信息,是舆情的一部分,会对社会产生影响,理所当然在我们的分析范围之内。没有任何分析上的必要进行这种筛选。
因此,笔者依据中国证券业协会《证券市场基础知识》、袁剑的《中国证券市场批判》等书籍,搜集到200多个股市术语。我们发现,其中有108个术语成为微博热词。在这108个热词中,77个为中性 (“股票”“股市”“证监会”等),而具有明确利空含义的有18个 (“股灾”“爆仓”“跌停”“暴跌”“停牌”“熊市”“空头”“利空”“割肉”“逼空”“抛售”“离场”“崩盘”“跳水”“打压”“洗盘”“阴跌”“套牢”),有明确利好含义的13个 (“救市”“抄底”“牛市”“涨停”“多头”“利多”“反弹”“回档”“增仓”“护盘”“开户”“改革牛”“慢牛”)。对于利空热词和利好热词,我们分别从新浪微博中获得股市震荡期、平稳期的全部每日热议指数。具体统计量描述参见表 1。
我们把这31个术语和“上证指数”(每日开盘价与收盘价均值) 的标准化值绘制在图 2中 (横轴单位为“天”)。通过去量纲,我们可以直接比较不同曲线的变化幅度。从图 2可以看出,无论是震荡期还是平稳期,热词的变化起伏都大于“上证指数”的变化起伏。尽管因为视觉效果,我们对热词曲线Z值已经取了前后4日 (共9天) 的滑动平均值,但微博热议的变化幅度仍远大于股市本身的变化幅度。这本身是体现了传播中的放大和波动效应,暗示舆情对股市可能所具有的重要影响力还是体现了股市对舆情的影响,需要我们在研究中进一步判明。
接下来,我们从这31个热词的词频时间序列中提取出一个潜在的“共性”信息,也即将31个变量通过线性变换的“降维”,筛选出最重要的成分——“微博信心指数”。我们使用经典的“主成分分析法”,分别对利好热词和利空热词各自生成总得分。我们利用特征值大于1的主成分 (检验结果表明利好热词和利空热词各有4个特征值大于1的成分) 和各自解释贡献率,计算出利好热词和利空热词的因子得分然后相减,这样就构造出基于股市热词的股市“微博信心指数”,计算公式如下:
$ Index = Score\;1 - Score\;2 = \frac{{\sum\limits_{j = 1}^m {{\beta _{1j}}{f_{1j}}} }}{{{P_{cum1}}}} - \frac{{\sum\limits_{j = 1}^m {{\beta _{2j}}{f_{2j}}} }}{{{P_{cum2}}}} $ |
其中,Score 1为利好因子得分,Score 2为利空因子得分,f为各主成分的预测因子值,β为其解释贡献率,m表示的是特征值大于1的因子数量,P是累积贡献率。6最后,我们在图 3中绘制了“微博股市信心指数”(粗灰实线)、“上证指数”(粗黑实线),以及热词利空得分和热词利好得分的时间序列 (横轴单位为“天”)。在相同的比例下,震荡期的“信心指数”和“上证指数”的总体趋势和波峰、波谷呼应似乎比平稳期更为明显。当然,要验证这一点我们必须进行时间序列分析。
6. 限于篇幅,相关特征值、累计贡献率和KMO、SMC检验统计量不再列出,感兴趣的读者可以向作者索取。
四、 模型和实证结果在进行时间序列分析之前,我们必须首先对“微博信心指数”和“上证指数”的平稳性进行“单位根”(unit root) 检验,以拟合相应的检验模型。在“单位根”检验中,我们使用“迪克—富勒检验”(DFGLS检验) 和“菲利普—帕芬检验”(PP检验) 两种方法,分别测试了带时间趋势和不带时间趋势的情况。我们发现,无论是在震荡期还是平稳期,“微博信心指数”都是平稳的时间序列,“上证指数”则是一阶单整的单位根时间序列 (检验结果可向作者索取)。“微博信心指数”为Ⅰ(0) 而“上证指数”为Ⅰ(1) 的检验结果意味着,我们的“格兰杰因果检验”不能采用传统Wald检验方法,协整分析也不能采用传统的协整向量自回归,也即“约翰森方法”(Johansen and Juselius, 1990)。
(一) 格兰杰因果关系检验模型对于“微博信心指数”W和“上证指数”S,我们建立向量自回归 (VAR) 模型:
$ {S_t} = {\alpha _t} + \sum\limits_{j = 1}^m {{\beta _j}{W_{t - j}}} + \sum\limits_{k = 1}^m {{\gamma _k}{S_{t - k}} + {\varepsilon _t}} $ |
检验的H0零假说为β1=β2=…=βn=0,也即W不是S的“格兰杰原因”。7其中,模型的滞后项个数m根据SBIC (Schwarz Bayesian information criterion)、AIC (Akaike’s information criterio)、HQIC (Hannan and Quinn information) 和LR信息标准来联合确定。
7. 我们也可同时检验S不是W的“格兰杰原因”,但这不是本文关注所在,故略去。
因为“上证指数”和“信心指数”不同阶,因此我们采用“Tod-Yamamoto”过程来进行Wald检验。也即,建立VAR时滞后值采用m再加两个时间序列中的最大单整阶数 (本研究中为1),进行Wald检验时则使用m。但要注意,非平稳序列完全可以进行“格兰杰因果检验”,只是不能采用传统方法进行Wald检验。
(二) 基于ARDL边限检验的协整分析模型因为“微博信心指数”和“上证指数”分别为平稳和单位根时间序列,因此,我们采用自“ARDL回归分布滞后方法”(Autoregressive Distributed Lag,ARDL) 进行协整检验 (Pesaran and Shin, 1999;Pesaran,Shin and Smith, 2001) 并估算“误差纠正模型”(ECM)。较之传统的“约翰森方法”,ARDL模型具有三大优势:第一,不要求变量同阶单整,可以直接将Ⅰ(0) 和Ⅰ(1) 纳入模型分析;第二,当解释变量为内生变量时,ARDL模型估计也不会受到影响;第三,在小样本的情况下ARDL的估计更稳定性和更高效。
根据帕瑟伦等 (Pesaran,Shin and Smith, 2001) 的研究,我们建立以“上证指数”S为因变量,以股市的“微博信心指数”W为主解释变量的误差纠正模型:
$ \Delta {S_t} = {\beta _0} + {\beta _1}{S_{t - 1}} + {\beta _2}{W_{t - 1}} + \sum\limits_{j = 1}^p {{\lambda _{1j}}\Delta {S_{t - j}}} + \sum\limits_{j = 1}^q {{\lambda _{2j}}\Delta {W_{t - j}}} + \gamma D + {\varepsilon _t} $ |
其中,β1和β2代表了“微博信心指数”W和股市行情S之间的协整,也即长期关系。λ1j和λ2j则代表了两者之间的短期动态关系。εt为随机干扰项,p和q为滞后阶数。考虑股市震荡期的股指结构性波动,我们还加入了下行拐点的虚拟变量D。通过“边界检验法”,我们可以确定W和S之间是否协整。在协整的前提下,我们进一步对β2和λ2j进行估计。具体而言,利用信息准则来确定各差分项的最佳滞后阶数p和q,然后使用服从非规则渐进分布的F统计量对零假说 (H0为β2=0,也即无协整关系) 进行联合显著性检验。当F值高于假定W为Ⅰ(1) 的F上限值时,则可以拒绝零假说,证明存在协整关系。当F检验确认舆情和股市行情之间存在长期均衡后,我们在保证估计的残差不存在线性自相关问题的前提下估算出相关系数。
(三) 实证分析结果表 2中报告了基于“T—Y”过程的“格兰杰因果检验”结果。我们发现,在股市震荡期,早前1—3天的微博舆情有助于更好地预测后市行情。但这一关联在股市平稳期并没有出现。此外,我们发现,无论是震荡期还是平稳期,股市行情本身走势并不有助于预测“微博信心指数”。尽管直觉告诉我们股市行情会影响到媒体热议的内容,但没有统计显著的关联显示,影响网络媒体热议股市的内容、数量的因素显然不仅仅是股市自身的指数起伏。至此,我们首先证明了第一个假说 (H1),也即网络舆情可以构成股市行情的“格兰杰原因”。
我们进一步对“微博信心指数”和股市行情之间的关系进行细化分析。表 3中报告了基于ARDL模型的边限检验结果。实际上,也就是用一般最小二乘法 (OLS) 进行对模型中的滞后水平变量系数联合F值检验 (是否加入趋势项则根据该项的显著性确定)。从表 3可见,震荡期的边限检验F统计量以及W统计量都远高于0.05显著水平的各自上界值。这意味着,在股市震荡期,“微博信心指数”和股市行情之间存在着长期均衡。相比较而言,这种长期关系在平稳期的股市则不存在。
基于表 3的发现,我们接下来报告股市震荡期的网络舆情与股市行情的动态关系。通过比较AIC、SC和HQ准则得到估计系数的标准差,选择标准差最小结果,我们报告W和S之间的长期关系如下:
$ S = {7.16^{***}}W + {11.73^*}D $ |
其中,星号分别表示系数7.16在0.001水平上显著,系数11.73在0.1水平上显著。由于S和W均为自然对数,因此,这个长期关系意味着,“微博信心指数”如果增长1%,就会影响“上证指数”增长7%。
接下来我们进一步展示两者间的短期关系:
$ \begin{array}{l} \Delta S = {0.266^*}\Delta {S_{(1)}} - {0.432^{***}}\Delta {S_{(2)}} + 0.009\Delta W + {0.33^{***}}\Delta {W_{\left( 1 \right)}}\\ \;\;\;\;\;\;\; - {0.023^{**}}D - 0.012ec{m^*}\left( { - 1} \right) \end{array} $ |
从0.33的系数可见,短期内存在从“微博信心指数”向“上证指数”的正向影响。此外,ecm系数为负且显著,证明了短期关系模型的收敛性。至此,我们证明了第二个假说 (H2)。
接下来,我们做进一步的机制检验。8一般而言,微博舆情对股市指标发生影响,必须通过相关金融活动 (开户、资金流入等指标) 才得以发生。因此,这种中介机制 (mediating effect) 的因果链条应该呈现为“微博舆情—开户资金—股市行情”的“三部曲”。在“格兰杰检验”中,这应该体现为,纳入开户或者资金流数据使微博舆情不再能有助于预测股市行情。同时,微博舆情应该是开户或资金流的“格兰杰原因”,开户或资金则是股市行情的“格兰杰原因”,为此,我们进行专门检测分析 (类似于进行Soble-Goodman的三角检验)。
8. 此处要感谢匿名审稿人的重要建议。
我们将沪、深两市“大单”和“超大单”每日资金净流入数据作为潜在的中介变量。9具体而言,基于万得资讯的数据,我们获得2015年5—7月的震荡期沪深股市新入市资金数据的标准化值 (经检验为平稳序列),并将其与微博舆情指数与沪深股市综合行情 (沪市日指数与深市日指数的标准化值的均值,经检验为平稳序列) 等一起建立“格兰杰模型”。相关检验结果见表 4。
9. 由于我们获得的股市新开户数据单位为每周而非每日,因此我们无法将开户数作为潜在的中介变量进行考虑分析。
从表 4不难发现,我们预期的中介效应确实通过“格兰杰检验”结果获得证明。具体而言,当在微博舆情和股市行情的二元“格兰杰模型”中进一步控制资金流入变量,微博舆情与股市行情之间的显著关联就消失了,微博不再有助于预测股市。同时,资金流入和股市行情显著相关,构成股市的“格兰杰原因”。此外,微博舆情又构成资金流入的“格兰杰原因”。至此,我们的进一步分析表明,微博舆情通过影响市场资金流入来影响股市行情。
最后,我们进行稳健性检验。第一,我们对计算出利好热词和利空热词的因子得分相除而不是相减,构造出另一种股市热词的“微博信心指数”。基于比值的“微博信心指数”,我们进行了同样的分析,并获得了和文中一致的结论。第二,因为前文是对沪市的研究,我们对深市的同期数据进行了搜集和同样的分析。结果发现,基于深市的数据进一步验证了我们的发现,而且“格兰杰因果检验”结果更为显著。10
10. 限于篇幅,相关的统计分析结果,需要的读者可以向作者联系索取。
五、 讨论与建议股票投资过程应该是一个社会互动过程,包括投资者对市场的信息濡染过程、网络互动过程和压力情绪过程。投资者对资本市场的判断不可能完全独立,投资者对于市场波动的情绪反应也不可能完全理性。个体的偏差会导致金融市场上出现群体的偏差,进而导致投资或投资组合决策中的决策偏差。换言之,投资者的市场决策是彼此深受影响,相互干扰,这种影响还会伴随着媒体舆情的渲染而进一步扩大。特别是从信息传播的角度出发,中小投资者普遍缺乏搜集处理市场信息的专业能力,因此他们更容易受到舆情的影响。
与传统的面对面的社交网络相比,互联网本身具有接入成本低、时间反应迅速、空间链接面极广等传播优势。而微博与一般的互联网平台相比,还具有实时自媒体、分析分级传播、相对真实等重要特征。这些特征使股市参与者,尤其是中小散户能够部分缓解信息不对称的问题,也有可能放大虚假信息所带来的连锁反应,也因此构成了微博能够深刻影响股市的机制。因此,在网络碎片化信息时代,微博和微信成为大众最主要的信息来源。
本文通过对新浪微博大数据的研究,检视了微博这种具有更广泛社会影响力的媒体平台,其网络舆情有可能影响股市行情:在2015年的股市震荡期,早前三天内的“微博信心指数”有助于预测“上证指数”的走势,并且“微博信心指数”和“上证指数”之间存在显著的长期正相关均衡关系和短期关联,但在2015年的股市行情平稳期,以上的统计关联并不存在。我们的研究是传播学和社会学领域首次使用基于“T—Y”过程的“格兰杰因果检验”,和基于“ARDL模型”的“边限检验”。如果不利用这类方法,传统的格兰杰因果和协整分析只能采取对股市指数和“微博信心指数”取“一阶差分”的方法才能进行,而那样的社会科学解读会变得难以解读。
在方法论层面,与基于传统的问卷调查、入户访谈等方式相比,利用新浪微博平台进行大数据研究可以更好地从宏观层面和长时间尺度对具体的社会与经济生活变迁进行分析,从而为社会科学学者研究现实生活中社会经济运行轨迹和文化行为、政治现象的互动提供全新的前景。早在几年前,哈佛大学的加里·金 (King,2009) 在展望社会科学的未来五十年时就预言,随着大数据的出现和使用,整个社会科学研究的实证基础将会出现重大的转化,研究问题的广度将伴随着海量数据的整合而得到极大拓展,甚至会加速定性研究与定量研究的大融合。
在本研究中,我们利用新浪微博官方提供的100万入库的词频数据进行海量数据分析,是国际、国内大数据分析广泛使用的方法。譬如,利用谷歌百万图书的词频,有学者对社会学史和中国城市国际知名度的变迁进行了研究 (陈云松,2015;陈云松等,2015);也有学者通过测量美国社会的阶级关注度,发现宏观经济指标与不平等等“现实”的社会指标,和公众对社会阶级的关注这一“主观”指标之间存在重要的关联 (Chen and Yan, 2016);再比如,基于微博大数据,有学者发现微博的网络拓扑特征,会影响特定的广告营销传播 (陆煊、江若尘,2014),而网络热词的微博使用和百度搜索之间具有因果关联 (陈云松等,2017)。在此意义上,本研究是在大数据实证方向上对社会经济指标与网络舆情关系研究的较早应用。
在政策导向层面,与美国的资本市场相比较,中国股市有其特殊性。第一,中国股市是一个新兴的资本市场,中小散户投资者的力量相对较大,他们由于自身知识的局限性,以及难以有渠道洞悉上市公司真实的经营状况,非理性的投资行为更为明显,也因此对舆情波动的反应更加敏感,容易出现投资策略上的认知失误。第二,中国的资本市场充斥着大量非理性和非专业的投资噪音,诸多投资机构和专家单纯地以“名义价格”作为依据进行荐股,诸多庄家和机构的非官方消息也在网络平台上传播。在股市波动期,当“微博信心指数”转向利好面时,部分清醒的投资者即便察觉到市场泡沫的存在,但在强大的多数意见乐观情绪带动下,他们也因为害怕被孤立的恐惧而选择了沉默。其结果就是,优势意见得到加强,劣势意见被压制,从而形成一个强大的舆情环境,进一步推动了市场非理性的乐观情绪。针对这一特点,我们有如下政策建议。
首先,决策者应利用好微博这一信息公开的网络平台,在股市异常波动的特殊时期及时发布积极信息,引导舆论导向。通过网络舆情这一深入民众的内部力量进行合适引导,从而形成内部和外部的有效合力,起到稳定市场信心的作用。
其次,伴随着微博话语权力结构的集权化和等级化趋势会进一步加剧,决策者可以选择一些具有可观数量粉丝群体和具有一定公众认可度的二级机构平台,通过适时操控,与一级中心微博保持一致,统一转发或发布具有专业水平的热帖,在各自的朋友圈内引起广泛关注和热议,为正面积极消息的快速传递起到推波助澜的作用。
再次,决策者可以加强对于微博这一网络舆情的监控力量,充分意识到消极信息的破坏力和影响力,对于恶意散布谣言和蓄意破坏市场秩序的博文、言论注意监管。
当然,我们的研究仍然存在很多缺陷。第一,我们所采用数据周期比较短,是半年内的一个平稳期和一个波动期,因此,所得出的结论理论上看可能并不具有代表性。换句话说,2015年如此,不代表 2016年也会如此。但考虑到中国股市“政策市”的多变特征,我们认为,基于3个月的连续近70个交易日的数据分析是相对可靠的。相反,过长的数据跨度反而会使时间序列分析需要的平稳性特征无法得到外生环境的保证。第二,由于中国股市并非市场自由竞争形成的均衡博弈,行政权力对交易规则的影响力极大,因此,我们并不追求相关发现的可推广性和长期规律性:政策的外生变化会改变舆情和股市行情之间的均衡形式。第三,囿于数据,我们的时间序列分析尽管获得“格兰杰因果”的结论,但可能仍非严格意义上的反事实因果。不过,我们构建的“微博舆情—资金流入—股市行情”的因果链条,无论是理论还是实践角度,都具有一定的说服力。
[] | 陈云松. 2015. 大数据中的百年社会学——基于百万书籍的文化影响力研究. 社会学研究, 10001(1): 23-48. |
[] | 陈云松, 吴青熹, 张翼. 2015. 近三百年中国城市的国际知名度. 社会, 35(5): 60-77. |
[] | 陈云松, 朱灿然, 张亮亮. 2017. 代内文化反授:概念、理论和大数据实证. 社会学研究, 10001(1): 78-100. |
[] | 何平, 吴添, 姜磊, 伍良杰. 2014. 投资者情绪与个股波动关系的微观检验. 清华大学学报 (自然科学版), 10001(5): 655-663. |
[] | 金雪军, 祝宇, 杨晓兰. 2013. 网络媒体对股票市场的影响:以东方财富网股吧为例的实证研究. 新闻与传播研究, 10001(12): 36-51. |
[] | 孔翔宇, 毕秀春, 张曙光. 2016. 财经新闻与股市预测——基于数据挖掘技术的实证分析. 数理统计与管理, 10001(2): 215-224. |
[] | 林振兴. 2011. 网络讨论、投资者情绪与IPO抑价. 山西财经大学学报, 10001(2): 23-29. |
[] | 刘维奇, 闫汾娟. 2014. 投资者情绪对基于宏观因子套利定价的影响. 经济管理, 10001(5): 133-142. |
[] | 陆煊, 江若尘. 2014. 网络拓扑特征对病毒式营销传播动态影响的研究——基于新浪微博大数据的实证分析. 新闻与传播研究, 10001(10): 24-40. |
[] | 史青春, 徐露莹. 2014. 负面舆情对上市公司股价波动影响的实证研究. 中央财经大学学报, 10001(10): 54-62. |
[] | 谢耘耕, 荣婷. 2011. 微博舆论生成演变机制和舆论引导策略. 现代传播 (中国传媒大学学报), 10001(5): 70-74. |
[] | 易洪波, 赖娟娟, 董大勇. 2015. 网络论坛不同投资者情绪对交易市场的影响. 财经论丛, 10001(1): 46-54. |
[] | 游家兴, 吴静. 2012. 沉默的螺旋:媒体情绪与资产误定价. 经济研究, 10001(7): 141-152. |
[] | 曾颖, 陆正非. 2006. 信息披露质量与股权融资成本. 经济研究, 10001(2): 69-79. |
[] | 张丹, 廖士光. 2009. 中国证券市场投资者情绪研究. 证券市场导报, 10001(10): 61-68. |
[] | 张栋凯, 齐佳音. 2015. 基于微博的企业突发危机事件网络舆情的股价冲击效应. 情报杂志, 10001(3): 132-137. |
[] | 张谊浩, 李元, 苏中锋, 张泽林. 2014. 网络搜索能预测股票市场吗. 金融研究, 10001(2): 193-206. |
[] | 赵涛, 郑祖玄. 2002. 信息不对称与机构操纵——中国股市机构与散户的博弈分析. 经济研究, 10001(7): 41-48. |
[] | 周翠玲, 邹高峰. 2013. 股票论坛与IPO交易行为的数学分析. 河南科学, 10001(1): 123-126. |
[] | Antweiler Werner, Frank Murray Z.. 2004. Is All that Talk Just Noise? The Information Content of Internet Stock Message Boards. The Journal of Finance, 59(3): 1259-1294. DOI:10.1111/j.1540-6261.2004.00662.x |
[] | Bartov, Eli, Lucile Faurel, and Partha S. Mohanram. 2015."Can Twitter Help Predict Firm-Level Earnings and Stock Returns?" Available at SSRN:http://ssrn.com/abstract=2631421. |
[] | Bollen Johan, Huina Mao, Xiao-Jun Zeng. 2011. Twitter Mood Predicts the Stock Market. Journal of Computational Scienc, 2(1): 1-8. DOI:10.1016/j.jocs.2010.12.007 |
[] | Brown Gregory W., Cliff Michael T.. 2005. Investor Sentiment and Asset Valuation. Journal of Business, 78(2): 405-440. DOI:10.1086/jb.2005.78.issue-2 |
[] | Bryden John, Sebastian Funk, Vincent AA Jansen. 2013. Word Usage Mirrors Community Structure in the Online Social Network Twitter. EPJ Data Science, 2(1): 1-9. DOI:10.1140/epjds13 |
[] | Chen Yunsong, Fei Yan. 2016. Economic Performance and Public Concerns about Social Class in Twentieth-Century Books. Social Science Research, 10001(59): 34-51. |
[] | Coleman James S.. 1986. Social Theory, Social Research, a Theory of Action. American Journal of Sociology, 91(6): 1309-1335. DOI:10.1086/228423 |
[] | Curme Chester, Tobias Preis, Stanley H.Eugene, Helen Susannah Moat. 2014. Quantifying the Semantics of Search Behavior before Stock Market Moves. PNAS, 111(32): 11600-11605. DOI:10.1073/pnas.1324054111 |
[] | Da Zhi, Joseph Engelberg, Pengjie Gao. 2015. The Sum of All Fears:Investor Sentiment and Asset Prices. The Review of Financial Studies, 28(1): 1-32. DOI:10.1093/rfs/hhu072 |
[] | Das Sanjiv R., Chen Mike Y.. 2007. Yahoo! for Amazon:Sentiment Extraction from Small Talk on the Web. Management Science, 53(9): 1375-1388. DOI:10.1287/mnsc.1070.0704 |
[] | De Long J. Bradford, Andrei Shleifer, Summers Lawrence H., Waldmann Robert J.. 1990. Noise Trader Risk in Financial Markets. Journal of Political Economy, 98(4): 703-738. DOI:10.1086/261703 |
[] | Fisher Kenneth L., Meir Statman. 2000. Investor Sentiment and Stock Returns. Financial Analysts Journal, 56(2): 16-23. DOI:10.2469/faj.v56.n2.2340 |
[] | Granger Clive W. J., Pesaran M. Hashem. 2000. Economic and Statistical Measures of Forecast Accuracy. Journal of Forecasting, 19(7): 537-560. DOI:10.1002/(ISSN)1099-131X |
[] | Johansen Soren, Katarina Juselius. 1990. Maximum Likelihood Estimation and Inference on Cointegration-with Applications to the Demand for Money. Oxford Bulletin of Economics and Statistics, 52(2): 169-210. |
[] | Joseph Kissan, Wintoki M. Babajide, Zelin Zhang. 2011. Forecasting Abnormal Stock Returns and Trading Volume Using Investor Sentiment:Evidence from Online Search. International Journal of Forecasting, 27(4): 1116-1127. DOI:10.1016/j.ijforecast.2010.11.001 |
[] | Kahneman, Daniel and Amos Tversky. 1979 "Prospect Theory:An Analysis of Decision under Risk" Econometrica 47(2):263-291. |
[] | Kim Hwi-Gang, Seongjoo Lee, Sunghyon Kyeong. 2013. Discovering Hot Topics Using Twitter Streaming Data Social Topic Detection and Geographic Clustering. Advances in Social Networks Analysis and Mining (ASONAM), 2013. |
[] | King, Gary. 2009."The Changing Evidence Base of Social Science Research." In The Future of Political Science:100 Perspectives, edited by Gary King, K. L. Schlozman and N.Nie.New York, NY:Routledge:91-93. |
[] | Liang, Xun. 2005."Impacts of Internet Stock News on Stock Markets Based on Neural Networks." In Advances in Neural Networks-ISNN 2005, edited by Jun Wang, Xiaofeng Liao and Zhang Yi. Berlin:Springer Science & Business Media:897-903. |
[] | Mao, Huina, Scott Counts, and Johan Bollen. 2011."Predicting Financial Markets:Comparing Survey, News, Twitter and Search Engine Data." http://arxiv.org/abs/1112.1051. |
[] | Mellon Jonathan. 2013. Where and When can We Use Google Trends to Measure Issue Salience?. PS:Political Science & Politics, 46(2): 280-290. |
[] | Mellon Jonathan. 2014. Internet Search Data and Issue Salience:The Properties of Google Trends as a Measure of Issue Salience. Journal of Elections, Public Opinion and Parties, 24(1): 45-72. DOI:10.1080/17457289.2013.846346 |
[] | Nuti Sudhakar V., Brian Wayda, Isuru Ranasinghe, Sisi Wang, Dreyer Rachel P., Chen Serene I., Karthik Murugiah. 2014. The Use of Google Trends in Health Care Research:A Systematic Review. Plos One, 9(10): 1-49. |
[] | Pesaran M. Hashem, Yongcheol Shin. 1999. An Autoregressive Distributed Lag Modeling Approach to Cointegration Analysis. In Econometrics and Economic Theory in the 20th Century:The Ragnar Frisch Centennial Symposium, edited by Steinar Strøm. New York, NY: Cambridge University Press: 371-413. |
[] | Pesaran M. Hashem, Yongcheol Shin, Smith Richard J.. 2001. Bounds Testing Approaches to the Analysis of Level Relationships. Journal of Applied Econometrics, 16(3): 289-326. DOI:10.1002/(ISSN)1099-1255 |
[] | Preis Tobias, Helen Susannah Moat, Stanley H. Eugene. 2013. Quantifying Trading Behavior in Financial Markets Using Google Trends. Scientific Reports(3): 1684. |
[] | Scheitle Christopher P.. 2011. Google's Insights for Search:A Note Evaluating the Use of Search Engine Data in Social Research. Social Science Quarterly, 92(1): 285-295. DOI:10.1111/ssqu.2011.92.issue-1 |
[] | Sprenger Timm O., Andranik Tumasjan, Sandner Phlipp G., Welpe Isabell M.. 2013. Tweets and Ttrades:The Information Content of Stock Microblogs. European Financial Management, 20(5): 926-957. |
[] | Tumarkin Robert, Robert Whitelaw. 2001. News or Noise? Internet Postings and Stock Prices. Financial Analysts Journal, 57(3): 41-51. DOI:10.2469/faj.v57.n3.2449 |
[] | Wysocki, Peter. 1999. "Cheap Talk on the Web:The Determinants of Postings on Stock Message Boards." Working Paper, University of Michigan Business School. |
[] | Yang, Xintian, Amol Ghoting, and Yiye Ruan. 2012."A Framework for Summarizing and Analyzing Twitter Feeds." Proc. ACM KDD:370-378. |
[] | Zhang Xue, Hauke Fuehres, Gloor Peter A.. 2011. Predicting Stock Market Indicators Through Twitter:'I hope it is not as bad as I fear'. Procedia-Social and Behavioral Sciences, 10001(26): 55-62. |
[] | Zhao, Xinqian, Juan Yang, Lili Zhao, and Qing Li. 2011."The Impact of News on Stock Market:Quantifying the Concept of Internet-Based Financial Markets." The 11th International DSI and the 16th APDSI Joint Meeting, Taipei, July 2011. |