经典CAPM(Mossin J.1966)、Fama-French(1993, 2015)三因子和五因子模型以及Carhart(1997)四因子模型在一定程度上可以部分解释股票收益的横截面差异,但仍然不能包含股票价格变动的所有风险来源,剩余风险往往与投资者情绪等非理性因素存在系统性关系。早在1990年,DeLong et al.(1990)(下文简称DSSW)开创性地将投资者情绪引入到资产定价中,指出理性套利者并不能消除噪声交易者情绪导致的错误定价,即市场上存在无法对冲的噪声交易风险。该模型揭示了一种典型的投资者情绪,即投资者情绪为投资者对风险资产价格预期的系统性偏差。
投资者情绪如何影响股票市场一直是金融领域的研究热点。Brown and Cliff(2004)运用问卷调查的方法度量投资者情绪,探索其与股票收益之间的关系,他们发现在未来1-3年内投资者情绪对股票收益仍然具有显著的负向影响,且当期股票收益率和前期市场收益率也会影响投资者情绪。Baker and Wurgler(2006)则在前人研究基础上,使用IPO数量及其首日收益率、封闭式基金折价率、股票换手率、股利溢价等投资者情绪代理变量进行主成分分析,构建复合投资者情绪指标,发现在小规模股票、新兴股票、高波动率股票中,投资者情绪与股票收益之间的负向关系更加显著。近年来,随着互联网技术的发展,越来越多的投资者开始利用互联网平台表达对资本市场的看法和股票交易经验,同时也有很多学者开始探索投资者行为和情绪是否受社会化媒体(social media,如股票论坛、微博、博客等)影响。如Bollen et al.(2011)发现Twitter用户的“冷静”(calm)情绪对道琼斯工业平均指数涨跌的预测力最好,准确度达到了87.6%。Sprenger et al.(2014)发现消极情绪与股市异常收益相关,且博文的数量能显著预测下一天的成交量。在国内,黄润鹏等(2015)运用ROST Content Mining情感分析模块分析微博情绪,检验其对上证指数的预测作用,结果发现加入微博情绪信息的预测模型准确率更高。
随着移动互联网技术的发展和智能移动设备(如智能手机、平板电脑等)的高度普及①,移动互联网用户的投资行为开始引起学者们的研究兴趣(Yamaguchi, 2006; Koenig-Lewis et al., 2010; Böhmer et al., 2011; Paredes et al., 2016)。智能移动设备不仅是投资者获取信息重要的载体,而且深深地改变了人们的行为模式(Constantiou et al., 2014)。最近,有学者开始对移动互联网用户行为进行了一些有意义的探索,Ghose et al.(2013)探讨了互联网浏览行为在移动手机端和个人电脑端之间的差异,发现移动手机端有更高的搜索成本。Paredes et al.(2016)利用英国价差交易市场上的5315位投资者在2004年11月到2013年3月产生的450万交易数据,探讨智能设备和APP应用程序对投资者交易行为和交易表现的影响,结果发现使用智能设备进行交易的投资者更加年轻化和男性化,移动互联网技术对投资者的收益和控制风险的能力有显著正向影响,但是这些投资者表现出更强的处置效应。Kim et al.(2016)则发现移动端的非专业投资者更容易受到社会化媒体情绪的影响,表现出更显著的羊群行为。这些文献比较分析了移动互联网用户行为特征,发现移动互联网新技术对投资者行为产生了重要影响,但是移动端投资者情绪是否会对投资者行为和资本市场表现产生影响还有待进一步研究。
① 根据2017年第40次中国互联网络信息中心(CNNIC)发布的统计数据,截至2017年6月,我国手机网民规模已达7.24亿,较2016年底增加2830万人;其中,网民中使用手机上网的人群占比进一步提高,由2016年的95.1%提高到2017年6月的96.3%,说明随着移动技术的发展,手机终端的大屏化以及手机应用体验的不断提升,手机作为网民主要上网方式的趋势进一步明显,而通过平板电脑、笔记本电脑或台式电脑接入互联网的比例均有所下降,可见近年来我国移动互联网技术发展快速。
相比传统新闻媒体和社会化媒体,移动互联网和APP应用程序为投资者提供了可随时随地发布、获取信息的平台渠道,投资者可以随时随地表达任何对宏观经济、行业发展、公司未来经营情况的看法与观点、以及自身的股票交易经验等。这种通过移动互联网表达的情绪有何特征?移动端情绪对投资者决策行为有何影响,是否对股票收益有预测作用?本文将对这些问题进行探索。本文将利用网络爬虫技术收集移动互联网用户讨论信息(来自雪球网平台移动端的讨论数据,即通过iPhone,iPad以及Android客户端发布的信息),探索移动互联网投资者情绪特征,并进一步讨论移动互联网用户情绪对股票期望收益的影响。实证结果表明:移动互联网用户情绪存在显著不对称特征,其更倾向于表现积极乐观的情绪,且移动互联网用户情绪越乐观,下一期股票收益越高。此外,本文还发现处于较差信息环境(如散户持股较高,分析师跟踪人数较少)的公司以及流动性越差的公司,移动互联网用户情绪对其股票收益的影响更加显著。
本文可能存在的研究贡献有:第一,本文利用网络爬虫技术收集来自移动互联网的用户讨论信息,比较分析移动端与PCs端用户发布讨论信息的差异,加深了对移动互联网用户行为特征的理解,补充了对移动互联网用户行为特征探索的相关研究;第二,本文发现移动互联网用户更乐于表达积极情绪,说明移动互联网用户对股票未来收益预期存在系统性偏差,导致被移动互联网用户关注或讨论更高的股票具有更高风险溢价;第三,本文首次探索来自移动互联网的用户情绪对股票收益的影响,丰富了有关投资者情绪与股票收益关系的研究,也是对行为金融学中传统媒体定价领域的重要补充。
本文以下内容的结构安排如下:第二部分为理论分析与研究假设;第三部分为数据样本及变量选择;第四部分为实证分析;最后为结论与展望。
二、理论分析与研究假设现在是信息爆炸的时代,资本市场上并不缺信息,而是缺乏筛选有效有用信息的能力。理查德·沃尔曼(Richard Saul Wurman)认为,信息时代不是“信息爆炸”,而是“非信息”爆炸,说明无价值信息带来了更大的困扰。在这种复杂的信息环境中,具有有限认知能力的主体在决策时常常是“有限理性”(bounded rationality)的。因此,移动互联网在产生大量有用信息的同时,也产生了大量的冗余信息或噪声,这些大量冗余信息或噪声给投资者带来了难以处理的困扰,同时干扰了投资者对相关有用信息的准确性选择,从而导致了一些有限理性投资者的噪声交易行为,进而影响风险资产定价。
根据DSSW(1990)模型,投资者情绪为投资者对风险资产价格预期的系统性偏差,这种情绪由噪声交易者将噪声当作真实的信息而形成的,因此,本文认为非理性的投资者将移动互联网信息中的大量噪声作为投资决策的信号,造成对风险资产价格有偏预期,从而产生情绪并导致风险资产价格偏离其基本面价值。
在DSSW(1990)模型中,噪声交易者由于心理和市场等各种因素对风险资产预期价格产生认知偏离,其偏离程度是一个独立正态分布的随机变量:
$ {\rho _t}:N({\rho ^*}, \sigma _\rho ^2) $ | (1) |
其中,ρ*为噪声交易者对风险资产预期价格的错误认知偏离均值;σρ2为噪声交易者认知偏离程度的方差。实际上,DSSW(1990)模型揭示了一种典型的投资者情绪,即投资者情绪为投资者对风险资产价格预期的系统性偏差。
噪声交易者的相对收益为:
$ E\left({\Delta {R_{n - i}}} \right) = {\rho ^*} - \frac{{{{\left({1 + r} \right)}^2}{{\left({{\rho ^*}} \right)}^2} + {{\left({1 + r} \right)}^2}\sigma _\rho ^2}}{{\left({2r} \right)\mu \sigma _\rho ^2}} $ | (2) |
其中,μ为噪声交易者在市场中所占比例;r为资产未来支付的红利。μ越大,噪声交易者的相对收益的期望越大。上面公式(2)中右边的第一项“持有更多效应”(hold more effect)表明,只有当ρ*>0,噪声交易者才能获得正的相对收益。根据右边第二项分子中第一项的“价格压力效应”,当噪声交易者更加乐观时,需要更多的风险资产,不仅推高了资产价格,而且降低了噪声交易者的相对预期收益。右边第二项分子中第二项的“高买低卖效应”或Friedman效应由噪声交易者的错误市场时间造成,它的存在减少了噪声交易者的相对预期收益。右边第二项的分母为该模型的核心,表明当噪声交易者信念波动增加时,资产价格风险增加。如果理性套利者想要利用噪声交易者对资产价格的错误认知来进行套利,他们必须要承担更大的风险。但是理性交易者是风险厌恶的,所以随着资产风险的增加,他们从噪音交易者手中购买的风险资产就会减少,从而噪音交易者“创造了自己的生存空间”,这种效应称为“创造空间效应”。因此,对于一些有限理性或者非理性的移动互联网用户,只有通过对未来风险资产价格表现为乐观预期才能实现其相对收益大于零。根据以上分析,本文提出下面的假设1和假设2:
假设1:移动互联网用户对未来风险资产价格预期的情绪具有不对称性,总体来说表现为乐观预期。
假设2:移动互联网用户的总体乐观预期增加了资产需求,使得风险资产价格上升,从而产生正的超额收益。
根据Merton(1987)的“投资者认知假说”(investor recognition hypothesis)理论,股票特质风险来源于信息的不完全,其认知成本高,被少数投资者所知道且集中持有,因此高特质风险的股票要求提供更高的溢价作为补偿。Fang and Peress(2009)从投资者认知角度检验“媒体效应”(media effect)原因时,发现分析师跟踪人数越少、散户持股越高和特质风险越高的公司,其股票的“媒体效应”越显著,低媒体报道股票的“未报道信息溢价”越显著,这是由于公司所处的信息环境较差,噪声较多,导致认知成本较高,从而引起特质风险要求更高的溢价作为补偿。在本文中,移动互联网信息中不仅包含“有价值的信息”,而且也包含大量的噪声,使得公司处于较差的信息环境,也会给公司带来更大的特质风险,从而需要更高的风险溢价,基于以上分析,提出本文的假设3:
假设3:特质风险较高的公司或者处于信息环境较差的公司,移动互联网用户情绪对其股票期望收益的影响更加显著。
Fang and Peress(2009)采用纽约交易所(NYSE)的股票和纳斯达克(NASDAQ)市场随机挑选的500只股票作为样本,直接检验新闻媒体对横截面股票收益的影响,发现未被报道的公司的股票收益高于那些被媒体高度报道的股票收益,并认为这种“媒体效应”由于低媒体报道股票的“未报道信息溢价”和低流动性共同造成。在流动性缺乏的股票,理性套利者难以根据噪声交易风险进行套利,从而使得不同流动性水平下的移动互联网用户情绪对股票期望收益影响也不一样,因此,在流动性较差的条件下,移动互联网用户情绪对股票收益的影响也越显著,从而提出本文的假设4:
假设4:对于流动性越差的公司,移动互联网用户情绪对其股票收益的影响也越显著。
三、数据样本及变量选择 (一) 数据样本本文的移动互联网数据来自于雪球网(http://xueqiu.com)①,通过网络爬虫技术共收集了2010年12月1日到2015年3月31日的所有1100家上海证券交易所的上市公司A股在雪球平台的讨论数据,总计数据条数为2144135,包括发帖人的雪球用户名、文本内容、发布时间、发布来源(移动端或PCs端)、及其转发、赞助和评论等,其中,移动互联网信息主要是指通过iPhone客户端,iPad客户端和Android客户端发布的信息,其占比分别为41.08%,5.91%和53.01%。由于2014年之前在雪球平台上股票讨论数据存在许多缺失值,为了使得股票的雪球数据具有统一可比性,我们选取2014年1月1日到2015年3月31日作为本文的研究区间,共64周②。此外,有些股票在雪球平台上讨论量较少,本文剔除了每天讨论量小于或等于2条的公司样本,同时也剔除了在2014年1月1日以后上市的公司样本,最后得到483个公司股票有效样本。
① 雪球网是一个专业的投资者的社交网络,投资者可以通过雪球网进行跨市场、跨品种的数据查询、新闻订阅和互动交流服务。其中,互动交流是投资者最活跃的版块,截止到2016年10月,雪球用户量已经超过千万,并且雪球用户每天发布30万条UGC内容(User Generated Content,用户原创内容),雪球用户创建的策略组合超过80万个,雪球网用户的发布的数据具有一定的代表性,因此本文选取雪球网作为移动互联网数据的挖掘平台,研究投资者情绪对股票收益的预测作用。
② 选取周度频率作为本文的研究频率的原因:日度的雪球讨论数据缺失较多,周度频率数据可以使样本区间内的所有样本数据更加统一完整,有助于探索移动互联网信息与股票期望收益的横截面关系;如果采用月度频率,虽然对构建套利策略有利,但是仅仅只有15个月,研究区间较短,所以选取周度频率更加符合本文的研究。
由于雪球网在我们收集完第一批数据后,对股票主页用户讨论数据的显示进行了限制,仅显示100页股票讨论信息。因此,我们只能再次收集2016年4月1日到2016年11月31日的来自上证券交易所和深圳证券交易所的595家上市公司(上文中选出的483只上交所股票和从沪深300中选出的112只深交所股票)的雪球讨论数据,进一步检验本文的研究内容。
(二) 情绪度量目前,对于投资者情绪的度量还没有统一的标准。根据现有研究,一般可以将投资者情绪指标分为三大类:(1)通过调查直接反映投资者对市场预期的变量(Solt and Statanan, 1988; Brown and Cliff, 2004);(2)由市场上的交易变量构成,如成交量、换手率、封闭式基金折价率、IPO数量及其首日收益、新开户数等(Baker and Stein, 2004; Baker and Wurgler, 2006; 宋泽芳和李元, 2012);(3)情绪的代理变量,指那些影响投资者对市场估值和预期的非经济变量,如天气、云量、降水量、温度、湿度等(Hirshleifer and Shumway, 2003; Goetzmann et al., 2015)。总体来看,已有情绪的度量方法缺乏真实性和实时性,且缺乏个股情绪度量方法,随着互联网,尤其是移动互联网的发展,一些社交媒体为投资者提供了专业的可随时随地发布、获取信息的平台,他们可以表达任何对公司未来经营情况的看法、股票的交易经验等,因此专业的社交平台更能充分反映投资者情绪,本文将运用ROST Content Mining(CM)6①②文本分析工具对移动互联网用户讨论信息(来自雪球网平台移动端的讨论数据,即通过iPhone,iPad以及Android客户端发布的信息)进行情感分析,并得出每条讨论文本的情感分数,即移动互联网用户情绪。我们定义个股i在时间t的移动互联网用户情绪为个股每周来自移动互联网文本信息情绪的均值,记为Mobile_SENA,即:
① ROST Content Mining(CM)6是武汉大学信息管理学院和计算机学院沈阳教授(现调入清华大学新闻传播学院)团队研发编码的国内以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析,遍布海内外100多所大学,包括Cambridge University(剑桥大学)、美国Texas A & M University、日本北海道大学、北京大学、清华大学、香港城市大学、澳门大学众多高校,并且已有其他学者近二十篇基于ROST CM的中英文权威或核心级期刊发表。
② 为了检验ROST软件对帖子情绪测量的有效性,本文随机抽取股票“白云机场(600004)”100条用户帖子,人工判断情绪值,再与ROST软件测量值比较,发现该软件对帖子情绪测量的正确率为63%。
$ Mobile\_SEN{A_{i, t}} = \frac{{\sum SEN{A_{i, t, 1...n}}}}{n} $ | (3) |
其中,SENAi, t, 1...n为个股i在时间t的情绪值,其大小由ROST CM6文本分析工具的情感分析而得到;n为个股i在时间t的移动互联网雪球讨论数量。
运用同样的方法,移动互联网正面情绪和负面情绪分别定义为:
$ Mobile\_POSSEN{A_{i, t}} = \frac{{\sum POSSEN{A_{i, t, 1...n}}}}{n} $ | (4) |
$ Mobile\_NEGSEN{A_{i, t}} = \frac{{\sum NEGSEN{A_{i, t, 1...n}}}}{n} $ | (5) |
其中,POSSENAi, t, 1…n(NEGSENAi, t, 1…n)为个股i在时间t的正面情绪值(负面情绪值),其大小由ROST CM6文本分析工具的情感分析而得到;n为个股i在时间t的移动互联网雪球讨论数量。
为了避免这些异常值影响,可以将情绪分成三类:正面情绪、中性情绪和负面情绪,即只考虑情绪的方向而不考虑情绪的大小程度,我们根据Antweiler and Frank(2004),定义个股i在时间t的移动互联网用户情绪为:
$ Mobile\_SEN{B_{i, t}} = Ln\frac{{\left({1 + Mobile_{i, t}^{positive}} \right)}}{{\left({1 + Mobile_{l, t}^{negative}} \right)}} $ | (6) |
其中,Mobilei, tpositive(Mobilei, tnegative)表示个股i在时间t正面(负面)情绪的移动互联网雪球讨论条数,这一度量方法反映了移动互联网所有用户表达的一种特定情绪(a particular sentiment),这种度量方法可以排除雪球用户发布信息中的异常情绪值的影响。
(三) 控制变量本文选取的控制变量,除了经典的定价因子,如Fama-French三因素(贝塔:Beta,规模:Size和账面市值比:BM)、Carhart(1997)的动量因素(MO)以及Amihud(2002)的流动性因素(Liquidity),还有与移动互联网信息密切相关的因素,如分析师人数(ANA)、机构持股比例(INST)、股票价格(Price)等等,表 1为本文区间内主要控制变量的描述性统计结果。
![]() |
表 1 主要控制变量的描述性统计 |
下面将通过与PCs端用户情绪对比来分析移动互联网用户情绪的非对称性,即比较它们正面负情绪的非对称性,表 2为具体统计结果。
![]() |
表 2 移动互联网和PCs端用户情绪的非对称性分析 |
表 2的Panel A结果显示,来自雪球移动端用户讨论的正面和负面情绪均值分别为10.5698和-10.7579,两者差异不大,但是其讨论条数分别为308184和24540,所占比例分别为85.08%和6.78%,可见移动互联网用户正负面情绪存在显著不对称,这一结果支持假设1。此外,中性情绪移动互联网讨论条数为29484,占所有移动互联网讨论条数比例为8.14%,大于负面情绪讨论比例的6.78%。
在Panel B,来自雪球PCs端用户讨论的正面和负面情绪均值分别为56.7341和-10.5015,均值存在较大差异(这是由于PCs端用户发布信息的文本字数较大所造成的,情绪度量与文本字符长度有一定的关系),且其讨论条数分别为139672和30536,所占比例分别为69.27%和15.14%,PCs端正负面情绪也存在显著不对称性,但是其差异小于移动互联网雪球讨论的正负面情绪差异,这在一定程度上说明了PCs端用户比移动互联网用户更加理性些,受噪声影响要小于移动互联网用户。
基于以上分析,我们发现移动互联网用户情绪存在显著不对称特征,移动互联网用户更乐于表现正面的情绪,且其正负面情绪差异大于PCs端,这与本文假设1是一致的。
(二) 移动互联网用户情绪对股票收益的非对称性影响上文发现移动互联网用户情绪存在显著不对称特征,更乐于表现正面的情绪,且其正负面情绪差异大于PCs端。那么,这种不对称的正负面情绪对股票收益有何影响,是否也会呈现不对称影响的特征?下面将运用公司固定的面板数据模型分析移动互联网用户正负面情绪对股票收益的非对称影响,面板回归结果如表 3所示。
![]() |
表 3 移动互联网用户情绪对股票收益的非对称性影响:面板回归 |
在表 3中,模型(1)中Mobile_SENA的系数为-0.0011(t值为-1.19),但是在统计上不显著,说明移动互联网用户总体情绪对股票收益的影响是有限的。从模型(2)和(3)来看,移动互联网正面情绪(Mobile_POSSENA)和负面情绪(Mobile_NEGSENA的系数分别为-0.0013 (t值为-1.39)和-0.0001(t值为-0.01),但是均在统计上也不显著,一方面说明移动互联网用户正面(负面)情绪对股票收益的不具有预测作用,另一方面其系数大小和显著性水平的不同也说明移动互联网正负面情绪对股票收益的影响程度具有一定程度的不对称性。对于移动互联网用户情绪对股票收益的不具有预测作用的原因可能与上文情绪度量方法有关,因为从表 1可以看出,移动互联网用户情绪有负数到正数的范围较大(从-939到1901),且正面和负面情绪的移动互联网雪球讨论条数所占比例分别为85.08%和6.78%,存在有偏分布,因此需要重新定义移动互联网用户情绪,继续探索移动互联网用户情绪对股票收益的预测作用。
在其他控制变量方面,我们发现移动互联网讨论条数(Mobile_Number)的系数分别为0.3287(t值为4.94)、0.2952(t值为4.31)和0.3510(t值为3.18),均在1%水平下显著,表明来自移动互联网的股票讨论数越高,其下一期的收益越高。贝塔(BETA)系数在三个模型中均显著为负,说明小贝塔股票的期望收益高于大贝塔股票。公司规模(Size)系数也都显著为负,说明在本文的样本区间内存在显著规模效应。但是,我们发现本文的研究区间内,账面市值比(BM)和动量(MO)对下一期股票收益的影响是有限的。此外,当期的股票收益(Return)和非流动性(Illiquidity)对股票收益都具有显著的正向影响。
通过公司固定的固定效应模型发现,移动互联网用户正负面情绪对股票收益的预测作用是有限的,但在一定程度具有不对称性特征。移动互联网用户情绪对股票收益不具有预测作用可能与情绪度量方法有关,下文将重新定义移动互联网用户情绪,继续探索移动互联网用户情绪对股票收益的预测作用。
(三) 移动互联网用户情绪对股票收益预测作用通过以上分析,本文发现移动互联网用户情绪存在显著不对称特征,移动互联网用户更乐于表现正面的情绪。接下来进一步分析移动互联网用户情绪对股票收益的预测作用。为了探讨不同移动互联网用户情绪的横截面股票收益的差异,下面我们运用公司固定的面板数据模型分析移动互联网用户情绪(按照公式(6)的情绪定义)对下一期股票收益的预测作用,模型如下:
$ Retur{n_{i, t + 1}} = {\beta _0} + {\beta _{mobile\_Sentiment}}Mobile\_SEN{B_{i, t}} + \sum\limits_m {{\gamma _m}Contro{l^m}_{i, t} + {\varepsilon _{i, t}}} $ | (7) |
其中,Returni, t+1表示股票i在时期t+1的收益(%收益);β0, βmobite_SEMB, γm为模型变量的估计系数,εi, t是均值为零的误差项。
在表 4中,我们采用公司固定的固定效应模型面板数据回归方法,利用不同模型检验移动互联网用户情绪(Mobile_SENB)对下一期股票收益的影响。从四个不同模型的结果来看,Mobile_SENB系数分别为0.3213(t值为3.76)、0.3662(t值为4.25)、0.3645(t值为4.22)和0.3554(t值为4.11),且均在1%水平下显著,说明了股票的移动互联网用户情绪对下一期的股票收益具有显著为正的影响,即移动互联网用户情绪越乐观,未来股票收益越高,这一结论支持本文的假设2。
![]() |
表 4 移动互联网用户情绪对股票收益预测作用:面板回归 |
在其他股票特征是否影响股票收益方面,贝塔(BETA)系数在四个模型中均显著为负,说明小贝塔股票的期望收益高于大贝塔股票,可能的原因是在本文研究区间内市场处于上升阶段时,大量资金会流向回报较高的行业(如金融股),所以大部分本文研究样本上交所公司股票(非金融股)的收益低于大盘收益(如沪深300指数),造成股票的超额收益为负,那么小beta股票的期望收益会高于大beta股票的期望收益,类似研究见郭多祚、徐占东(2002)、陈收、曹雪平(2007)等。在Model 2-4中,公司规模(Size)系数分别为-1.6615(t值为-6.45)、-1.6344(t值为-6.32)和-1.5094(t值为-5.60),且在1%水平下显著,说明了在我们的样本区间内存在显著规模效应。但是,在我们的样本区间内,账面市值比(BM)和动量(MO)对下一期股票收益没有显著影响。另外,当期的股票收益系数在1%水平下显著为正,说明在本文样本区间内,存在显著的短期动量效应。值得注意的是,在Model4中,非流动性(Illiquidity)指标的系数为0.1329(t值为1.73),说明了缺乏流动性的股票,需要更高的溢价。
可见,在控制一系列变量之后,通过公司固定的固定效应模型发现,移动互联网用户情绪对未来股票收益具有显著正的预测作用,移动互联网用户情绪越乐观,下一期股票收益越高。
(四) 不同信息环境下移动互联网用户情绪对股票收益的预测作用市场信息环境越差,其噪声成分越多,引起噪声交易风险,从而需要更高的风险溢价作为补偿。因此,不同信息环境下,噪声成分有所差异,投资者的情绪也各不相同,从而对股票收益也会有不同的影响。下面进一步检验不同信息环境下的移动互联网用户情绪对股票收益的预测作用,本文选取的信息环境代理变量为散户持股比例和分析师跟踪人数。首先,按照散户持股比例或分析师跟踪人数将本文的股票样本平均分成三组,依次为Low、Medium和High组;其次,分别用不同的模型检验移动互联网用户情绪(Mobile_SENB)对股票期望收益的影响,表 5为公司固定的固定效应回归结果,为了节省篇幅,这里仅公布变量Mobile_SENB的系数和t统计量,其中控制变量与表 4一致。
![]() |
表 5 不同信息环境下的移动互联网用户情绪对股票收益的预测作用:面板回归 |
在Panel A中,不同模型(1)-(4)显示,High组的Mobile_SENB系数分别为0.8657(t值为4.87)、0.8011(t值为4.49)、0.8307(t值为4.63)和0.8161(t值为4.54),均大于Low组和Medium组,且在1%水平下显著,这说明在散户持股比例较高的公司,移动互联网用户情绪对股票期望收益的影响更大。在Panel B中,我们发现在Low组的Mobile_SENB系数分别为0.4094(t值为2.44)、0.4826(t值为2.85)、0.4996(t值为2.93)和0.4482(t值为2.64),其大小和显著性水平均大于其他两组Medium和High组,这说明在分析师跟踪人数越低的公司,移动互联网用户情绪对股票收益的预测作用越显著。总而言之,以上实证结果表明,处于信息环境较差(如散户持股较高,分析师跟踪人数较少)的公司,移动互联网用户情绪对股票期望收益的影响更加显著,假设3得到验证。
(五) 不同流动性水平下移动互联网用户情绪对股票收益的预测作用根据Fang and Peress(2009)的研究,在流动性缺乏的股票,理性套利者难以根据噪声交易风险进行套利,从而使得不同流动性水平下的移动互联网用户情绪对股票期望收益影响也不一样。为了检验这一假设,下面检验不同流动性水平下的移动互联网用户情绪对股票收益的预测作用,首先,按照流动性水平(如Amihud's非流动性比率、成交量和股票价格)将本文的股票样本平均分成三组,依次为Low、Medium和High组;其次,分别用不同的模型检验移动互联网用户情绪(Mobile_SENB)对股票期望收益的影响,表 6为公司固定的固定效应回归结果,为了节省篇幅,这里仅公布变量Mobile_SENB的系数和t统计量,其中控制变量与表 4一致。
![]() |
表 6 不同流动性水平下的移动互联网用户情绪对股票收益的预测作用:面板回归 |
在Panel A,模型(1)-(3)都显示,在Amihud(2002)非流动性比率的最高组(High)和中组(Medium),Mobile_SENB系数和显著性水平均大于最低组(Low),这说明在缺乏流动性的公司,移动互联网用户情绪对股票期望收益的影响更大。在Panel B中,最小组(Low)的移动互联网定价效应不显著,而其他两组均显著,这也说明成交量越小、流动性越差的公司,移动互联网用户情绪对股票期望收益的影响越大。在Panel C,我们发现股票价格最低组(Low) Mobile_SENB系数为正但不显著,系数大小和显著性水平均小于其他两组股票(Medium和High组,Mobile_SENB系数均显著为正),说明在股票价格越高的公司,移动互联网用户情绪对股票期望价格的影响越显著。总而言之,通过以上的分析,我们发现在流动性低的公司,移动互联网用户情绪对股票期望收益的影响也越显著,证明了假设4。
(六) 稳健性检验下面主要通过两种方式继续检验移动互联网用户情绪对股票收益的影响,对本文主要结论进行稳健性检验。第一,剔除金融行业股票;第二,扩充研究样本和研究区间,继续收集2016年4月1日到2016年11月31日的来自上证券交易所和深圳证券交易所的595家上市公司(上文中选出的483只上交所股票和从沪深300中选出的112只深交所股票)的雪球网移动端股票讨论数据作为移动互联网数据来源。表 7为稳健性检验结果。
![]() |
表 7 稳健性检验 |
表 7的Panel A结果显示,在模型(1)-(4)中,解释变量移动互联网用户情绪(Mobile_SENB)系数分别为0.3420(t值为3.83)、0.3828(t值为4.48)、0.3842(t值为4.44)和0.3735(t值为4.36),且均在1%水平下显著,即移动互联网用户情绪对股票下一期收益具有显著正向影响,说明即使剔除金融行业股票样本后,移动互联网用户情绪对未来股票收益仍然具有显著正的预测作用。Panel B的结果也显示,不同模型中的移动互联网用户情绪(Mobile_SENB)系数均在1%水平下显著为正,说明对于不同时间段和不同市场的样本,移动互联网用户情绪对股票预测作用仍然是显著的。在控制变量方面,各股票特征对股票收益的影响与表 4类似。总而言之,剔除金融行业样本以及重新收集不同时段和不同市场的股票,我们发现移动互联网用户情绪对股票期望收益的影响仍然是显著为正的,说明本文的主要结论具有良好的稳健性。
五、结论与展望本文通过网络爬虫技术收集来自移动互联网用户(即雪球网移动端用户)对股票的讨论数据,运用ROST CM6文本分析工具对用户讨论信息进行情感分析,度量移动互联网用户情绪,并探讨其对股票收益的预测作用,主要发现以下结论:第一,移动互联网用户情绪存在显著不对称特征,移动互联网用户更乐于表现正面的情绪,且其正负面情绪差异大于PCs端,此外,移动互联网用户正负面情绪对股票收益的预测作用是有限的,但在一定程度具有不对称性特征;第二,重新定义移动互联网用户情绪后,通过公司固定的固定效应模型发现,移动互联网用户情绪对未来股票收益具有显著正向预测作用,即:移动互联网用户情绪越乐观,下一期股票收益越高。第三,处于信息环境较差(如散户持股较高,分析师跟踪人数较少)的公司,移动互联网用户情绪对股票期望收益的影响更加显著;在流动性越差的公司,移动互联网用户情绪对股票期望收益的影响也越显著。
在移动互联网高速发展的背景下,本文对移动互联网用户情绪对股票收益的影响进行了有意义的探索,为移动互联网时代投资者做出更好的投资决策提供了新的视角。与PCs对比,移动互联网为投资者提供了随时随地发布、获取信息的平台渠道,移动互联网投资者也表现出独特的行为,如Kim et al.(2016)发现移动端的非专业投资者更容易受到社会化媒体情绪的影响,表现出更显著的羊群行为。在本文,我们发现移动互联网用户对股票未来收益预期存在系统性偏差,其情绪对股票收益产生了更加显著的影响,即被移动互联网用户关注或讨论更高的股票具有更高风险溢价。因此,本文研究结论对指导投资者在移动互联网时代的投资决策具有重要意义。
在未来研究方面,还有以下几点需要进一步研究。第一,本文研究区间只有64周,随着互联网技术和资本市场的成熟,雪球网数据将更加完善,本文的结论是不是具有稳健性,还需要进一步通过不同时间段和不同市场样本检验本文主要结论的稳健性。第二,虽然ROST CM6文本分析工具是对用户讨论信息情感的直接度量,但是其精确度有待进一步提高,今后可以运用人工智能、机器学习等更先进的方法对用户发布的文本信息进行更精确的情感度量,提高其对股票收益预测的正确率。第三,关于移动互联网用户行为特征的研究是未来需要深入研究的课题,尤其是移动互联网用户行为与PCs端用户行为有何本质差异,对资本市场带了怎样不同的影响,都需要进一步研究。
[] |
陈收、曹雪平, 2007, “不同态势下β特征及其与收益关系研究”, 《管理科学学报》, 第 1 期, 第 71-78 页。DOI:10.3321/j.issn:1007-9807.2007.01.009 |
[] |
郭多祚、徐占东, 2002, “中国股票市场Beta和收益关系的实证分析”, 《财经问题研究》, 第 11 期, 第 50-52 页。DOI:10.3969/j.issn.1000-176X.2002.11.012 |
[] |
黄润鹏、左文明、毕凌燕, 2015, “基于微博情绪信息的股票市场预测”, 《管理工程学报》, 第 1 期, 第 47-52 页。DOI:10.3969/j.issn.1004-6062.2015.01.006 |
[] |
宋泽芳、李元, 2012, “投资者情绪与股票特征关系”, 《系统工程理论与实践》, 第 1 期, 第 27-33 页。DOI:10.3969/j.issn.1000-6788.2012.01.004 |
[] |
Antweiler W, Frank M Z, 2004, "Is all that talk just noise? The information content of internet stock message boards". The Journal of Finance, 59(3), 1259–1294.
DOI:10.1111/j.1540-6261.2004.00662.x |
[] |
Amihud Y, 2002, "Illiquidity and stock returns:cross-section and time-series effects". Journal of financial markets, 5(1), 31–56.
DOI:10.1016/S1386-4181(01)00024-6 |
[] |
Baker M, Stein J C, 2004, "Market liquidity as a sentiment indicator". Journal of Financial Markets, 7(3), 271–299.
DOI:10.1016/j.finmar.2003.11.005 |
[] |
Baker M, Wurgler J, 2006, "Investor sentiment and the cross-section of stock returns". The Journal of Finance, 61(4), 1645–1680.
DOI:10.1111/j.1540-6261.2006.00885.x |
[] |
Böhmer M, Hecht B and Bauer G, 2011, "Falling asleep with Angry Birds, Facebook and Kindle: a large scale study on mobile application usage", Conference on Human-Computer Interaction with Mobile Devices and Services, Mobile Hci 2011, Stockholm, Sweden, August 30-September. DBLP, 47-56.
|
[] |
Bollen J, Mao H and Zeng X, 2011, "Twitter mood predicts the stock market". Journal of Computational Science, 2(1), 1–8.
|
[] |
Brown G W, Cliff M T, 2004, "Investor sentiment and the near-term stock market". Journal of Empirical Finance, 11(1), 1–27.
DOI:10.1016/j.jempfin.2002.12.001 |
[] |
Carhart M M, 1997, "On persistence in mutual fund performance". The Journal of finance, 52(1), 57–82.
|
[] |
Constantiou I D, Lehrer C and Hess T, 2014, "Changing information retrieval behaviours:an empirical investigation of users' cognitive processes in the choice of location-based services". European Journal of Information Systems, 23(5), 513–528.
DOI:10.1057/ejis.2014.12 |
[] |
De Long J B, Shleifer A and Summers L H, 1990, "Positive feedback investment strategies and destabilizing rational speculation". The Journal of Finance, 45(2), 379–395.
DOI:10.1111/j.1540-6261.1990.tb03695.x |
[] |
Fama E F, French K R, 1993, "Common risk factors in the returns on stocks and bonds". Journal of financial economics, 33(1), 3–56.
|
[] |
Fama E F, French K R, 2015, "A five-factor asset pricing model". Journal of Financial Economics, 116(1), 1–22.
|
[] |
Fang L, Peress J, 2009, "Media coverage and the cross-section of stock returns". The Journal of Finance, 64(5), 2023–2052.
DOI:10.1111/j.1540-6261.2009.01493.x |
[] |
Ghose A, Goldfarb A and Han S P, 2013, "How Is the Mobile Internet Different? Search Costs and Local Activities". Information Systems Research, 24(3), 613–631.
DOI:10.1287/isre.1120.0453 |
[] |
Goetzmann W N, Kim D and Kumar A, 2015, "Weather-induced mood, institutional investors, and stock returns". Review of Financial Studies, 28(1), 73–111.
DOI:10.1093/rfs/hhu063 |
[] |
Hirshleifer D, Shumway T, 2003, "Good Day Sunshine:Stock Returns and the Weather". The Journal of Finance, 58(3), 1009–1032.
DOI:10.1111/1540-6261.00556 |
[] |
Kim, K. Lee, SY. and Kauffman, R.J, 2016, "Social sentiment and stock trading via mobile phones", Proceedings of the 22nd Americas Conference on Information Systems: Surfing the IT Innovation Wave, AMCIS 2016; San Diego, United States, August 11-14.
|
[] |
Koenig-Lewis N, Palmer A and Moll A, 2010, "Predicting young consumers' take up of mobile banking services". International journal of bank marketing, 28(5), 410–432.
DOI:10.1108/02652321011064917 |
[] |
Merton R C, 1987, "A simple model of capital market equilibrium with incomplete information". The journal of finance, 42(3), 483–510.
DOI:10.1111/j.1540-6261.1987.tb04565.x |
[] |
Mossin J, 1966, "Equilibrium in a Capital Asset Market". Econometrica, 34(4), 768–783.
DOI:10.2307/1910098 |
[] |
Paredes J C M, Ming C S and Ma T, et al, 2016, "The influence of smart phone apps on trading behavior", The Conference on the Theories and Practices of Securities and Financial Markets.
|
[] |
Sprenger T O, Tumasjan A and Sandner P G, 2014, "Tweets and trades:The information content of stock microblogs". European Financial Management, 20(5), 926–957.
DOI:10.1111/eufm.v20.5 |
[] |
Solt M E, Statman M, 1988, "How useful is the sentiment index?". Financial Analysts Journal, 44(5), 45–55.
DOI:10.2469/faj.v44.n5.45 |
[] |
Yamaguchi T, 2006, "Understanding Trading Behavior in 401(K) Plans". Social Science Electronic Publishing(wp125).
|