著名思想家伏尔泰说,生命在于运动。这句话不仅仅是关于运动观和生命观的哲学宣言,更在于一方面运动可以提高个人的健康水平,既包括身体的健康,又包括心理的健康(高亮、王莉华,2015);另一方面,运动还可以磨炼个人的意志力,提高生活满意度和主观幸福感(陈章源、於鹏,2015)。既然运动锻炼的益处如此之多,为什么锻炼的现状仍不容乐观呢?
根据2018年《健康管理蓝皮书:中国健康管理与健康产业发展报告》数据显示,2017年国民不参与体育锻炼的比例为35.9%,成人经常锻炼率仅为18.7%,同时在参与锻炼的人群中,每周锻炼时间达标人数占比仅有24%(武留信等,2018)。此外,根据国家体育总局《2014年全民健身活动状况调查公报》显示,20岁以上人群不参加体育锻炼的原因中,“没时间”的所占比例最高为30.6%,其次为“没兴趣”占比11.6%,其他原因包括诸如“缺乏场地设施”(10.0%)以及“惰性”(8.4%)等等。为了促进人民健康水平的提升,2019年7月《健康中国行动(2019-2030年)》出台,文件指出缺乏身体活动已经成为慢性病发生的主要原因之一。然而,如何引导既“没时间”也“没兴趣”的居民主动参与体育锻炼,提高城乡居民的体育锻炼参与率值得深思。
与此同时,近年来中国的国内生产总值与居民收入水平的增速不断放缓。中国经济进入新常态,经济增长速度下行压力不断增大,相对应的是,中国的居民收入增长速度也在不断下降。国家统计局数据显示,中国城镇单位就业人员平均实际工资指数(上年=100)由2002年的115.4波动下降至2016年106.7,为近十多年来的最低点①。因而,如何促进居民收入的进一步增长更加值得深入思考。
① 数据来源:国家统计局网站http://data.stats.gov.cn/easyquery.htm?cn=C01。
在此现实背景下,研究锻炼的收入效应,一方面可以为如何吸引更多的人参与到锻炼中来提供新的思路,从而提高居民的体育锻炼参与率;另一方面又可以在经济增长不断放缓的局势下,另辟蹊径通过提高体育锻炼率来增加居民的收入,尤其在当前中国居民的锻炼参与潜力巨大的背景下,更是意义重大。
鉴于此,本研究基于2014-2016年中国劳动力动态调查数据,就个体的锻炼行为对收入水平的影响进行实证研究。为了克服可能存在的内生性和样本选择偏差问题,本文采用固定效应模型、工具变量以及倾向性匹配得分法进行实证研究,研究发现在中国劳动力市场中确实存在锻炼的收入溢价效应,同时各种稳健性检验也证明了研究结论的可靠性。此外,通过对可能的作用机制进行检验,发现锻炼会通过影响个体的健康水平、外貌状况以及对待工作的态度,从而最终影响个体的收入水平。最后,本文还就不同年龄阶段和受教育程度的个体进行异质性分析发现,从年龄阶段上看,锻炼的收入效应只存在于青年阶段和中年阶段,且青年阶段的作用机制主要是外貌状况,而中年阶段的作用机制主要是健康水平;同时从教育程度上看,锻炼的收入效应主要存在于中等教育程度的样本群体。
本文的贡献主要体现在两个方面:第一,本文系统研究了在有巨大居民锻炼参与潜力挖掘的中国,个体的锻炼行为与收入水平之间的关系,并检验了锻炼影响收入的作用机制,为引导居民参与锻炼带来的巨量经济价值提供经验支持;第二,本文通过各种计量实证工具有效克服个体锻炼行为的内生性,有效识别了锻炼与收入之间的因果关系,同时针对不同特征的样本进行异质性分析,从而可以为政府制定相关政策提出针对性建议。
文章的结构安排如下:第二部分对已有研究文献进行梳理;第三部分是本研究所使用的数据说明和相关变量描述;第四部分是模型设定和识别的策略;第五部分是实证结果,探讨锻炼行为对收入水平的影响;第六部分是机制分析部分;第七部分进一步讨论了锻炼影响收入水平的异质性;最后是文章的结论。
二、文献综述关于运动锻炼对收入水平的影响的研究,最早源于Long and Caudill(1991)研究在美国大学时期担任运动员对未来收入水平的影响,研究发现,相对于非运动员,大学时期的运动员在年收入水平上会高出4%。此后,Ewing(1995)利用1986年NLSY的调查数据研究了高中时期的运动参与对于黑人男性未来工资水平的影响,研究表明,高中时期参与运动可以带来未来收入水平10.85%的增加;同时Ewing(1998)继续使用1990年的NLSY的调查数据研究发现,高中时期的运动参与可以带来未来收入水平的增加,主要是因为高中参加运动的个体更有可能进入到劳动力市场表现更好的工作岗位。虽然Ewing的研究将运动锻炼对收入水平的影响从大学时期的经历拓展至高中时期的运动锻炼经历,但是在识别策略上并没有实质性的改进,而这一问题在研究该类问题上至关重要。
在研究个体锻炼行为对其收入水平的影响时,即使是研究个体的锻炼行为对未来收入水平的影响,可能也会存在较为严重的内生性问题,即识别的问题,而这一问题如果不克服的话则会导致估计结果的有偏。这是因为在回归的过程中可能会存在遗漏了个体的禀赋能力这一重要变量,而个体的禀赋能力可能既会影响到是否参与运动锻炼行为,同时也会影响到个体的收入水平。在锻炼影响收入这一研究问题的识别上,Barron et al.(2000)最早通过寻找外生的工具变量并利用2SLS估计高中时期的体育锻炼对劳动力市场表现的影响,采用的外生工具变量包括高中学校的规模、父母的收入水平、学生的健康水平、是否私立学校以及高中学校所在地区的特征,研究结论为高中的体育锻炼可以带来工资率4.2%~14.8%的增加;随后,Lechner and Sari(2015)利用加拿大的人口健康调查数据,通过采用滞后一期的锻炼行为作为工具变量研究锻炼对个体劳动力市场表现的长期影响,研究表明锻炼行为可以为个体带来10%~20%收入水平的增加。
此外,研究锻炼行为与收入水平的关系时还会面临着个体自选择的问题,例如教育水平更高的个体更倾向于进行锻炼,因此个体是否锻炼所带来的劳动力市场表现的差异,可能不仅仅来源于个体锻炼行为的差异,还会反映在不同组之间其他维度的差异,这一问题在计量经济学文献中被称为选择性偏差。对于这一问题,Lechner(2009)利用1984-2006年德国社会经济调查面板数据,通过使用倾向得分匹配方法消除选择性偏差问题,实证研究发现参与锻炼可以为个体带来5%~10%收入水平的增加,而这一收入溢价与个体多接受一年教育的边际回报率相近;同时,Dewenter and Giessing(2014)同样也利用德国社会经济调查面板数据,通过匹配方法中的最近邻匹配方法研究得出,相比于非精英运动员,精英运动员的收入水平更高,且这一效应在团体运动中表现更为显著。
那么,参与运动或锻炼行为为什么会影响个体的收入水平呢?关于个体早年尤其是学生时代运动的经历会对未来劳动力市场的表现产生影响,主要有以下两种解释:第一,根据Becker(1965)的时间配置模型,在个人时间有限的情况下,运动会导致在学习方面时间的压缩,从而带来人力资本投资的不足,进而导致劳动生产效率的降低,最终使得收入水平降低(Long and Caudill, 1991);同时,也有研究表明学生时期的运动锻炼能够促进受教育水平的提高,这是因为学习成绩不仅受到学习时间还会受到学习效率的影响,从而对未来收入水平具有积极影响(Barron et al., 2000;Rees and Sabia, 2010;Cornelisen and Pfeifer, 2010)。第二,根据Spence(1973)的信号理论,学生时代运动的经历可以作为人格特征的体现,这是因为运动锻炼大多数是自我控制力强、具有坚强毅力与合作精神的代名词,从而被认为具有更高的劳动生产率,在劳动力市场上更受雇主的青睐,因而会对劳动力市场表现产生积极的影响(Long and Caudill, 1991;Ewing, 1998)。而关于非学生时代个体的锻炼行为对收入水平的影响机制,根据已有研究,本文认为有以下几种可能的解释:
第一种解释是个体的锻炼行为可以促进健康水平的提高,进而带来收入水平的提高。无论是在医学文献还是在流行病学文献中,个体的运动锻炼行为对生理健康状况的积极影响都是广泛存在的。此外,实证研究还发现运动锻炼行为对个体的心理健康状况也具有显著的积极影响(Gomez, 2008)。与此同时,个体的健康状况是劳动力市场中劳动生产率的重要影响因素,因为如果个体的健康状况得到了提升,则会对劳动生产率的提高产生积极影响,最终提高个体在劳动力市场中的收入水平(Currie and Madrian, 1998),关于这一问题的研究在中文文献中也有类似的结论(魏众,2004;田艳芳,2013)。
第二种解释是个体的锻炼行为可以促进外貌水平的提升,进而带来收入水平的提高。已有实证研究发现,在工作之余的锻炼行为可以控制身体的体重,从而降低个体肥胖发生的可能性(Lakdawalla and Philipson, 2007)。而近年来,在东亚国家普遍审美都是以瘦为美,在中国更是如此,因而个体的锻炼行为可以促进外貌水平的提升。同时,已有的大量研究表明,在劳动力市场中美貌可以为劳动者带来收入水平的提高,这在劳动经济学中被称之为“美貌溢价”(Hamermesh and Biddle, 1993;Cawley, 2004),且在中国的劳动力市场中也同样广泛存在美貌的收入溢价(江求川、张克中,2013;郭继强等,2017)。
第三种解释是个体的锻炼行为可以促进非认知性技能水平的提升,进而带来收入水平的提升。运动锻炼可以促进非认知水平的提升,包括自我控制能力、自律能力、坚强毅力以及合作精神等各个方面(Alchian and Demsetz, 1972)。同时,研究发现无论是认知性技能水平还是非认知性技能水平,对于个体在劳动力市场中的收入而言都是同等重要的(Lindqvist and Vestman, 2011);甚至还有研究发现,相对于认知性技能水平而言,非认知性技能水平对于收入水平的影响更为重要(Heckman et al., 2006)。
综上所述,个体的锻炼行为可能会通过各种不同的渠道作用于收入水平。而在目前具有巨大居民参与锻炼潜力的中国,个体的锻炼行为对收入是否有影响,以及通过什么渠道对收入水平产生影响?无疑,这些问题对目前还处于发展中国家,且居民收入水平仍有待大幅提高的中国是极其重要的。首先,关于中国个体锻炼行为对收入水平影响的文献还是非常少见的,因此,本研究是对现有文献的补充;其次,本研究应用各种计量实证策略对个体锻炼行为可能存在的内生性问题进行处理,因而研究的结论是锻炼行为与收入水平之间的因果关系而非相关关系;最后,本文的研究可以帮助个人和政府全面认识锻炼行为的作用和影响,对于个人而言,可以为个人理性地进行体育锻炼决策提供参考,而对于政府而言,可以为政府采取各种措施鼓励更多居民参与到体育锻炼中来提供经验上的依据。
三、数据与变量 (一). 数据来源本研究使用中山大学社会科学调查中心自2012年开始实施的中国劳动力动态调查(简称CLDS)数据①。但是由于2012年CLDS数据缺少对本研究的关键解释变量个体锻炼行为的调查,因而本文使用的是2014年和2016年劳动者个体调查数据,其中2014年CLDS数据涉及劳动者个体问卷23593份;2016年涉及个体问卷21086份。
① CLDS数据采用多阶段、多层次与劳动力规模成比例的概率抽样方法,包含劳动者个体、家庭和社区三个层面,调查范围涉及全国29个省、自治区、直辖市(不含港澳台、西藏和海南)。CLDS个体调查问卷的调查对象为15~64周岁以及65周岁以上但仍然在工作的人口,调查内容涵盖劳动者的背景情况、工作相关情况、劳动者状态以及健康状况等众多问题,其中也包含了劳动者的锻炼行为和收入情况等方面的信息。
同时,由于个体所在地的宏观经济特征可能会同时影响个体的锻炼行为和收入水平,因而在研究个体的锻炼行为对其收入水平的影响时,需要控制个体所在城市的宏观经济特征,城市层面的宏观数据来源于《中国城市统计年鉴》。
(二). 变量选择本文研究劳动力市场中个体锻炼的收入效应,因此被解释变量为个体的收入水平,关键解释变量为个体的锻炼情况。根据CLDS数据中问卷的问题设置,主要变量的说明如下:
收入水平。CLDS数据中关于劳动者收入水平的调查包括劳动者各类收入总计、扣除个税社保以及住房公积金后的工资性收入、不扣除个税社保以及住房公积金后的工资性收入等各个方面。考虑到在实际中,城镇居民除了拥有工资性收入外,可能还存在其他兼职以及家庭经营性收入等,而农村居民可能还会有农业收入等。劳动者的各类收入总计涵盖了农业收入、工资性收入以及经营性收入等,从而是衡量劳动者收入水平的综合指标,因而采用劳动者的各类收入总计作为个体收入水平的综合衡量指标。同时,调查数据中个体的工资性收入作为收入水平的其他衡量指标,在稳健性检验部分重新估计锻炼对收入水平的影响。
锻炼情况。CLDS数据中关于个体锻炼情况的调查包括三个方面:是否进行有规律的锻炼、锻炼的方式以及每周锻炼的时间。考虑到个体锻炼的方式差异较大①,同时本研究主要关注锻炼对收入的一般效应,而不针对特定种类的锻炼方式进行分析,因而本研究主要采用个体是否进行有规律的锻炼作为锻炼情况的衡量指标。而每周锻炼的时间根据个体平均每周锻炼次数和平均每次锻炼时间计算得到,这一变量也作为个体锻炼情况的衡量指标在稳健性检验部分重新估计锻炼对收入水平的影响。
① 根据2016年CLDS数据,个体进行有规律的锻炼方式主要依次包括走路(52.20%)、跑步(22.84%)、球类运动(9.06%)、游泳(2.59%)以及其他等(12.85%)。
控制变量。根据已有关于个体收入水平的研究,控制变量包括其他影响收入水平的个体特征,具体包括:性别、年龄、年龄的平方、受教育水平、是否有配偶、政治面貌以及村居类型。同时,考虑到个体所在地的宏观经济特征会同时影响个体的锻炼行为和收入水平,如个体的收入水平显然与城市的经济发展水平相关,而城市的经济发展水平也会影响着人们的生活方式,当然也包括是否锻炼的习惯,因而在研究个体的锻炼行为对其收入水平的影响时需要控制个体所在城市的宏观经济特征。本研究选取城市层面的宏观经济特征主要包括用来衡量城市经济发展水平的人均GDP,以及用来衡量城市经济结构的第二和第三产业产出占GDP比重。此外,考虑到地区层面可能还会存在一些不可观测因素会同时影响到个体的收入水平和锻炼行为,因而本研究还控制了个体所在省份虚拟变量。
表 1为主要变量的描述性统计。从样本的基本特征上来看,本研究所选取的样本中女性占44%,平均年龄约为45.24岁,平均受教育水平约在初中至高中之间,91%有配偶,中共党员所占比例为9%,33%的受访样本居住在城市。从锻炼情况上来看,个体进行有规律锻炼的比例为23%。
![]() |
表 1 主要变量的描述性统计 |
① 受教育水平分为初中以下、初中、高中/中专、大专以及大学本科以上5种类型。
② 配偶情况分为有配偶和无配偶,其中有配偶包括初婚、再婚和同居,无配偶包括未婚、离异和丧偶。
四、模型与识别 (一). 模型设定为了研究个体的锻炼行为对其收入水平的影响,本文在Mincer(1974)收入方程的基础上引入个体锻炼行为的变量,构建锻炼影响个体收入水平的计量模型如(1)所示:
$ Ln{\left({income} \right)_i} = {X_i}\gamma + {\beta _1}\;exercis{e_i} + {\varepsilon _i} $ | (1) |
其中,Ln(income)i表示个体i收入水平的对数;exercisei表示个体i的锻炼情况,是一个0-1虚拟变量;Xi表示控制变量,包含个体的个人特征、城市宏观经济特征以及所在省份虚拟变量。其中个人特征变量包括性别、年龄、年龄平方、受教育水平、配偶情况、政治面貌以及村居类型;城市宏观经济特征包括人均GDP以及第二产业和第三产业产出占GDP比重;β1为关键解释变量的系数,表示个体锻炼行为对收入水平的影响,即本研究所关注的重点;γ为控制变量的系数向量;εi为不可观测的随机扰动项。
在估计个体锻炼行为与其收入水平之间的因果关系时会面临内生性问题,主要来源包括以下三个方面:第一,遗漏变量偏差问题,实证中可能会存在一些无法观测的因素,如个体性格特征中的自制力与毅力等,这些因素可能既会影响个体的锻炼行为又会影响其收入水平,使得计量模型中的随机扰动项与关键解释变量之间具有相关性,从而产生内生性问题;第二,联动性偏差问题,个体的收入水平与锻炼行为之间可能具有反向因果的关系,即收入水平更高的个体可能更倾向于关注于自身的健康状况从而锻炼意识更强,使得个体的锻炼情况并非随机事件;第三,样本选择偏差问题,通过个体的锻炼行为将样本划分为锻炼组和不锻炼组,但这两组样本之间可能会存在较大的差异,如个体受教育水平的提高可能选择进行规律性锻炼的概率更高,从而使得锻炼组与不锻炼组之间存在样本差异,因而可能会产生样本选择偏差问题。研究中以上任一原因产生的内生性问题都会导致参数估计的有偏和不一致性。
(二). 识别策略对于研究个体锻炼行为与收入水平之间关系的内生性问题的解决,本研究主要采用以下几种做法:第一,针对遗漏变量偏差问题,一方面采用尽可能多的既影响个体收入水平又影响锻炼情况的控制变量,在本研究中除了控制个体基本特征变量外,还控制了个体所在城市的宏观经济特征以及所在省份虚拟变量,另一方面利用面板数据模型中的固定效应模型消去不随时间变化的不可观测因素的影响,从而解决不随时间变化的个人特征等变量带来的遗漏变量偏差问题;第二,针对联动性偏差问题,采用工具变量估计个体锻炼行为与收入之间因果效应;第三,针对样本选择偏差问题,通过倾向匹配法来降低样本选择带来的估计偏差问题。
1.面板数据模型
对于可能存在的遗漏变量偏差问题带来的内生性问题的解决,本研究采用面板数据模型中的固定效应模型来消除不可观测因素的影响,构建锻炼影响个体收入水平的面板数据计量模型如(2)所示:
$ Ln{\left({income} \right)_{it}} = {X_{it}}\gamma + {\beta _1}\;exercis{e_{it}} + {c_i} + {\varepsilon _i}_t $ | (2) |
其中,Ln(income)it表示t时期个体i收入水平的对数;exerciseit表示t时期个体i的锻炼情况;Xit表示控制变量;ci表示不随时间变化的个体异质性,如性格特征等;β1为关键解释变量系数,表示个体锻炼行为对收入水平的影响,即本研究所关注的重点;γ为控制变量的系数向量;εit为不可观测的随机扰动项。
对于固定效应模型,给定个体i,将模型(2)的两边对时期t取平均,同时与原模型取差,可以得到原模型的离差形式,同时通过重新定义变量的离差可以得到:
$ Ln{\left({income} \right)_{it}} = {X_{it}}\gamma + {\beta _1}\;exercis{e_{it}} + {\varepsilon _i}_t $ | (3) |
其中,Ln(income)it表示个体收入水平的组内离差;exerciseit表示个体锻炼行为的组内离差;Xit表示控制变量的组内离差;εi表示随机扰动项的组内离差。由于不可观测的个体异质性ci已被消去,因而εit与Xit不相关,从而可以通过使用OLS一致估计锻炼对个体收入水平的影响系数β1。
2.工具变量法
由于内生性问题的另一来源是个体收入水平与锻炼行为之间反向因果,在这种情况下,处理内生性问题的通常办法是寻找工具变量,采用两阶段估计获得无偏的参数估计。对于工具变量的选择,本文首先考虑个体基期的锻炼情况作为当期锻炼情况的工具变量,但一方面由于2012年CLDS数据并未对个体的锻炼情况进行调查,从而本研究只能使用2014年和2016年数据,另一方面CLDS项目采用轮换追踪的方式进行调查,而每年都有将近一半的样本为新增样本,因此采用个体基期的锻炼情况作为工具变量将会使得研究样本限制至2016年的追踪样本,从而导致样本量的大量丧失。因此,本研究将个体基期锻炼情况作为工具变量的回归只是作为稳健性检验,而并未作为研究的主要工具变量。
同时,借鉴尹志超、甘犁(2010)关于饮酒的收入效应研究中工具变量的选择,考虑到锻炼行为也具有从众和同群效应,当一个人长期处于有人锻炼的环境之中,可能也会更容易选择进行有规律性的锻炼。因此本研究选择家庭中除了研究个体外的调查成员中进行有规律性锻炼的比例作为家庭锻炼氛围的衡量指标。本文认为,家庭锻炼氛围对个体的锻炼行为具有直接的影响,同时由于这一指标的构建排除了研究对象本身的锻炼情况,从而对研究对象的收入水平并没有非常直接的影响。此外,为了更好的满足排他性约束,本研究还控制了个体所在城市的宏观经济特征变量以及所在省份虚拟变量。根据表 2一阶段回归结果可知,个体家庭锻炼氛围会显著影响其锻炼的概率,从而从统计上检验了工具变量个体家庭锻炼氛围与内生变量个体锻炼行为之间的相关性。
![]() |
表 2 工具变量的一阶段回归结果 |
3.倾向匹配得分法
在估计锻炼的收入效应时,虽然已经通过加入个体的特征变量、所在城市的宏观经济特征以及所在省份虚拟变量等控制变量来解决模型中可能存在的内生性问题,但仍然可能存在样本选择偏差的问题。这是因为通过是否锻炼将样本划分为两类不同的组,进行规律性锻炼的个体(锻炼组)和不进行规律性锻炼的个体(不锻炼组)。相对于不锻炼组而言,锻炼组可能拥有与不锻炼组显著不同的特征,例如锻炼组可能具有更高的教育水平等,从而两组之间的差异将不仅体现在是否锻炼方面,还会有其他方面的显著差异,因此可能会产生选择偏差问题(Heckman,1999)。对于此类问题,可以通过倾向匹配得分法(简称PSM)获得匹配估计量(Rosenbaum and Rubin, 1983)。
假设个体i属于锻炼组,匹配估计量的基本思路是找到属于不锻炼组的某个体j使得个体i与个体j的可观测变量取值尽可能相似(匹配),即Xi≈Xj。在本研究中个体可观测变量既包括个体的性别、年龄、受教育程度等基本的人口学特征,也包括城市宏观经济特征以及所在省份等变量,因而可以假定回归方程中已包括了所有与关键解释变量相关的变量。从而基于可忽略性假定,个体i与个体j进入锻炼组的概率相近,具有可比性。因此可将Ln(income)j作为个体i若不锻炼的工资水平Ln(income)0i的估计量,此时Ln(income)i-Ln(income)j即为个体i锻炼所带来的收入效应的度量。对锻炼组的每位个体都进行如此匹配,再对不锻炼组的每位个体也进行匹配,然后对每位个体的工资效应进行平均,即可得到匹配估计量。
在实证研究过程中,使用倾向得分匹配估计个体锻炼行为对其收入水平影响的过程可以分为三个步骤:第一,给定个体特征变量与关键解释变量个体是否锻炼,利用logit模型估计倾向得分,进行倾向得分匹配p(X),并将其作为个体选择规律性锻炼的条件概率;第二,根据倾向匹配得分进行倾向性平衡检验;第三,根据匹配后的样本计算出锻炼者的平均处理效应(ATT),如(4)所示:
$ \widehat {ATT} = \frac{1}{{{N_1}}}\sum\limits_{i:{D_i} = 1}^{{N_1}} {\left[ {Ln{{\left({income} \right)}_i} - Ln{{\left({\widehat {income}} \right)}_0}_i} \right]} $ | (4) |
其中,N1=∑iDi为锻炼组中个体的数量,而
表 3中第(1)列和第(2)列报告了模型(1)的回归估计结果。其中第(1)列仅包含关键解释变量个体的锻炼情况,不控制任何其他变量;第(2)列加入个体特征、城市宏观经济特征以及所在省份虚拟变量等控制变量。第(3)列报告了面板数据模型中固定效应模型的回归估计结果,由于面板数据中的固定效应模型无法估计不随时间变化的变量系数,因而即使第(3)列控制个体所在省份的虚拟变量也无法估计其参数。表 3中第(4)列报告了工具变量回归估计结果。此外,考虑到同一城市的个体之间可能具有相关性,因而所有回归系数使用聚类至城市层面的聚类稳健标准误。
![]() |
表 3 收入方程的估计结果:锻炼的收入效应 |
本研究关注的是个体是否进行有规律性锻炼对其收入水平的影响。在不考虑任何其他控制变量的情况下,表 3中第(1)列OLS结果显示,进行有规律性锻炼可以带来个体40.6%的收入溢价;在控制了个体性别、年龄、受教育年限等基本的人口学特征变量、所在城市宏观经济特征变量以及所在省份虚拟变量后,第(2)列中个体锻炼情况的系数有较大幅度的下降但仍在1%的显著性水平下为正,个体锻炼可以带来6.5%的收入溢价;表 3中第(3)列的固定效应模型估计结果显示,在消去不随时间变化且不可观测的个体异质性特征的影响后,个体锻炼可以带来6.4%的收入溢价,且在10%的显著性水平下显著。
表 3中第(4)列采用工具变量回归克服内生性问题的估计结果显示,个体进行有规律的锻炼能够带来20.6%的收入溢价,且这一系数在1%的显著性水平下显著,同时一阶段回归F统计量大于10,说明工具变量通过弱工具变量检验,此外工具变量的估计结果是OLS估计结果的3倍以上,表明OLS估计存在较大的偏误。综上,无论是通过控制各种变量的OLS估计结果,还是面板数据模型中的固定效应估计结果,甚至是工具变量回归结果,都说明了个体的锻炼行为具有显著的收入溢价效应。
此外,从表 3中还可以得出其他控制变量对个体收入水平的影响,但同时也应当认识到此时控制变量的系数并非是对收入水平的因果效应。例如,从个体特征变量上来看,女性的收入显著低于男性;年龄对收入具有显著的正向影响,年龄的平方对收入的影响显著为负,这说明随着年龄的增长,个人的收入呈现先上升后下降的倒“U”型变化趋势;教育水平是影响收入的重要变量,对收入具有显著的正向影响;有配偶的个体收入显著高于无配偶的个体;党员的收入显著高于其他个体;城市个体的收入显著高于农村个体的收入。这些结论与以往的研究结论基本一致,也可以说明模型和数据的可靠性。
(二). 倾向匹配得分法为了解决模型估计存在的样本选择偏差问题,使用倾向匹配得分法重新估计个体锻炼行为对收入水平的影响。在使用倾向得分匹配方法时,需要检验锻炼组和不锻炼组两个样本组之间的平衡性问题,即经过匹配以后,锻炼组与不锻炼组之间除了收入水平存在显著差异外,在解释变量之间已经不存在显著的差异。实证研究中常见的匹配方法包括邻近匹配法、半径匹配法以及核匹配法。邻近匹配法下锻炼组与不锻炼组匹配前和匹配后的平衡性检验结果如表 4所示。
![]() |
表 4 解释变量间的平衡性检验 |
从表 4中可以得出,锻炼组和不锻炼组在匹配前除性别外均具有显著的差异,但匹配后各个特征变量的偏误均具有较大比例的下降,最高的下降比例为配偶情况,下降比例为98.9%;最低的下降比例为年龄,下降比例为85.6%;所有特征变量的偏误比例都下降至5%以下,说明倾向得分匹配法大大降低了锻炼组和不锻炼组两个样本组之间的差异。同时,t检验表明匹配后两组特征变量之间的差异在统计上并不显著。因而,使用倾向匹配法匹配后的样本通过平衡性检验,即锻炼组和不锻炼组之间进行匹配所使用的解释变量不存在系统性差异,可以大大消除自选择所产生的选择偏误。
表 5报告了三种倾向得分匹配方法(临近匹配、半径匹配和核匹配)下的锻炼组的平均处理效应(ATT)、不锻炼组的平均处理效应(ATU)以及总体平均处理效应(ATE),所有特征变量包括个体的个人特征、所在城市的宏观经济特征以及省份虚拟变量。整体来看,近邻匹配、半径匹配以及核匹配这三种匹配方法并没有对匹配的结果造成太大的差异。匹配估计结果表明,在消除了由于锻炼组和不锻炼组的可观测异质性所引起的选择性偏差后,锻炼的个体要比不锻炼个体的收入水平高出10%左右。总体上来看,倾向性得分匹配法在修正了选择性偏差问题后,仍能得到锻炼对个体的收入水平具有显著的正向影响。
![]() |
表 5 倾向匹配法下锻炼的收入效应 |
1.采用不同的工具变量
考虑到本研究所使用的数据类型为面板数据,因而可以采用滞后一期的关键解释变量作为内生变量的工具变量,对于本研究而言,可以利用2014年个体的锻炼情况作为个体2016年锻炼情况的工具变量。这是因为一方面个体当期的锻炼情况与滞后一期的锻炼情况高度相关,如表 6中第(1)列~第(3)列所示,个体基期锻炼对当期进行有规律性的锻炼具有显著的正向影响;另一方面个体基期的锻炼情况由于已经发生,因而从当期角度来看为前定变量,故与当期的随机扰动项不相关。
![]() |
表 6 稳健性检验1:不同的工具变量 |
表 6中第(4)列为工具变量估计结果,从中可以得出:个体进行有规律性的锻炼能够带来21.9%的收入溢价,且这一系数在10%的置信水平下显著,同时一阶段回归的F统计量大于10,说明了工具变量通过弱工具变量检验,这一系数与前文基准回归模型中个体锻炼情况对其收入水平影响的工具变量估计系数较为相近,从而证明了锻炼的收入溢价效应稳健存在。
2.采用删除极端值的样本
本研究关注的是个体锻炼行为对其收入水平的影响,而由于个体的收入水平可能存在极端值问题,同时回归分析实质上是均值回归,从而可能会受到极端值的影响。因此,本研究删除个体收入水平低于1%和高于99%的个体样本,重新回归检验估计结果的稳健性,估计结果如表 7第(1)列所示。从中可以得出:个体进行有规律性的锻炼能够带来17.7%的收入溢价,且这一系数在1%的置信水平下显著,虽然锻炼对个体收入的影响系数有所下降但依然显著,说明了研究结论的稳健性。
![]() |
表 7 稳健性检验2:不同的样本与变量衡量指标 |
3.采用不同的锻炼指标
作为个体锻炼情况的衡量指标,除了可以采用个体是否进行有规律性的锻炼这一离散型指标外,还可以采用个体每周的锻炼时间作为连续性衡量指标。个体每周锻炼的时间根据个体平均每周锻炼次数和平均每次锻炼时间计算得到,采用这一指标衡量个体锻炼情况对收入水平影响的工具变量估计结果如表 7第(2)列所示。从中可以得出:个体每周锻炼的时间翻一倍,能够带来个体收入水平13%的增加,且这一影响系数在1%的置信水平下显著。这说明即使更换个体锻炼情况的衡量指标,也可以得到锻炼的收入溢价效应。
4.采用不同的收入指标
由于CLDS数据关于劳动者个体的收入进行了详细的调查,因此除了通过各类收入总计作为个体收入水平的衡量指标外,还可以采用扣除个税社保住房公积金的工资性收入、不扣除个税社保住房公积金的工资性收入以及工资率①来衡量个体收入水平的高低。
① 个体工资率为小时工资率,利用个体全年各类总收入和周平均工作时间计算得到,计算公式为小时工资率=年总收入/(周工作时间*52)。
使用个体不同的收入衡量指标来重新估计锻炼对个体收入水平的影响,工具变量估计结果如表 7第(3)~(5)列所示。从中可以得出:个体进行有规律性的锻炼对扣除个税社保住房公积金的工资性收入、不扣除个税社保住房公积金的工资性收入以及小时工资率均具有显著的正向影响。这说明,即使更换个体收入水平的不同衡量指标,也可以得到锻炼对个体收入水平的显著积极影响。
六、机制检验通过前文研究发现,个体有规律的锻炼行为会对其收入水平产生显著的正向影响,但锻炼影响收入的作用机制值得进一步研究,通过前文中研究综述的分析,本文选择个体的健康状况、外貌状况以及工作态度作为中介变量研究锻炼影响收入的作用机制,并借鉴已有文献做法(Baron and Kenny, 1986),分别对每一作用机制进行机制检验。
(一). 机制变量选取本文研究锻炼影响个体收入水平的中介机制包括个体的健康水平、外貌水平以及对待工作的态度三个渠道,衡量个体的健康水平、外貌水平以及工作态度的变量均来自CLDS中的个人数据库。
第一,关于个体健康水平的衡量,主要有自评健康和客观健康两种衡量方式。考虑数据库中关于个体健康情况的调查,以及借鉴已有实证研究中关于健康状况衡量指标的做法(雷晓燕等,2010),本研究主要使用自评健康作为健康水平的衡量指标。自评健康水平划分为“非常不健康”、“比较不健康”、“一般”、“健康”以及“非常健康”五种类型,从1到5用来衡量个体的健康状况,数值越大表示个体越健康。
第二,与已有文献中关于个体外貌状况的衡量指标类似(郭继强等,2017;黄玖立等,2019),本文也使用访员对被访问对象的外貌情况评价作为个体的美貌情况的衡量指标。访员对被访问对象的外貌状况进行打分,分值在1到10之间,分值越高表示被访问对象的长相越好。
第三,个体对待工作的态度这一变量来源问卷中“就算身体有点不舒服,或者有其他理由可以休息,我也会努力完成每日应该做的事”、“就算是我不喜欢的事,我也会尽全力去做”以及“就算一件事需要花好长时间才能有结果,我仍然会不断地尽力去做”这三个问题被访问对象的同意程度来衡量,通过对“非常不同意”、“不同意”、“同意”以及“非常同意”按照从1到4进行赋值,再对三个问题的答案赋值进行加总平均,得到个体对待工作态度的得分情况,分值越高表示个体对待工作的态度越好。
(二). 机制检验结果表 8报告了个体锻炼行为影响收入水平的机制检验回归结果。其中,第(1)列~第(3)列为个体的锻炼行为对中介机制影响的工具变量估计结果;第(4)列~第(6)列为加入中介机制变量后,个体的锻炼行为对收入水平影响的工具变量估计结果。同时,表 8中所有回归均控制了前文所提到的控制变量。
![]() |
表 8 锻炼影响收入水平的机制检验 |
从表 8中可以得出,个体的锻炼行为对健康水平、外貌水平以及工作态度具有显著的正向影响;同时,相对于不加入机制变量的回归结果,健康水平、外貌水平以及对待工作的态度三个机制变量的加入,均会使得个体锻炼行为影响收入水平的系数降低,说明个体的健康水平、外貌水平以及对待工作的态度是锻炼影响个体收入的中介机制。
此外,从锻炼行为对个体收入影响系数的下降程度上来看,加入个体的健康状况使得锻炼影响收入的系数下降最多,其次是个体的外貌状况,最后是个体对待工作的态度,即健康水平的中介机制效应大于外貌状况的中介机制效应,而外貌状况的中介机制效应又大于个体对待工作的态度的中介机制效应。这说明在中国的劳动力市场中,锻炼对于个体收入水平的影响机制最为重要的还是通过影响个体的健康状况。
七、进一步讨论考虑到具有不同特征的个体在劳动力市场中具有较大的差异,因而锻炼行为对不同特征个体收入水平的影响可能存在显著的差异。因此,本研究主要从个体的年龄以及受教育程度两个方面,讨论锻炼影响个体收入水平的异质性。
(一). 不同的年龄阶段由于处于不同年龄阶段的个体对锻炼的收入溢价可能存在差异,本研究根据联合国世界卫生组织关于生命周期的分段将年龄划分为三个阶段,分别为青年阶段(45岁及以下)、中年阶段(46-60岁)以及老年阶段(60岁以上),并对不同年龄阶段的个体进行分样本回归,锻炼行为对不同年龄阶段个体收入水平影响的回归结果如表 9所示。从分样本的工具变量回归估计结果可以得出:锻炼对个体收入水平的影响主要存在于青年阶段和中年阶段,而对老年阶段的个体收入水平不具有显著的影响。
![]() |
表 9 异质性分析1:不同的年龄阶段 |
对于青年阶段的个体而言,锻炼可以带来18.3%的收入溢价,且这一影响系数在10%的置信水平下显著;此外,锻炼对于青年阶段个体收入水平的影响主要是通过健康水平和外貌状况这两个中介机制;同时,从锻炼对收入水平的影响系数下降程度上来看,外貌状况的中介效应强于健康水平的中介效应。对于中年阶段的个体而言,锻炼可以在5%的置信水平下为个体带来23.5%的收入溢价;此外,与青年组类似,锻炼影响收入水平的作用机制也是通过影响个体的健康水平和外貌状况;但从中介效应的强度上来看,中年组健康水平的中介效应强于外貌状况的中介效应。
锻炼对个体收入水平的影响主要存在于中青年群体中,同时锻炼对收入的影响在青年组主要通过影响个体的外貌水平,而一旦人到中年,锻炼对收入的影响就主要是通过影响个体的健康水平。这一结论与劳动力市场中不同年龄阶段个体所面临的社会现实也是相吻合的,对于青年群体而言,由于年纪较轻,一方面其整体的健康状况较好,另一方面大部分个体仍处于非领导岗位,因而在劳动力市场中可能会深受外貌的中介效应的影响;但是对于中年群体而言,随着年龄的不断增加,一方面不同个体之间的健康状况已经开始出现较大的分化,另一方面也逐渐成为领导群体,此时外貌的中介效应开始逐渐减弱,而健康的中介效应开始逐渐增强,最终健康的中介效应成为锻炼影响中年群体收入水平的主要中介效应,而外貌的中介效应成为锻炼影响青年群体收入水平的主要中介效应。
(二). 不同的教育程度通过个体受教育水平将教育程度划分为三个组,分别为低教育组(初中以下学历)、中教育组(初中至高中/中专学历)以及高教育组(大专及以上),并对不同教育程度的个体进行分样本回归,回归结果如表 10所示。从分样本的工具变量估计结果可以得出:锻炼对个体收入水平的影响主要存在于中教育组,而对低教育程度和高教育程度的个体收入水平均不具有显著的影响。
![]() |
表 10 异质性分析2:不同的教育程度 |
对于中等教育程度的个体而言,锻炼可以带来29.8%的收入溢价,且这一影响系数在1%的置信水平下显著;从锻炼影响中等教育程度个体收入的作用机制上来看,个体的健康水平、外貌状况以及对待工作的态度都是锻炼影响收入的中介机制,但从中介机制的效应上来看,健康水平和外貌状况的中介机制效应强于对待工作的态度的机制效应。
锻炼对个体收入水平的影响主要存在于中等教育群体之中,而对低教育群体和高教育群体没有显著的影响。这可能是因为,对于低教育群体而言,由于其多从事的是低技能水平的体力劳动,一方面体力劳动在一定程度上可以弥补锻炼的健康效应,从而锻炼对低教育群体的健康中介效应无法起作用,另一方面外貌效应在低教育群体的体力劳动中可能发挥的作用较小,从而最终锻炼对低教育群体的收入水平没有显著的影响;对于高教育群体而言,一方面由于其从事的多为高技能水平的脑力劳动,从而锻炼的健康中介效应较弱,另一方面由于其教育水平较高,其对于劳动力市场中任何可能需要的健康效应以及外貌效应等的获得渠道较为多元,从而高教育群体之间的健康以及外貌水平等差异较小,最终导致锻炼对高教育群体的收入水平也没有显著的影响;而恰恰对于中等教育群体而言,一方面其可能从事的是非体力劳动的工作,另一方面健康以及外貌水平的获得渠道较为单一,从而锻炼与否就会使得个体之间的健康以及外貌水平等差异巨大,最终使得锻炼可以为中等教育群体带来显著的收入溢价效应。
八、结论锻炼作为一种个体的主观选择行为,能够为个体带来各种非劳动力市场福利。除此之外,在中国的劳动力市场中锻炼能否带来收入水平的提高值得深入研究,尤其是对于尚处于发展中国家,居民收入水平还有待于进一步提高的中国来说更为重要。同时,2019年《健康中国行动(2019—2030年)》的出台,引发了如何吸引更多的人参与到锻炼中来的思考。在此研究背景之下,本文基于2014年和2016年CLDS数据,研究个体的锻炼行为对其收入水平的影响。
本文的研究发现:第一,在考虑了可能存在的遗漏变量问题、锻炼与个体收入之间的反向因果以及样本选择性偏差问题后的实证研究模型表明,锻炼能够带来个体收入水平的显著增加,且通过变换工具变量、使用不同的衡量指标以及更加稳健的样本均可以得到较为一致的稳健性结论;第二,锻炼影响个体收入水平的影响机制包括个体的健康水平、外貌状况以及对待工作的态度,而在这其中最为重要的又是通过影响个体的健康水平;第三,通过考察锻炼对不同年龄阶段和不同教育程度群体影响的异质性,我们可以得出,从不同年龄阶段上来看,锻炼对个体收入水平的影响主要存在于青年阶段和中年阶段,且青年阶段的作用机制主要是外貌状况,而中年阶段的作用机制主要是健康水平;从不同教育程度上来看,锻炼对收入水平的影响主要存在于中等教育水平组,且健康水平、外貌状况以及对待工作的态度都是锻炼影响个体收入水平的中介机制。
一方面,本文的研究表明在中国的劳动力市场中确实存在锻炼行为的收入溢价效应,个人在进行锻炼的决策时,应当全面考量锻炼的作用,继而作出更加理性的决策,同时这也可以成为号召更多的居民参与锻炼的又一新理由。另一方面,对于政府而言,除了提升居民收入水平的传统渠道外,本文的研究揭示了在中国劳动力市场中还存在影响个体收入水平的又一渠道:锻炼。这对于我们的启示是,政府应当采取各种措施鼓励居民参与到体育锻炼中来,尤其是应当将中青年群体和中等教育群体吸引进来,而这对于解决当前如何进一步提高居民收入水平的困境可以说是另辟蹊径。
[] |
陈章源、於鹏, 2015, “体育锻炼对大学生主观幸福感的影响:同伴关系的中介效应”, 《首都体育学院学报》, 第 2 期, 第 75-81 页。DOI:10.14036/j.cnki.cn11-4513.2015.02.015 |
[] |
高亮、王莉华, 2015, “体育锻炼与老年人自评健康关系的调查研究”, 《武汉体育学院学报》, 第 8 期, 第 65-72 页。 |
[] |
郭继强、费舒澜、林平, 2017, “越漂亮, 收入越高吗?——兼论相貌与收入的'高跟鞋曲线'”, 《经济学(季刊)》, 第 1 期, 第 151-176 页。 |
[] |
黄玖立、田媛, 2019, “美貌能带来幸福感吗?”, 《南方经济》, 第 1 期, 第 87-108 页。 |
[] |
江求川、张克中, 2013, “中国劳动力市场中的'美貌经济学':身材重要吗?”, 《经济学(季刊)》, 第 3 期, 第 983-1006 页。 |
[] |
雷晓燕、谭力、赵耀辉, 2010, “退休会影响健康吗?”, 《经济学(季刊)》, 第 4 期, 第 1539-1558 页。 |
[] |
田艳芳, 2013, “基于联立方程的个人健康与工资问题研究”, 《南方人口》, 第 1 期, 第 21-29+40 页。 |
[] |
魏众, 2004, “健康对非农就业及其工资决定的影响”, 《经济研究》, 第 2 期, 第 64-74 页。 |
[] |
武留信, 等, 2018, 《中国健康管理与健康产业发展报告.No.1(2018)》, 北京: 社会科学文献出版社。 |
[] |
尹志超、甘犁, 2010, “香烟、美酒和收入”, 《经济研究》, 第 10 期, 第 90-100 页。 |
[] |
Alchian A. A., Demsetz H., 1972, "Production, Information Costs, and Economic Organization". The American Economic Review, 62(5), 777–795.
|
[] |
Baron R. M., Kenny D. A, 1986, "The Moderator-Mediator Variable Distinction in Social Psychological Research:Conceptual, Strategic, and Statistical Considerations". Journal of Personality and Social Psychology, 51(6), 1173–1182.
|
[] |
Barron J. M., Ewing B. T., Waddell G. R., 2000, "The Effects of High School Athletic Participation on Education and Labor Market Outcomes". The Review of Economics and Statistics, 82(3), 409–421.
|
[] |
Becker G. S., 1965, "A Theory of the Allocation of Time". The Economic Journal, 75(299), 493–517.
|
[] |
Cawley J, 2004, "The Impact of Obesity on Wages". Journal of Human Resources, 39(2), 451–474.
|
[] |
Cornelisen T., Pfeifer C., 2010, "The Impact of Participation in Sports on Educational Attainment:New Evidence from Germany". Economics of Education Review, 29(1), 94–103.
|
[] |
Currie J., Madrian B. C., 1998, "Health, Health Insurance and the Labor Market". Handbook of Labor Economics, 3309–3416.
|
[] |
Dewenter R, Giessing L, 2014, "The Effects of Elite Sports Participation on Later Job Success", SOEP paper No.705.
|
[] |
Ewing B. T., 1995, "High School Athletics and the Wages of Black Males". The Review of Black Political Economy, 24(1), 65–78.
|
[] |
Ewing B. T., 1998, "Athletes and Work". Economics Letters, 59(1), 113–117.
DOI:10.1016/S0165-1765(98)00006-8 |
[] |
Gomezpinilla F., 2008, "The Influences of Diet and Exercise on Mental Health Through Hormesis". Ageing Research Reviews, 7(1), 49–62.
|
[] |
Hamermesh D. S., Biddle J. E., 1993, "Beauty and the Labor Market". The American Economic Review, 84(5), 1174–1194.
|
[] |
Heckman J. J., Lalonde R. J., Smith J. A., 1999, "The Economics and Econometrics of Active Labor Market Programs". Handbook of Labor Economics, 3(1), 1865–2097.
|
[] |
Heckman J. J., Stixrud J., Urzua S., 2006, "The Effects of Cognitive and Noncognitive Abilities on Labor Market Outcomes and Social Behavior". Journal of Labor Economics, 24(3), 411–482.
|
[] |
Lakdawalla D. N., Philipson T. J., 2007, "Labor Supply and Weight". Journal of Human Resources, 42(1), 85–116.
|
[] |
Lechner M., 2009, "Long-run Labour Market and Health Effects of Individual Sports Activities". Journal of Health Economics, 28(4), 839–854.
|
[] |
Lechner M., Sari N., 2015, "Labor Market Effects of Sports and Exercise:Evidence from Canadian Panel Data". Labour Economics, 1–15.
|
[] |
Lindqvist E., Vestman R., 2011, "The Labor Market Returns to Cognitive and Noncognitive Ability:Evidence from the Swedish Enlistment". American Economic Journal:Applied Economics, 3(1), 101–128.
|
[] |
Long J. E., Caudill S.B., 1991, "The Impact of Participation in Intercollegiate Athletics on Income and Graduation". The Review of Economics and Statistics, 73(3), 525–531.
|
[] |
Mincer, Jacob, 1974, Schooling, Experience and Earnings, New York: Columbia University Press.
|
[] |
Rees D. I., Sabia J. J., 2010, "Sports Participation and Academic Performance:Evidence from the National Longitudinal Study of Adolescent Health". Economics of Education Review, 29(5), 751–759.
|
[] |
Rosenbaum P.R., Rubin D.B., 1983, "The Central Role of the Propensity Score in Observational Studies for Causal Effects". Biometrika, 70(1), 41–55.
|
[] |
Spence M., 1973, "Job Market Signaling". Quarterly Journal of Economics, 87(3), 355–374.
|