社会  2012, Vol. 32 Issue (4): 68-92  
0

引用本文 [复制中英文]

陈云松. 2012. 农民工收入与村庄网络——基于多重模型识别策略的因果效应分析[J]. 社会, 32(4): 68-92.
[复制中文]
CHEN Yunsong. 2012. Village-Based Networks and Wages of Rural-to-Urban Migrants: Estimating the Causal Effects of Networks Using Combined Identification Strategies[J]. Chinese Journal of Sociology(in Chinese Version), 32(4): 68-92.
[复制英文]
农民工收入与村庄网络——基于多重模型识别策略的因果效应分析
陈云松     
摘要: 以往基于家庭网和社交网的实证研究表明,社会网络对农民工的工资收入没有影响。这些结论的得出,很大程度上是由于对农民工个人网的范围界定不准,且对内生性问题解决不够。本文采用22个省份的农户调查数据,针对中国农民工频繁返乡的特点,证实同村打工网的规模与农民工在城市中的收入具有正向因果关系。为解决影响因果判断的内生偏误问题,本文采取赫克曼二阶段法和工具变量方法组合使用的多重模型识别策略,把村庄遭受的自然灾害强度作为工具变量。
关键词: 农民工    社会网    内生性    因果关系    
Village-Based Networks and Wages of Rural-to-Urban Migrants: Estimating the Causal Effects of Networks Using Combined Identification Strategies
CHEN Yunsong     
Author: CHEN Yunsong, Department of Socioilogy & Nuffield College, The University of Oxford; E-mail: yunsong2000@gmail.com.
Abstract: Rural-to-urban migration in China since the 1970s represents the largest labour flow ever observed in the world. Despite the proliferation of research seeking to understand its mechanisms and magnitude, little is done to identify the direct causal effects of migrant networks on labour market outcomes at the destination. In addition, some previous studies show that family and social networks do not influence the wages of the rural-to urban migrants. However, this finding may be problematic because the concept of networks has not been correctly defined. Rural-to-urban migrants return home frequently within a year. As a result, villages of origin serve as an important intermediary where the migrant workers exchange information. This homecoming-and-go pattern implies the pivotal role of the village-level outflow of migrants in determining their job wages at the destination. Using data from 22 provinces in China, this paper analyses the effect of village-based migrant networks on the wages of migrant labourers, with particular attention to the potential endogeneity problem. Heckman's two-stage method is used to correct for the sampling problem. Natural disaster in the village of origin is used as an instrumental variable (Ⅳ) to deal with other endogeneity biases. The major innovation of this study is taking the total outflow of migrants at the origins as the focus and having Heckman's two-stage method and the Ⅳ approach combined. After controlling for the unobserved factors influencing the migration decision, the model is achieved through instrumenting the outflow size of migrant workers by the endogenous effect of natural disasters. The empirical results show that the size of the migrant network significantly improves the wages of the migrants. The mechanism is straightforward: Village-based networks transmit job-related information in cities among migrants through which migrant workers can get more and better job opportunities. The Ⅳ estimate suggests that network effects obtained from conventional Heckit model are downwardly biased. This paper interprets it within the framework of heterogeneous network effects. That is, Heckit estimate applies to all villages/individuals while the Ⅳ estimate mainly applies to the sub-group of villages/individuals more affected by natural disasters. With the presence of heterogeneity effects, the Ⅳ estimate can be interpreted as a Local Average Treatment Effects (LATE). One possible mechanism is that less able people (in terms of earning ability at the destination) are more responsive to natural disasters, since they have a relatively lower ability to compensate for losses due to natural disasters. That is, villagers of lower earning ability are more likely to be "pushed" out from the villages by natural hazards. If this is the case, the Ⅳ estimate can be interpreted as a weighted average network effect and the weight for the less able migrants is relatively higher. Since less able migrants benefit more from origin-based networks, the Ⅳ estimate mainly captures the network effects among them and it would then be higher than the Heckit estimate.
Key words: migrant workers    social networks    endogeneity    causality    

农村劳动力向城市的转移是中国社会转型期人口流动的一个重要现象。国家统计局的数据显示,2009年中国农民工人口已达2.3亿。从以往的国际人口流动和移民研究看,社会网对移民或流动人口在目的地的社会结果(求职、收入和地位获得等)有很大影响,相关理论和实证研究非常丰富(Borjas,1992)。在中国研究领域,有一批优秀的经济学和社会学文献,探讨了社会网对农民外出打工决策(Hare & Zhao,2000Mallee,2000Meng,2000Zhao,1999Zhang,2001Zhao,2003Bao, et al., 2007)和农民工工资收入的影响(章元等, 2008, 2009刘林平、张春泥,2007)。

近年来有关农民工工资的实证研究成果并不多,无论是计量经济学文献还是社会学的定量研究,似乎也都说明社会资本和社会网络等嵌入性资源对农民工的工资收入没有影响。例如,刘林平、张春泥(2007)通过对珠三角地区的研究发现,请客送礼和参加工会等社会网络动员并不能给农民工带来更高的收入。章元等(20082009)分别用10省和22省的数据分析了农民工的家庭网、亲友网和收入之间的关系,研究结果表明,基于家庭的社会网络对农民工的收入几乎没有作用。不过,就此得出社会网对于农民工收入并无回报的结论为时尚早。特别是从社会学视角,无论是基于请客送礼的关系网,还是基于家庭的血亲网,都只是以农民工个体为中心的社会网络的有限子集。要进一步检验影响农民工收入的社会网络效应是否存在,就应尝试把社会网的分析单位放置到更为具体和更能有效传播工作信息的层面进行重新检视。针对中国农民工返乡频繁的特点,本文所提出的核心假设是:流出地村庄的外出打工人口——“同村打工网”,对本村的外出打工者在城市的工资收入有正向因果影响。

估算社会网对于个人收入的因果效应绝非易事,这是因为,在反事实因果框架之下,内生性问题一直是社会学家和经济学家做出因果判断的主要障碍(陈云松、范晓光,2010)。具体到本研究,打工决策过程所导致的样本选择、打工网和收入之间的双向因果、其他遗漏变量以及测量误差等问题,都会引发严重的内生性偏误。从社会资本和社会网分析的研究现状看,社会学定量分析普遍缺乏对内生性问题的关注,而在同样研究主题的计量经济学文献中,这些问题也没有得到相对圆满的解决。1

1.章元、陆铭(2009)成功地运用工具变量方法消减内生性问题,但样本选择问题、样本局部相关问题仍然被忽略了。

为验证农民工收入和社会网之间究竟有无因果效应,以最大限度地消除回归分析中的内生性偏误,本文基于22省的农户调查数据,采取将赫克曼二阶段模型和工具变量模型相结合的多重模型识别策略。其中,自然灾害强度被作为工具变量来识别收入模型。从数据分析方法的角度,这是社会网和社会资本研究领域内第一次采用多重模型识别的尝试。本文的分析结果可以证实,村庄外出打工人数对于农民工在城市所获工资具有正向的因果影响。

一、假设的缘起:中国式打工

农民外出打工潮从很大程度上定义了中国的人口流动结构,宏观层面上的相关研究文献汗牛充栋,这里不再赘述(参见王美艳,2005)。本文力图指出,由于城乡收入的巨大差异和城乡二元的户籍制度,中国农民在外出打工决策和流动结构方面上呈现出诸多独特之处。恰恰是这些“中国式打工”的特征,引出了本文的核心假设:“同村打工网”对农民工在目的地的工资收入有正向显著影响。同时,这些“中国式打工”的特征,还对定量分析的模型设置提出了特殊的要求。

(一) 作为自选择过程的打工决策

人口流动的主要决定因素有两个,一是外部拉动,二是内部推动。不管是外出打工还是国际移民,来源地和目的地之间的巨大收入差异,是外部拉动的最主要力量(Todaro,1969Harris & Todaro,1970Robinson & Tomes,1982)。而来自农民内部的推动因素之一是家庭剩余劳动力。赵耀辉(Zhao,19992002)和陈钊等(Chen, et al., 2008)认为家庭劳动力数量是决定外出打工的重要因素。此外,大量文献表明,健康状况、年龄和性别等一系列人口学特征以及家庭和村庄属性(例如耕地短缺情况、农业税收执行情况、与大城市的距离等),都是推动农民外出打工的因素(Zhao,2002Cai,1996Hare,1999)。重要的是,考虑到中国城乡之间巨大的收入差异,农民外出打工很可能是一个选择性行为:具有城市劳动力市场优势(男性、年轻和能力强等)的农民会更倾向于外出打工。这种选择性,既可以源自可以观察到的年龄和性别等,也可能来自一些无法直接观测的因素(例如性格和能力)。因此,在模型设置时,必须要考虑到面对的样本本身(即农民工群体)是一个经过双向筛选后的群体。这个群体是否随机和均质,尚存在很大疑问。但如果定量研究以农民工为对象,就必须要考虑到可能存在的样本选择问题。

(二) 作为熟人网的村庄

以往的国际和国内移民研究都表明,流动人口主要是通过熟人和亲属网络来寻找到合适的工作(Granovetter,1974Montgomery,1992Bian,1997)。社会资本和社会网络研究认为,嵌入性资源能够对就业和个人劳动力市场结果起到促进作用(Lin,2001)。大量研究表明,中国农民工的社会网主要是基于老乡关系和血缘关系。农民工和城市社区的联系很少,也很少获得城市的制度性的支持,因此,在找工作时只好求助于基于同乡和亲属关系的网络(Solinger,1999Zhao,2003Rozelle, et al., 1997)。另有研究发现,70%的农民工是通过同村的老乡和亲属找到工作的(Meng,2000)。同时,对家乡的依赖也是1949年以来中国农村社会以生产大队为单位的组织控制所决定的(Skinner, 1964, 1965a, 1965bKipnis,1997)。最后,在外出打工过程中,基于同乡关系的信任是非常强烈的。翟学伟(2003)的研究认为,同乡哪怕并不直接相识,这种信任也可以在一夜之间建立起来。

亲戚和老乡是两个具有不同跨度和规模的网络。以家庭和亲属为核心的血亲网应该是农民工求职最先寻求援助的对象。但章元、陆铭(2009)的研究却表明,这种以家庭和血亲为单位的社会网络对农民工收入的影响非常微弱。不过,本文要强调的是,家庭网虽然不能直接拉动农民工的收入,但并不代表老乡网和村庄网不能对农民工收入有正向影响。因此,本文把网络分析的焦点从家庭网扩展到村庄网。这个拓展,既是基于理性行动的逻辑假设,又有非常充实的社会学理论依据。比如林南(Lin, 1999)的社会资源理论认为,行动者的资源嵌入在层层展开的社会网络之中。基于家庭的网络所载荷的是行动者最内层和最核心的资源,一旦这些资源不能满足工具性需求时,行动者会转而向更外层的网络寻求新的资源和建立新的关系。因此,当家庭网络不能对农民工求职起到作用时,有理由推测基于村庄的打工网可能会得到更多地利用。此外,格兰诺维特(Granovetter,1974)的弱关系理论也有同样的启示:对于农民工而言,家庭网络基于血缘的关系虽然比基于同村的关系更强,但提供的劳动力市场信息也可能是有限和重复的。也就是说,更大范围内相对较弱的“同村打工网”,对农民工求职来说可能是比家庭网更重要。

(三) 作为打工信息中枢的村庄网

同一个村庄的外出打工者可能分布在不同城市,天各一方的同村老乡,能否对各自打工求职带来帮助?从这个角度来看,用“同村打工网”而不是“所在城市的同村打工网”操作化农民工的社会网络,初看起来并不合适,但使用前者来定义农民工的社会网,却具有非常重要的理论渊源和实证基础。这是因为,中国农民工的流动与一般性的国际国内人口流动大相径庭。国际移民的目标往往都是在目的地国家挣足一定的金钱后再回国投资和定居(Massey,1987)。而在中国,农民基本把外出打工视为一种短期安排,在城市永久居住落户的例子非常少,也没有相应的心理准备(Hare,1999Zhao,2003)。因此临时返乡(temporary return)和循环性外出(circuit migration)就自然成为中国农民工人口流动的重要模式。这个模式导致村庄成为分布在各地的同村打工者之间交流信息的主要基地。实际上,这种“候鸟”模式从20世纪80年代就已经开始(Chan & Zhang,1999)。Hare (1999)的研究发现,中国农民工平均每人每年返乡次数高达2-3次。Zhao(1999)的调查也显示,绝大多数农民工一年中在城市所待的时间不超过9个月。也就是说,农民工的身份经常在打工者和务农者之间切换。正因为外出者不断返乡然后继续外出,异地之间的信息,甚至只通过外出者所在家庭就可以进行传递。因此,把基于村庄的全体外出打工者网络定义为本研究的农民工社会网,是中国研究不同于国际移民研究的一个特殊之处。

农民工何以形成临时返乡和循环外出的流动特征?第一,城乡二元的户籍制度阻碍了打工者在城市获得正式居民身份。尽管很多打工者已经成为真正的城市居住者,但正式合法地从农业户口转为城市户口的途径却非常有限(Wu & Treiman,2007)。在没有城镇户口的情况下,他们及下一代在城市中的社会福利、医疗保障和教育机会都无法得到保障。第二,放弃家乡耕地的动机很弱。农村土地是集体所有,出租手续繁琐复杂,农民无法通过出让土地的形式放弃农业生活(Roberts,2000)。此外,中国传统社会把农村的土地看作是一种家族传承的遗产,而很少作为一种用于交换买卖的商品。飞涨的房价和对外来人员的歧视,也让打工者对在城市永久性落户望而却步。

二、模型设置和内生性问题解决方案

本文要估算的是“同村打工网”的规模对农民工收入的因果效应。因此,方程右侧的变量主要包括:作为自变量的村庄外出打工者人数,作为控制变量的个体和村庄属性,以及误差项。但是,简单的最小二乘法回归极有可能出现估计偏误。因此,必须认真考虑可能的估算偏误源头以及能够处理这些估算偏误的高级模型。

(一) 内生性偏误的源头

要使用OLS模型获得无偏估计量,必须保证“同村打工网”的规模和可能被遗漏的村庄特征、打工者的个体异质性等没有关系,也即“同村打工网”必须是外生的,但这个假定实际上很难保证。以下四个方面原因可能会导致估计偏误:

1.非随机样本。前文已经述及,打工决策是一个选择性过程,因此有充分理由怀疑,村庄内那些较有“能力”的人会更倾向于外出打工。

2.遗漏变量。实际上,本研究所用的数据没有提供农民工所在城市的信息,而打工所在地显然有可能与工资以及该农民工的村庄外出人数都有关。此外,一些没有观测到的村庄层面的变量可能和打工收入以及村庄外出打工网规模都有关。实际上,遗漏因素不可能完全穷尽。

3.农民工打工收入和同村打工网之间可能存在一个互为因果的关系。一方面,外出打工的人数可能和工资收入正相关;另一个方面,一个农民工获得了高收入,势必会激励更多人外出。因变量和自变量之间的这种双向关系,会导致OLS回归的联立性偏误。

4.测量误差总会低估网络效应。

(二) 赫克曼二阶段法

为解决样本选择问题,本文采取经典的赫克曼二阶段法(Heckman,1979Heckman & Robb,1985),具体步骤如下:第一步,利用总体样本里所有的观察值(所有打工和不打工的村民),对个体的选择接受干预(外出打工)的概率进行预测,计算出每一个观察值的反向Mills比率;第二步,利用参与干预的样本(外出打工者)进行回归分析,而同时把反向Mills比率作为控制变量以获得一致估计量。不过,正如伍德里奇(Wooldridge,2006)强调的,要真正解决样本选择问题,主体模型(工资模型)中的解释因子群应该是选择模型(外出打工决策模型)的解释因子群的完全子集。而且,在选择模型中,至少要有一个解释变量不出现在主体模型之中。在本研究中,家庭劳动力数量被视为和农民工在城市的工资收入无关的因素而纳入打工决策的Logit模型。1关于家庭劳动力数量对于打工决策的重要影响,可以参见陈钊等(Chen, et al., 2008)和赵耀辉(Zhao,2003)的研究。

1.家庭劳动力数量作为一个外生的排除限定,其实证依据可参考章元等(20082009)的研究结论:家庭网对农民工收入的影响微乎其微。

(三) 作为工具变量的自然灾害

赫克曼二阶段法只能解决样本选择问题,对于一般性的因遗漏变量引发的估计偏误和联立性问题却无能为力。为解决这个问题,本文在赫克曼二阶段模型的基础上进一步采用工具变量方法(Instrumental Variable)。这个工具变量必须是一个和农民工在城市的工资收入没有任何直接关系,但却又可以有力地影响村庄外出打工者数量的外生变量。2利用工具变量所引发的自变量的差异,可以获得对因变量的无偏估计值。有意思的是,本文所用的数据(CHIPS2002)提供了相关年度的村庄自然灾害情况,在有关工作假设和控制了相关因素的前提之下,可以认为村庄内的自然灾害是偶然和随机的外生因素,与农民工本人、村庄以及农民工所在城市的劳动力市场没有直接的关系。而村庄内的自然灾害,却非常有可能影响外出打工农民的数量。

2.关于工具变量方法的原理、模型和在计量经济学社会互动研究中的应用,参见陈云松、范晓光(20102011)。

根据亚历山大(Alexander,2000:9)的定义,自然灾害是指“生物圈、岩石圈、水圈和大气圈内发生的极端事件的灾难性后果”。尽管目前有关自然灾害对移民影响的直接研究并不很多,但这两者之间的关系却非常直观(Hunter,2005)。举一个例子,假设两个基本条件相同的村庄,在某年初,A遭受了自然灾害,而B没有。显然,A村庄的村民会因为自然灾害而降低对全年收入的预期,从而会增加外出打工的可能性。在同群效应之下,自然灾害可能会引发更多的A村庄村民决定外出打工。因此可以推测:自然灾害的强度越大,遭受灾害的村庄外出打工人数就会越多。1实际上,在具体的数据分析中,工具变量和因变量之间的相关关系,可以在工具变量模型的第一阶段回归得到证明和检验。

1.当然,也可以推测,自然灾害会让村民决定留在村庄内进行重建工作以减少自然灾害对家庭的直接影响。这样的话,自然灾害的强度就和村庄外出打工人数反向相关。或者,跟出外打工人数有关系的不一定是村庄当年的自然灾害,而应该是一个村庄历史以来的灾害情况。但重要的是,对于寻找工具变量而言,工具变量和主解释变量之间的关系在理论上是否密切、是正向还是负向,本质上并不重要。只要在工具变量第一阶段回归中能够发现和证明自然灾害与村庄打工人数之间的显著关系足够强,且在理论上自圆其说,就可以把自然灾害作为工具变量,而无须在理论上做过多纠缠。在本研究中,笔者发现外出打工者和村庄遭受自然灾害强度正向相关,因此采用的是正文中的假说。

工具变量的外生性是最值得关注的问题。某年度村庄遭受的自然灾害,由于其随机性和偶发性,看起来应该与该年份农民工所在城市的劳动力市场情况、农民工个体的异质性以及村庄的差异性没有任何关系。但在中国这样幅员辽阔的国家,自然灾害的强度、频度和破坏力一般都有一定的地域性和规律性。而农民工个体和村庄的某些潜在特征也可能和地域相关,例如,在一个灾害多发区,农业产出没有保障,(假如不出外打工的话)村民可能会倾向于掌握一些农业生产之外的技能,如手工技术或经商的知识等。这些技能和经验是非常重要的人力资本,有助于他们外出打工并在打工时获得高收入。如果这种逻辑成立,那么就不能断定自然灾害与打工收入是完全无关的。考虑到这些问题,为确保工具变量的外生性更加具有说服力,笔者会在模型中控制农民工来源地省份的“自然灾害脆弱指数”(Wei, et al., 2004)(具体参见下文)。同时,考虑到有近30%的农民工并不出省,尽管前人的研究(如刘林平、张春泥,2007)证明了农民工来源地对工资收入没有影响,但为谨慎起见,笔者在稳健性检验中还是进一步加入了22个来源省份的虚拟变量。在对来源省份“自然灾害脆弱指数”以及对来源省份的虚拟变量控制后,可以认为村庄这样小范围内的自然灾害是随机的。

(四) 回归模型

本文将对三种模型进行比较。其一,标准最小二乘法模型(以下简称OLS模型);其二,赫克曼二阶段模型(以下简称Heckit模型),解决样本选择问题;其三,基于赫克曼二阶段法的工具变量模型(以下简称Ⅳ-Heckit模型),可同时解决样本选择和其他内生性问题。

OLS模型方程可以写作:

${{\rm{W}}_{\mathit{ig}}} = {\mathit{\beta }_{\rm{0}}} + {\mathit{\beta }_{\rm{1}}}{S_g} + {\mathit{\beta }_{\rm{2}}}{X_{\mathit{ig}}} + {\mathit{\beta }_{\rm{3}}}{\mathit{V}_\mathit{g}} + \in $ (1)

其中Wig代表农民工在城市的工资收入,i表示个第i个农民工,g表示第g个村庄,Sg表示村庄的外出打工人数,Xi表示个人层面的控制变量,Vg是村庄层面的控制变量,∈则是非观测因素的联合效应,也即误差项。因此,Sg是主解释变量,而β1代表了社会网效应。注意,获得β1的无偏估计量的前提是Cov[Sg′∈] =0。但是这个假设可能有很大的问题。

在OLS模型的基础上,用赫克曼方法来解决样本选择问题,因此Heckit模型可以写成由(2)和(3)组成的方程组:

${{\rm{W}}_{\mathit{ig}}} = {\mathit{\beta }_{\rm{0}}} + {\mathit{\beta }_{\rm{1}}}{S_g} + {\mathit{\beta }_{\rm{2}}}{X_{\mathit{ig}}} + {\mathit{\beta }_{\rm{3}}}{\mathit{V}_\mathit{g}} + {\mathit{\beta }_{\rm{4}}}{\hat P_{ig}} + \in $ (2)
${P_{\mathit{ig}}} = {\mathit{\gamma }_{\rm{0}}} + {\mathit{\gamma }_{\rm{1}}}{F_{\mathit{ig}}} + {\mathit{\gamma }_{\rm{2}}}{S_\mathit{g}} + {\mathit{\gamma }_{\rm{3}}}{X_{\mathit{ig}}} + {\mathit{\gamma }_{\rm{4}}}{\mathit{V}_\mathit{g}} + \mathit{\mu } $ (3)

${\hat P_{ig}}$其中即反向Mills比率,Fig是作为排除限定的家庭劳动力人数,不会在方程(2)出现。方程(2)的所有解释变量,是方程(3)解释变量的严格子集。μ是方程(3)中的误差项。

最后,基于以上,结合了赫克曼方法和工具变量方法的Ⅳ-Heckit模型由方程(4)、(5)、(6)组成:

${W_{\mathit{ig}}} = {\mathit{\beta }_{\rm{0}}} + {\mathit{\beta }_{\rm{1}}}{\hat S_\mathit{g}} + {\mathit{\beta }_{\rm{2}}}{X_{\mathit{ig}}} + {\mathit{\beta }_{\rm{3}}}{V_\mathit{g}} + {\mathit{\beta }_{\rm{4}}}{\hat P_{\mathit{ig}}} + \in $ (4)
${P_{\mathit{ig}}} = {\mathit{\gamma }_{\rm{0}}} + {\mathit{\gamma }_{\rm{1}}}{F_{\mathit{ig}}} + {\mathit{\gamma }_{\rm{2}}}{N_\mathit{g}} + {\mathit{\gamma }_{\rm{3}}}{\mathit{X}_{\mathit{ig}}} + {\mathit{\gamma }_{\rm{4}}}{V_\mathit{g}} + \mathit{\mu } $ (5)
${S_\mathit{g}} + {\mathit{\alpha }_{\rm{0}}} + {\mathit{\alpha }_{\rm{1}}}{N_\mathit{g}} + {\mathit{\alpha }_{\rm{2}}}{\mathit{X}_{\mathit{ig}}} + {\mathit{\alpha }_{\rm{3}}}{V_\mathit{g}} + {\mathit{\alpha }_{\rm{4}}}{\hat P_{\mathit{ig}}} + \mathit{\eta } $ (6)

其中Ng代表村庄所遭受的自然灾害的强度,η是误差项。注意,此时方程(5)不应包括内生解释变量Sg,而纳入了外生工具变量Ng

三、数据和变量

“2002年中国农村家庭收入调查”(CHIPS2002)是由国家统计局农村调查小组和中国社会科学院经济学研究所合作进行的。问卷于2003年春节期间收集。选择这个时间是因为大多数外出打工的农民春节一般都会回到家乡和家人团聚。这样就可以尽可能多地收集到农村家庭成员的资料。CHIPS2002数据提供了被访农民在2002年的详细人口学信息、家庭和村庄的相关信息。本文所用的数据来自22个省121个县(市)961个行政村中的9 200个家庭,共37 969位被访者。1

1.尽管本文的分析对象是农民工,但因涉及样本选择问题,所以把全部被访农民分为农民工和非农民工两大类,并给出各自的主要统计描述。

(一) “农民工”的定义

在相关研究和调查中,“农民工”界定有很多不同的标准(Liang,2006)。有研究把农民工定义为跨越两个行政管辖区域的农村流动人口,但也有研究参照外出打工时间长短来定义。CHIPS2002让被访者提供了他们离家外出的天数以及目的地的类型。利用这些信息,本文中“农民工”的概念界定为:第一,外出打工时间超过180天(半年)以上;第二,打工所在地(目的地)在被访者家庭所在乡镇之外。这个定义和国家统计局以及不少前人的研究是一致的(Zhao,2003Chen, et al., 2008)。因此,本文的“农民工”指的是符合上述两个条件的,具有农村户口的农村个体。这个划分标准看似有点武断,但笔者会在稳健性测试中引入不同的“农民工”定义,以检查界定标准的变化是否会对研究结论产生影响。此外,笔者从样本中删去了在乡镇外学习的学生、16岁以下和60岁以上的农民。最后,因为一些数据缺失,实际的样本数量为121个县(市)的919个村庄的8 308个家庭的20 040个农民。其中,有2 361人是外出打工的“农民工”。2

2.对工资调查的回应率约为90%。

(二) 因变量:农民工的日工资

本文的因变量是2002年被访农民工在打工地的日平均工资收入。由于地方政府的不作为以及法制规章的漏洞,不少农民工往往在年末无法拿到工资,甚至引发群体性事件和暴力事件(Li,2008Hannan,2008)。在2 361位农民工之中,有274人的工资为0,也即有8%的农民工被拖欠工资。从表 1可以看到,农民工的日平均工资为16.28元,最高日平均工资水平为403元。这个数据和以往研究基本一致。

表 1 相关变量的描述统计
(三) 自变量:同村打工网

本文中农民工老家村庄的外出打工者数量为主解释变量。如前文所述,本研究关心的农民工的社会网是基于来源地而非打工地,其依据就是,中国的农民工往往在一年内往返于家乡和打工地之间多次。在村庄中,他们通过交谈聊天等方式,和其他农民工及其家庭交换与打工有关的信息。本研究数据显示,只有28%的村民平时和同村人“不太讨论”有关打工的工作信息。这进一步说明,村庄的确是同村农民工们交互工作信息的重要枢纽。除了理论直觉和数据支持之外,用流出地村庄的社会网规模作为主解释变量还有一个技术上的优势,即更有可能找到和它有关而和城市工资无关的工具变量。1

1.看起来如果使用上一年份的同村打工网来作为自变量会更加合理。但是,CHIPS2002数据没有提供2001年的自然灾害情况,因此如果用2001年的网络规模来解释2002年的收入,就无法用工具变量模型获得因果判断。

在CHIPS2002调查中,村庄外出打工人数是由村长提供的,所有的村长都会被问及2002年全村有多少人外出打工。如表 1所示,在把外出打工人数除去被访农民工本人后,平均人数为252,最大的为1 530,最小的是0,也即除被访者外,无他人外出打工。由于一个村庄外出打工人数除了代表网络规模外,也能间接地体现村庄的工业化水平等其他村庄层次的因素,因此,笔者在模型中会尽量多地引入能控制村庄工业化水平的变量。对于被遗漏的村庄变量所导致的估计偏误,会通过工具变量克服。

(四) 工具变量:自然灾害强度

笔者把2002年的村庄遭受自然灾害的强度作为同村打工网的工具变量。中国是一个自然灾害频发国家,每年约有70%的中国农村家庭遭受过各种程度的自然灾害(王国敏、郑晔,2007)。自然灾害和农村家庭收入之间的关系也很密切(Gong & Zhang,2007)。更重要的是,2002年中国农村的主要自然灾害主要集中在上半年。当年1-3月,全国有24个省遭受了旱灾,1 600万农民饮水受到影响。4-5月,长江中下游遭受暴雨灾害。鉴于农民外出打工的决定基本在春节前后做出,因此有理由假设,对于一个村庄,2002年的自然灾害强度和全年外出打工人数应该显著相关。而这个相关,应该在工具变量(2SLS)的第二阶段可以得到统计证明。

自然灾害的破坏力不容易直接测量。本文的操作化定义是村庄中自然灾害导致本村农业收入比正常年份减少的比例。对2002年内未发生自然灾害的村庄,自然灾害导致的农业收入减少设置为0。由于问卷中“正常年份”的农业收入本身不是精确表述,因此村长们给出的减产比例也仅是大概的估计值。表 1数据显示,2002年因为自然灾害导致的村庄农业减产均值为11%,最高的影响达到85%,最少的是0。2

2.灾害会增大村内劳动力外出打工的可能。一旦外出,老人就会弥补家庭劳动力的空白,或者出租土地给外人耕作,因此灾害之年,村内实际务农者数量不会减少,纯粹因灾害导致留村劳力减少而带来的农业减产微乎其微。更重要的是,本文中的村庄农业减产比例为村长对灾害强度的直接估计,故有充分理由相信该减产比例仅是由自然条件变化引起。

前文曾经讨论过,在中国这样幅员广阔的国家,自然灾害的频度和种类、各地的抗灾能力、人口密度及农作物类型等都存在明显地区差异。也恰恰因此,自然灾害对村庄导致的农业减产也有可能是地域性的,进而和同样具有地域性的工资差异有关。考虑到这种可能性,应该对自然灾害破坏力的地域性差异进行控制。有学者利用数据封装的方法,基于年自然灾害频度、级别、受灾人口和国民经济总值等诸多数据,把中国各省对自然灾害的抵抗能力指数分为5级(Wei, et al., 2004),从级别5到级别1逐级增加。笔者参考了这项研究成果,并将5级指数引入模型作为一个虚拟控制变量。在这个基础上,可以认为村庄这样狭小范围内的自然灾害强度是随机的。

(五) 其他控制变量

被访农民工个体层面的控制变量包括年龄、年龄的平方、性别、受教育年限、城市工作经验、城市工作经验的平方和行业类型(见表 1)。农民工的平均年龄为27岁,大部分为男性,女性仅仅占37.5%。已婚的占42.6%。教育方面,平均受教育年限为8年,即初中学历。由于本文分析的是农民工在城市的打工收入,城市经验才是重要的,因而笔者没有采用计量经济学中传统的Mincer方程中的经验算法,而是将城市经验定义为农民工以前曾经在城市里打工的年数。限于篇幅,尽管在表 1中没有展示行业变量,但本研究的数据中有60%的农民工集中在工业和建筑业领域。

村级的控制变量包括1998年的村庄人均收入、劳动力数量、村庄离最近的县城的距离和是否是大中城市郊区等。控制多年前的村庄人均收入是为了控制一些村庄内影响个体收入的无法观测到的历史性因素,特别是村庄的工业化水平。当然,这种方法对于解决遗漏变量问题并不理想,因为它会引入其他的干扰因素。村庄离县城的距离和是否是大城市郊区代表了对城市工作信息的接触程度以及无法观测到的村庄性质。

四、估算结果和诠释

表 2是从OLS模型、Heckit模型和Ⅳ-Heckit模型中分别估算出的相关参数。由于样本中不少人来自同一个村庄,样本之间就可能不是完全独立的。因此,笔者采取了稳健簇差异估计量(robust cluster variance estimators)处理估算模型时的标准误差,以克服“簇内相关”(within-cluster correlation)。实际上,笔者也尝试了用多层线性模型(HLM)的方法进行相关估算,获得的结果基本和表 2一致。限于篇幅,这里不再纳入。此外值得指出的是,在估算模型时,日平均工资是以对数形式出现的,这是考虑到工资收入的偏度(skewness)统计量为4.46,明显右偏。出于同样理由,对村庄外出打工人数也进行了对数处理。

表 2 OLS模型、Heckit模型和Ⅳ-Heckit模型估算结果(N=2 361)
(一) OLS模型估计量

表 2中模型1是基于OLS模型的估计量。数据显示,来自同一村庄的外出打工者数量对农民工工资的影响系数为0.125,标准误差为0.0349,在0.01水平上显著。但该模型不能得出任何因果结论。年龄和年龄平方对于工资的影响也都是在0.01水平上显著,不过两者的方向却相反。这意味着年龄对于工资有边际效应递减现象。在城市工作的经验和教育程度也同样影响工资,不过工作经验对于工资收入不存在边际效应递减。同样也符合一般预期的是,性别和行业对于农民工收入的意义都不大,这显然是因为农民工在城市内从事的职业非常集中,基本都集中在最低技能要求和收入的行业。最后,村庄级别的因素对农民工在城市的工资收入所产生的影响也是微乎其微。

(二) Heckit模型估计量

模型2的估计值来自Heckit模型,也即考虑了可能的样本选择问题。笔者发现,当样本选择导致的偏误被消减之后,农民工收入的网络效应从0.125上升为0.263,且在0.01水平上显著,而反向Mills率(潜在的选择打工的概率)对于工资也有正向显著影响,这说明适应城市工作的某种遗漏能力确实是一个既影响收入又决定外出打工与否的因素。也就是说,确实存在样本选择问题。Heckti模型产生的估计值比OLS估计值更为可信。

那么,为何同村打工网效应的Heckit估计值比OLS估计值大?从中国城乡收入的巨大差异来看,有理由相信潜在能力强(例如具有更适应城市工作的某种难以观察到的能力)的农民有更强的意愿外出打工。这样,OLS模型所使用的样本就不是一个随机样本,而是具有相对较高能力的农民群体。这个群体,恰恰因为自身适应城市的能力强,可能会更加主动地建立城市内的新网络,在求职方面也会更加倚重这些新网络,对基于村庄的老乡网络的依赖程度反而较小。因此,OLS模型自然

就会低估网络效应。实际上,一些实证研究的结果可以间接证明这个诠释。例如,不少研究发现,部分打工者来到大城市后,就开始努力在城市社区建立起网络(齐心,2007徐丙奎,2007)。在城市中拥有更多朋友的农民工能够向老家汇回更多的款项,也有更多的存款(曹子玮,2003)。这些研究都表明,城市社会关系比基于村庄的社会网对于农民工求职具有更大的价值。因此,能力强的人自然就会更加倚重新关系。这一点,颇似谢宇等人(Brand & Xie,2010)提出的大学教育回报中负向选择的研究,即越上不了大学的人,从大学教育中获益越多。实际上,这在关于城市移民社会资本的研究中也得到印证:城市新移民社会资本的本地化将是一种理性选择的结果(雷开春,2011)。

(三) Ⅳ-Heckit模型估计量

Ⅳ-Heckit模型是基于赫克曼二阶段法的工具变量模型,能够同时解决样本选择问题和其他一般性内生性问题。该模型的估算结果见表 2的模型3。在描述分析结果之前,先看几个关键的统计量,以确保工具变量分析结果的可靠性。数据显示,第一,工具变量和自变量的相关是足够强的。如模型3中,自然灾害和网络规模直接相关的第一阶段回归F统计量达到17.4,在0.05水平上显著,并远远超过了经验标准值。第二,豪斯曼内生性检验结果显示,Heckit模型和Ⅳ-Heckit模型直接存在系统差异,表示同村打工网确实是一个内生性变量。由于工具变量模型的估计量总是一致的,因此有必要放弃标准Heckit模型而采用Ⅳ-Heckit的结果。

表 3 工具变量2SLS回归第一阶段估计值(N=2 361)

有意思的是,Ⅳ-Heckit模型给出一个比Heckit模型更大的网络效应估计值。后者是0.263,而前者增加到0.628,并在0.01水平上显著。除此之外,两个模型其他控制变量的估计参数相差不大。根据Ⅳ-Heckit模型给出的估计量,在其他一切条件相同的情况下,村庄打工网络每增加2%,就会带来1.2%的工资增加。假设有一个农民工的同村打工网规模为250人(本数据中均值规模为252人),日工资为14元(本数据中均值为16.28元),一年内在外打工250天(本数据中均值为255天),年收入为3 500元。那么仅仅增加5个人外出打工,同村农民工个体的工资就可以有1.2%的增加,也即年收入达到3 542元。如果增加50个人外出,则年收入近4 000元。

如何解释Ⅳ-Heckit估计值大于Heckit估计值呢?首先,一个可能的简单解释就是,Heckit模型中的遗漏变量和网络规模的相关关系与和工资的相关关系呈相反方向,也即一个正相关,一个负相关(或者一个负相关,一个正相关)。不过,如果考虑到自然灾害促使农民做出外出打工决定的“压力”可能不是均质的,就存在一个工具变量分析中非常独特的“局部平均干预效应”问题(简称LATE, 参见Imbens & Angrist,1994Angrist, et al., 1996)。1而这个问题,恰恰能对较大的工具变量估计值做出一个更为合理和直观的解释。

1.注意,在LATE框架下诠释工具变量估计值,需要的一个前提就是自然灾害和网络之间的关系是单调的。

现在不再假定工具变量(自然灾害强度)对内生解释变量(同村打工网)的因果效应是均质的。一个非常可能的现象就是,能力弱的村民或者因为循环累积因果造成平均能力较弱的村庄2对自然灾害更加敏感,对自然灾害造成的损失更加担忧,也就更容易被自然灾害“拉动”而外出打工。这样,“弱能力村庄”外出打工网络的规模就更容易被影响。当用自然灾害作为工具变量来估算同村打工网对于工资的因果效应时,工具变量模型的估计值所体现的就不是基于样本的平均干预效应(ATE),而是一个加权平均值。重要的是,其中来自“弱能力村庄”的农民工,会具有更大的权重。这个加权平均值,就是LATE。

2.循环累积因果理论(cumulative causation)由缪尔达尔提出,指的是在一个动态的社会过程中,社会经济各因素之间存在着循环累积的因果关系。市场力量的作用一般趋向于强化而不是弱化区域间的不平衡,也即区域发展的马太效应。

前文已提及,基于理性选择,能力弱的农民工对基于村庄的同乡网依赖更多,从同乡网获得的边际效益也更大。同样,来自“弱能力村庄”的农民工,也会比来自“强能力村庄”的农民工更倚重村庄网,并从村庄网获得更大的边际效益——尽管这个网络本身可能是低质量的。既然Ⅳ-Heckit模型更多地反映了“弱能力村庄”的网络效应,它给出的估计值自然就要比Heckit模型大。总而言之,这是一个典型的LATE问题,是工具变量方法中饶有趣味和特别值得探讨的现象。限于篇幅,这里不再对具体计量经济模型进行推演。而由此得出的结论是清晰的:总体上,同村打工网对于农民工的城市工资是有正向影响的,能力弱的农民工更依赖也更能从村庄网中获益。

(四) 稳健性检验

稳健性检验可以测试农民工的不同定义、不同的样本数和纳入省份虚拟变量是否改变模型回归的基本结果模式(见表 4)。第一,用不同的标准来定义“农民工”,并在此基础上进行同样的回归。所用到的“农民工”定义包括:出村180天以上的农民(模型1),出县180天以上的农民(模型2),出乡90天以上的农民(模型3),出乡240天以上的农民(模型4)。第二,考虑到有不到30%的农民工在省内打工,笔者进一步把22个省份作为虚拟变量纳入方程(模型5)。第三,把收入最靠前1%和5%的高收入农民工删除(模型6和模型7);第四,把零工资的农民工样本删除(模型8)。从表 4可以看出,这些稳健性检验所用的模型和表 2中的模型获得的估计值保持了非常相似的模式。因此,可以相信表 2的模型分析结果是稳健的。

表 4 稳健性检验诸模型的网络效应估计值
五、结语

自20世纪70年代起的打工潮,迄今为止已经成为世界上最为庞大和特殊的移民现象。尽管在研究农民工规模、机制和社会效应方面的中西文献汗牛充栋,但精确地估算社会网络对于农民工求职因果关系影响的研究仍不多。本文对这一领域研究的补充在于:第一,社会网本身具有内生性,因此对网络效应的因果判断困难重重。本文采取多重识别策略,用赫克曼二阶段法解决了定量分析中的样本选择问题,以自然灾害作为工具变量解决了其他一般性内生性偏误问题,使估算出的网络效应具有因果效力。这是在社会学的网络分析领域内第一次尝试。第二,本文针对中国农民工流动和就业的特点,引入了“同村打工网”这一概念,对农民工在求职中所真正倚重的社会网络进行了更为精准的操作化定义。通过高级模型识别策略和合理的农民工社会网度量,得出了和先前研究(刘林平、张春泥,2007章元、陆铭,2009)不尽相同又逻辑一致的结论,即家庭网、亲属网、拜年网和送礼网等都不是农民工求职依赖的主要资源,村庄网,更准确地说是“同村打工网”,才是影响农民工收入的重要因素。而这个网络单位差异的内涵与格兰诺维特的弱关系理论以及林南的社会资源理论吻合得非常好。这是因为,和家庭网相比,村庄网是相对较弱的关系网络,但会有更多更有价值的打工信息。能力较弱的农民工,更多依赖于村庄网络,而那些能力较强的农民工,则开始更多动员在城市中新近建立起来的网络资源。

最后要提出的是,社会网研究中网络的操作化定义应该进行多层面的探索和分析。例如,刘林平、张春泥(2007)从请客送礼和加入工会的角度测量农民工的社会网,证明了这类网络对于农民工的工资收入并无影响。但农民工在求职方面倚重的社会网络,可能不仅仅局限在这几个方面。章元、陆铭(2009)参考了奈特等对中国人个体层面社会资本的测量方法,即把家庭拥有的亲友数作为网络的测量(Knight & Yueh,2002)。但重要的是,奈特的研究针对的是中国城市居民,而当研究对象变为从农村来到城市的农民工时,这一操作化定义可能就不太适合。在这个意义上,本文和这些研究一起构成了对同一课题相互补充的多层面探讨。尤其是,本文和章元、陆铭(2009)的研究使用的是相同的数据。接下来,希望看到未来的研究进一步尝试把网络的分析单元和度量置于县乡等其他的层面,从而加深对农民工群体中网络动员范围的理解。

参考文献(Reference)
Alexander David. 2000. Confronting Catastrophe. New York: Oxford University Press..
Angrist, Joshua D., Imbens Guido W., Rubin D.B. 1996. Identification of Causal Effects Using Instrumental Variables. Journal of the American Statistical Association, 91(434): 444-455. DOI:10.1080/01621459.1996.10476902
Balderrama Rafael, Hilario Molina. 2009. How Good are Networks for Migrant Job Seekers? Ethnographic Evidence from North Carolina Farm Labor Camps. Sociological Inquiry, 79(2): 190-218. DOI:10.1111/soin.2009.79.issue-2
Banerjee Biswajit. 1983. Social Networks in the Migration Process: Empirical Evidence on Chain Migration in India. The Journal of Development Areas, 17(2): 185-196.
Banerjee Biswajit. 1984. Information Flow, Expectations and Job Search: Rural-to-Urban Migration Process in India. Journal of Development Economic, 15: 239-257. DOI:10.1016/0304-3878(84)90018-X
Bao, Shuming, Örn B. Bodvarsson, Jack W. Hou, and Yaohui Zhao. 2007. "Interprovincial Migration in China: The Effects of Investment and Migrant Networks. " IZA Discussion Paper, No: 2924.
Bauer Thomas, Pereira Pedro T., Michael Vogler, Zimmermann Klaus F. 2002. Portuguese Migrants in the German Labor Market: Selection and Performance. International Migration Review, 36(2): 467-491.
Bian Yanjie. 1997. Bringing Strong Ties Back in: Indirect Ties, Network Bridges, and Job Searches in China. American Sociological Review, 62(3): 366-385. DOI:10.2307/2657311
Boyd Monica. 1989. Family and Personal Networks in International Migration: Recent Developments and New Agendas. International Migration Review, 23(3): 638-670. DOI:10.1177/019791838902300313
Brand Jennie, Yu Xie. 2010. Who Benefits Most from College? Evidence for Negative Selection in Heterogeneous Economic Returns to Higher Education. American Sociological Review, 75(2): 273-302. DOI:10.1177/0003122410363567
Cai Fang. 1996. An Economic Analysis for Labor Migration and Mobility. China Social Sciences Quarterly(Spring): 120-135.
Colin Cameron A., Trivedi Pravin K. 2005. Microeconometrics: Methods and Applications. ambridge: Cambridge University Press.
曹子玮. 2003. 农民工的再建构社会网与网内资源流向. 社会学研(3).
CAO Ziwe. 2003. Social Network and Resource Flow in Peasant Worker's Urban Life. Sociological Studies(3).
Card David. 1995. "Using Geographic Variation in College Proximity to Estimate the Return to Schooling." In Aspects of Labor Market Behaviour: Essays in Honour of John Vanderkamp, edited by L.N. Christofides, E.K. Grant, and R. Swidinsky. Toronto: University of Toronto Press.
Carrington William J., Enrica Detragiache, Tara Vishwanath. 1996. Migration with Endogenous Moving Costs. The American Economic Review, 86(4): 909-930.
Chan Kam Wing, Li Zhang. 1999. The Hukou System and Rural Urban Migration in China Processes and Changes. China Quaterly, 160: 818-855.
陈云松, 范晓光. 2010. 社会学定量分析中的内生性问题:测估社会互动的因果效应研究综述. 社会(4).
CHEN Yunsong, FAN Xiaoguang. 2010. The Endogeneity Problem in Quantitative Analysis: A Review of Estimating Causal Effects of Social Interaction. Chinese Journal of Sociology(4).
陈云松, 范晓光. 2011. 社会资本的劳动力市场效应估算——关于内生性问题的文献回溯和研究策略. 社会学研究(1).
CHEN Yunsong, FAN Xiaoguang. 2011. Measuring the Labor Market Effects of Social Capital: A Literature Review and Research Strategy of Dealing with the Endogeneity Problem. Sociological Studies(1).
Chen, Zhao, Shiqing Jiang, Ming Lu, and Hiroshi Sato. 2008. "How do Heterogeneous Social Interactions Affect the Peer Effect in Rural-Urban Migration: Empirical Evidence from China. " LICOS Discussion Papers 22408, Centre for Institutions and Economic Performance, K. U. Leuven.
Curran Sara R., Rivero-Fuentes E. 2003. Engendering Migrant Networks: The Case of Mexican Migration. Demography, 40(2): 289-307. DOI:10.1353/dem.2003.0011
De Brauw, Alan and John Giles. 2008. "Migrant Labor Markets and the Welfare of Rural Households in the Developing World: Evidence from China. " Policy Research Working Paper Series 4585, The World Bank.
Fawcett James T. 1989. Networks, Linkages, and Migration Systems. International Migration Review, 23(3): 671-680. DOI:10.1177/019791838902300314
Gong Qianwen, Zhang Junbiao. 2007. Relations between Agricultural Natural Disasters and Rural Poverty Based on Panel Analysis in Anhui Province, China. Chinese Population, Resources and Enviroment, 17(4): 92-95. DOI:10.1016/S1872-583X(08)60004-2
Granovetter Mark S. 1974. Getting a Job: A Study of Contacts and Careers. Cambridge, MA: Harvard University Press..
Gurak Douglas T., Fe Caces. 1992. "Migration Networks and the Shaping of International Migration Systems." In International Migration Systems: A Global Approach, edited by Mary Kritz, Lin Lean Lim, and Hama Zlotmk.. Oxford: Clarendon Press..
Hare Denise. 1999. 'Push' versus 'Pull' Factors in Migration Outflows and Returns: Determinants of Migration Status and Spell Duration among China's Rural Population. Journal of Development Studies, 35(3): 45-72. DOI:10.1080/00220389908422573
Hare Denise, Shukai Zhao. 2000. "Labor Migration as a Rural Development Strategy: A View from the Migration Origin." In Rural Labor Flows in China, edited by West and Zhao. Berkeley: University of California..
Harris J.R., Todaro M.P. 1970. Migration, Unemployment and Development: A Two-Sector Analysis. American Economic Review, 60(1): 126-142.
Hannan Kate. 2008. China: Migrant Workers Want 'Decent Work'. The Copenhagen Journal of Asian Studie, 26(2).
Haug Sonja. 2008. Migration Networks and Migration Decision-Making. Journal of Ethnic and Migration Studies, 34(4): 585-605. DOI:10.1080/13691830801961605
Heckman James J. 1979. Sample Selection Bias as a Specification Error. Econometrica, 47(1): 153-162. DOI:10.2307/1912352
Heckman James J., Robb R. 1985. Alternative Methods for Evaluating the Impact of Interventions: An Overview. Journal of Econometrics, 30: 239-267. DOI:10.1016/0304-4076(85)90139-3
Holland Paul W. 1986. Statistics and Causal Inference. The Journal of the American Statistical Association, 81(396): 945-960. DOI:10.1080/01621459.1986.10478354
Hunter Lori M. 2005. Migration and Environmental Hazards. Population and Environment, 26(4): 273-302. DOI:10.1007/s11111-005-3343-x
Imbens G.W., Angrist J. D. 1994. Identification and Estimation of Local Average Treatment Effects. Econometrica, 62(2): 467-475. DOI:10.2307/2951620
Kipnis Andrew B. 1997. Producing Guanxi: Sentiment, Self and Subculture in a North China Village. Durham: Duke University Press..
Knight, John and L. Yueh. 2002. "The Role of Social Capital in the Labor Market in China. " Oxford University, Department of Economics, Discussion Paper.
雷开春. 2011. 城市新移民社会资本的理性转换. 社会(1).
LEI Kaichun. 2003. Rational Transformation of New Urban Immigrants' Social Capital. Chinese Journal of Sociology(1).
Li, Shi. 2008. "Rural Migrant Workers in China: Scenario, Challenges and Public Policy. " Working Paper.
Liang, Zai. 2006. "Internal Migration in China in the Reform Era: Patterns, Policies, and Challenges. " In Demography in China in the 21st Century, edited by Zhongwei Zhao and Fei Guo. Oxford University Press.
Lin Nan. 1999. Social Networks and Status Attainment. Annual Review of Sociology(25): 467-487.
刘林平, 张春泥. 2007. 农民工工资:人力资本、社会资本、企业制度还是社会环境?——珠江三角洲农民工工资的决定模型. 社会学研究(6).
LIU Linping, ZHANG Chunni. 2007. Human Capital, Social Capital, Enterprises Institution or Social Environment:Wage Determination Model of Migrant Workers in Peal River Delta. Sociological Studies(6).
Mallee, Hein. 2000. "Agricultural Labor and Rural Population Mobility: Some Observations. " In Rural Labor Flows in China, edited by West and Zhao. Institute of East Asian Studies, University of California, Berkeley.
Massey Douglas S., et al. 1993. Theories of International Migration: A Review and Appraisal. Population and Development Review, 19(3): 431-466. DOI:10.2307/2938462
Massey Douglas S. 1987. Understanding Mexican Migration to the United States. American Journal of Sociology, 92(6): 1372-1403. DOI:10.1086/228669
Meng Xin. 2000. Labour Market Reform in China. Cambridge: Cambridge University Press..
Montgomery James D. 1992. Job Search and Network Composition: Implications of the Strength-of-Weak-Ties Hypothesis". American Sociological Review, 57(5): 586-596. DOI:10.2307/2095914
Morgan, Stephen. 2002. "Should Sociologists Use Instrumental Variables. " Working Paper, Cornell University.
Morgan Stephen, Christopher Winship. 2007. Counterfactuals and Causal Inference: Methods and Principles for Social Research. Cambridge: Cambridge University Press..
Munshi Kaivan. 2003. Networks in the Modern Economy: Mexican Migrants in the U.S. Labor Market. Quarterly Journal of Economics, 118(2): 549-599. DOI:10.1162/003355303321675455
Palloni Alberto, et al. 2001. Social Capital and International Migration: A Test Using Information on Family Networks. American Journal of Sociology, 106(5): 1262-1298. DOI:10.1086/320817
齐心. 2007. 延续与建构:新生代农民工的社会网络. 江苏行政学院院报(3).
QI Xin. 2007. Continuing and Rebuilding: The Social Network of Cainozoic Rural Migrant Workers. The Journal of Jiangsu Administration Institute(3).
Rainer, Helmut and Tom Siedler. 2008. "Social Networks in Determining Migration and Labour Market Outcomes: Evidence from the German Reunification. " ISER Working Papers 2008-2036.
Neal Ritchey P. 1976. Explanations of Migration. Annual Review of Sociology(2): 363-404.
Robinson Chris, Nigel Tomes. 1982. Self-Selection and Interprovincial Migration in Canada. Canadian Journal of Economics, 15(3): 474-502. DOI:10.2307/134762
Roberts, Kenneth D. 2000. "Chinese Labor Migration: Insights from Mexican Undocumented Migration to the United States. " In Rural Labor Flows in China, edited by West and Zhao. Institute of East Asian Studies, University of California, Berkeley.
Rozelle, Scott, et al. 1997. "Poverty, Networks, Institution, or Education: Testing among Competing Hypotheses on the Determinants of Migration in China. " Paper presented at the 1997 Annual Meetings of the Association for Asian Studies, Chicago, Illinois, March 13-16.
William Skinner G. 1964. Marketing and Social Structure in Rural China: Parts Ⅰ. The Journal of Asian Studies, 24(1): 3-43. DOI:10.2307/2050412
William Skinner G. 1965a. Marketing and Social Structure in Rural China: Parts Ⅱ. The Journal of Asian Studies, 24(2): 195-228. DOI:10.2307/2050562
William Skinner G. 1965b. Marketing and Social Structure in Rural China: Parts Ⅲ. The Journal of Asian Studies, 24(3): 363-399. DOI:10.2307/2050342
Solinger Dorothy J. 1999. Citizenship Issues in China's Internal Migration:Comparisons with Germany and Japan. Political Science Quarterly, 114(3): 455-478. DOI:10.2307/2658206
Taylor Edward J. 1986. "Differential Migration, Networks, Information and Risk." In Migration Theory, Human Capital and Development, edited by Oe Stark.. Greenwich, Conn.: JAI Press..
Todaro Michael P. 1969. A Model of Labour Migration and Urban Employment in Less Developed Countries. American Economic Review, 59(1): 138-148.
Uhlenberg Peter. 1973. Noneconomic Determinants of Nonmigration: Sociological Consideration for Migration Theory. Rural Sociology, 38(5): 296-311.
王国敏, 郑晔. 2007. 中国农业自然灾害的风险管理与防范体系研究. 成都: 西南财经大学出版社.
WANG Guomin, ZHENG Ye. 2007. The Risk Management System of Natural Disaster in Agriculture in China. Chengdu: Southwestern University of Finance and Economics Press..
王美艳. 2005. 城市劳动力市场上的就业机会与工资差异——外来劳动力就业与报酬研究. 中国社会科学(5).
WANG Meiyan. 2005. Employment Opportunities and Wage Gaps in the Urban Labor Market:A Study of the Employment and Wages of Migrant Laborers. Social Sciences in China(5).
Wei Yiming, et al. 2004. The Assessment of Vulnerability to Natural Disasters in China by Using the DEA Method. Environmental Impact Assessment Review, 24(4): 427-439. DOI:10.1016/j.eiar.2003.12.003
Windizio Michael. 2008. Social Structures and Actors: The Application of Multilevel Analysis in Migration Research. Romanian Journal of Population Studies, 11(1): 113-138.
Winship Christopher, Stephen Morga. 1999. The Estimation of Causal Effects from Observational Data. Annual Review of Sociology(25): 659-706.
Wooldridge J.M. 2002. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.
Wooldridge, J. M. 2006. Introductory Econometrics: A Modern Approach (3rd Edition). Thomson South-Western.
Wu Xiaogang, Treiman Donald J. 2007. Inequality and Equality under Chinese Socialism: The Hukou System and Intergenerational Occupational Mobility. American Journal of Sociology, 113(2): 415-445. DOI:10.1086/518905
徐丙奎. 2007. 进城农民工的社会网络与人际传播. 华东理工大学学院(社会科学版)(3).
XU Bingkui. 2007. Social Network of Peasant Migrants in City and Their Interpersonal Communication. The Journal of East China University of Science and Technology (Social Soience Edition)(3).
翟学伟. 2003. 社会流动与关系信任:也论关系强度与农民工的求职策略. 社会学研究(1).
ZHAI Xuewei. 2003. Social Mobility and Personal Trust:On the Strenghth of Trust and the Strategy of Getting Jobs for Rural Migrants. Sociological Research(1).
章元, 等. 2008. 社会网络与工资水平:基于农民工样本的实证分析. 世界经济文汇(6).
ZHANG Yuan, et al. 2008. Social Networks and Wages:Case Analysis Based on Migrant Workers. World Economic Papers(6).
章元, 陆铭. 2009. 社会网络是否有助于提高农民工的工资水平. 管理世界(3).
ZHNAG Yuan, LU Ming. 2009. Does Social Network Help to Increase Wages of Migrant Workers?". Management World(3).
Zhang Li. 2001. Strangers in the City: Reconfiguration of Space, Power and Social Networks within China's Floating Population. Stanford: Stanford University Press..
Zhao Yaohui. 1999. Leaving the Countryside: Rural to Urban Migration Decisions in China. American Economic Review(89): 281-286.
Zhao Yaohui. 2002. Causes and Consequences of Return Migration: Recent Evidence from China. Journal of Comparative Economics, 30(2): 376-394. DOI:10.1006/jcec.2002.1781
Zhao Yaohui. 2003. The Role of Migrant Networks in Labor Migration: The Case of China. Contemporary Economic Policy, 21(4): 500-511. DOI:10.1093/cep/byg028
Zhu Nong. 2002. The Impact of Income Gaps on Migration Decisions in China. China Economic Review13, 13(2-3): 213-230. DOI:10.1016/S1043-951X(02)00074-3