教育的同型婚姻与中国社会的家庭工资收入不平等:1996

引用本文 [复制中英文]

李代. 2017. 教育的同型婚姻与中国社会的家庭工资收入不平等:1996—2012[J]. 社会, 37(3): 103-130.

LI Dai. 2017. Educational Homogamy and Family Earnings Inequality in China: 1996—2012[J]. Chinese Journal of Sociology(in Chinese Version), 37(3): 103-130.

[复制英文]

Contents Abstract Full text Figures/Tables PDF

教育的同型婚姻与中国社会的家庭工资收入不平等:1996—2012

李代

作者简介：李代北京大学社会学系 E-mail：lidaipku@163.com。

感谢周翔、Antoine Song、谢宇、张涵等师友对本文提出的宝贵建议。感谢国家留学基金委对本研究的资助。

摘要: 近年来，关于同型婚配的研究在社会学界得到越来越多的关注。本文采用LHSC1996与CGSS2012两个截面数据，首先用对数线性模型测量调查数据中夫妻教育匹配的同型程度，用相关系数测量工资收入上的相似程度。然后使用模糊置换检验估量在控制年龄、城乡和地域之后，夫妻受教育程度的匹配对家庭工资收入不平等指数泰尔指数（Theil Index）的影响，并通过比较两个截面数据考察其变化趋势。在研究方法上本文有所贡献，本文所使用的改进的置换检验方法可以更好地控制年龄等定距变量。

关键词: 教育同型婚姻不平等置换检验

Educational Homogamy and Family Earnings Inequality in China: 1996—2012

LI Dai

Author: LI Dai, Department of Sociology, Peking University E-mail:lidaipku@163.com.

Abstract: In recent years, research on assortative mating and educational homogamy has attracted much attention in sociology. This paper, adopting LHSC1996 and CGSS2012 cross-sectional data, first uses log-linear models to measure educational homogamy and Pearson's correlation coefficients to measure earnings correlation between spouses, then uses fuzzy permutation tests to measure the contribution of educational homogamy towards earnings inequality, in terms of the Theil Index, controlling for age, province and hukou status. Comparing results from two years, this paper reveals that the trend of said contribution. First, CGSS2012 shows an elevated family earnings inequality in total, and pairing over all dimensions discussed contributes more to inequality than before. Second, pairing over all dimensions discussed show similar contributions to earlier counterparts, except for a difference in extent. Third, educational pairing contributes significantly more to inequality in CGSS2012. Its main effect and net effect controlling for aforementioned covariates are both positive, which means educational homogamy increases family earnings inequality. This paper contributes to empirical knowledge as well as methodical advances. We have concluded that fuzzy permutation tests can include continuous variables.

Key words: education homogamy earnings inequality permutation test

一、同型婚姻与家庭工资收入不平等

婚姻与家庭是社会学研究的重要课题。如何选择合适的对象组成家庭不仅是各国文化传统中的重要内容，也是当今社会每一个普通人关心的现实问题。生活和谐美满固然是婚姻的重要目标，但是婚姻毕竟不是单纯的精神结合，还涉及家庭财产的交换、合并与再分配，乃至两个家族的社会联结。当我们以家庭为单位思考婚姻与社会不平等的关联时，不难发觉不同的婚配机制可能会带来不同的家庭形态，也间接地影响到社会不平等的现状及其再生产。

本文聚焦的是两个基础性的经验问题：在当代中国社会，夫妻的受教育程度和工资收入有多相像？夫妻的教育匹配程度给整个社会的家庭工资收入不平等带来了怎样的影响？提出这两个问题背后的深层关切是，如果婚配双方首要看重的是社会经济地位相匹配，是否会出现富者愈富的局面，社会的纵向流动是否会受到削弱？在改革开放30多年后的今天，革命政权曾经倡导要消解的旧式婚恋观念是否重获生命？

本文使用收集于1996年与2012年的两个具有可比性的截面调查数据进行趋势研究。首先分别测量各自年份夫妻在受教育程度和工资收入上的相似程度，再考察不同的婚配状况对家庭工资收入不平等的影响。在此基础上比较这两个年份的结果，我们便能对近年来婚姻变化的趋势获得初步的认识。本文首先考察中西方社会关于“同型婚姻”的社会语境以及理论关照，再具体说明本文的研究设计与贡献。

(一) “同型婚姻”的社会语境

在传统的中国社会，“般配”一向是缔结婚姻的重要取向。即便在当今社会，不少人仍秉持这一观念，在自己或子女择偶时不仅关心男女相悦之情，也要考察对方的受教育程度、职业地位、收入财产乃至家庭背景等内容。传统社会也把“郎才女貌”这样夫妻在不同维度上的属性提出来作为“般配”的标准。为使讨论脉络清晰，本文只考虑夫妻在同一维度上的情况。

在欧美社会，婚配同样关注一定意义上的“般配”，尽管日常用语中并未找到直接对应于中文的讲法。目前欧美社会学界用来描述类似现象的术语来自生物学和人类学。在婚配过程中优先选择与自己类型相同或属性相近的对象，这被称作“同型婚配”(assortative mating)。¹此外，人们观察到的婚配结果里出现的夫妻类型相同或属性相近的情况，被称作“同型婚姻”(homogamy)。

1. “同型婚配”原是一个生物学概念，用以描述生物体优先选择与自己相近的异性交配的性选择机制。与之相对应的其他机制包括：择优婚配、异型婚配和随机婚配。早在1896年，皮尔逊(Pearson，1896)就提出了性选择的两个基本类型：择优交配(preferential mating)与同型交配(assortative mating)，并给出了衡量二者的统计方法。

本文提到的“同型婚配”与“同型婚姻”描述的是彼此相关但又截然不同的两件事。“同型婚配”指代一种择偶机制，而“同型婚姻”则是择偶结果。并非只有同型婚配才能导致同型婚姻，例如，在选择伴侣时选择与自己收入最为接近的一位，这样的同型婚配当然导致同型婚姻，但是择优婚配也可能导致同型婚姻。在一夫一妻制、完全择优婚配的机制下，也会出现同型婚姻的结果。这是因为如果社会中适婚男女数目相同、收入相近，那么男女双方择优结合必定寻得一个与自己收入相近的伴侣，就好像小学生按身高排成两队，并排而立的必定身高相仿。²“同型婚配导致同型婚姻”被称作“匹配假说”，“择优婚配导致同型婚姻”被称作“竞争假说”。实际上，在缺乏微观数据的情况下，尤其是在不了解调查对象择偶选择集的信息时，社会科学研究很难进行明确分类。³本文采用调查数据所能探究的也只是“同型婚姻”而非“同型婚配”。很多研究者在建立理论框架时混淆二者，忽视了研究的局限，难免做出过强或者有误导性的结论。本文开篇首先廓清概念，就是要避免这一弊病。

2. 在生物学研究中这一问题含义不同，因为研究交配行为并非一定以一夫一妻制为前提，这样每一次交配的配对可以近似地被认为彼此相独立，这两种交配机制在结果上的彼此干扰未必严重；现代人类社会通行的一夫一妻制则不然，这两个机制很难从结果上明确区分。

3. 例如，对数线性模型得到的参数无法用于估计个体的择偶偏好(Logan，1996)。一些采用其他类型的数据和研究设计的研究表明，在欧美社会，发挥主要作用的是“匹配”，但也不能一概而论(Fisman, et al., 2006；Hitsch, et al., 2010)。

第二，看似具有普适性的讨论实际上与特定的社会现实紧密相联，我们不应忽视欧美社会关于“同型婚配”与“同型婚姻”的研究其具体的社会语境。19世纪末“同型婚配”进入现代学术话语之初，以生物学家研究夫妻体征的统计数据为主，例如观察夫妻是否在身高、臂长等方面相匹配(Pearson and Lee, 1902)。这类研究在生物学领域延续至今，演变为对夫妻基因表现同型程度的研究。⁴20世纪初，社会学家开始使用“同型婚配”和“同型婚姻”的概念来探讨人们的婚姻在社会、经济和文化等维度上的结合模式，例如不同宗教信仰、族裔或种族的人们的通婚程度；社会分层与流动的研究者则关心社会经济层面上的同型婚姻，考察社会的不平等程度。

4. 这类研究不可避免地带有优生学的意味，接受第二次世界大战的历史教训，对其阐释必须非常谨慎，社会学研究同样如此。

何以解释“同型婚配”“异型婚配”等不同婚配模式的成因呢？贝克尔(Becker, 1974, 1981)认为择偶的目的是增加婚姻的回报，因此某一维度上的相似属性如果互补的话，夫妻会在这一维度上采取同型婚配；如果是替代品的话，夫妻会在这一维度上采取异型婚配。⁵默顿(Merton，1941)的交换理论为异型婚配提供了另一种解释：夫妻的结合是双方不相等的社会与经济身份的交换。⁶

5. 贝克尔的用语与皮尔逊不同，容易造成误导。贝克尔把皮尔逊的同型婚配(assortative mating)称作positive assortative mating，而异型婚配(disassortative mating)称作negative assortative mating。有些欧美学者把后者也归入assortative mating，实在含糊不清。

6. 实际上默顿与贝克尔对异型婚配的解释非常不同，后者可以只发生在一个维度上，前者则描述多个维度不能兼得情况下的妥协。换句话说，交换理论下人们观察到的发生异型婚配的维度单独来看还是会受到夫妻无条件的青睐，拥有较高受教育程度、较低社会身份的男子如果有可能的话当然还是希望能选择较高受教育程度、较高社会身份的女子，只是在婚配市场中并没有足够的竞争力做到这一点。也就是说，交换理论说明的其实并非同型婚配或者异型婚配的机制，而是同型婚配受制于现实条件而得到的异型婚姻的结果。

基于这些理论，进行经验研究的社会学者提出了若干解释工业化社会同型婚配变化的中层理论，主要包括“经济不平等”和“性别不平等”两个视角。

“经济不平等假说”认为，社会不平等程度越高，不同社会经济地位的群体之间距离越远，彼此之间婚配的可能性也就越低，因为与地位较低的对象结婚代价更大(Blau，1977；Rytina, et al., 1988；Smits, et al., 1998)。在欧美国家，由于社会收入不平等主要受教育水平影响，因此经验研究中关于社会收入不平等与教育的同型婚姻的研究居多，并且似乎发现了支持“经济不平等假说”的证据。社会不平等程度越高，教育回报率越大，同型婚姻似乎就越有可能(Dahan and Gaviria, 2001；Fernandez, et al., 2005；Torche，2010)。

另一个重要的视角是性别不平等。从女性择偶的角度出发，性别不平等程度的降低、女性社会经济地位的提高，意味着女性在择偶中会淡化对男方经济情况的考量，即社会经济属性上的同型婚姻会减弱(Oppenheimer and Lew, 1995；Sweeney，2002)。从男性择偶的角度出发，性别不平等程度的降低、女性受教育程度和经济收入的提高，意味着更多男性有意追求社会经济地位较高的女性(England and Farkas, 1986；Sweeney and Cancian, 2004)，竞争带来同型婚姻的结果。简单来说，女性越来越不在乎男性的钱，男性越来越在乎女性的钱。尽管这两个研究假说看上去是要被女性主义抨击的论调，但是对于第二次世界大战前男权较盛的欧美社会来说的确是符合实际的，也得到了一些研究的支持。

以上综述当然无法涵盖这一领域的全部研究。对此感兴趣的读者可以进一步参考欧美学者相关研究的文献回顾(如Kalmijn，1998；Blossfeld，2009；Schwartz，2013)。在此概述是为了帮助读者了解欧美社会学在这一领域的问题意识及其所处的社会语境，为理解本研究打下基础。

(二) 同型婚姻与收入不平等

婚姻类型的增多或减少看似无伤大雅，但是同型婚姻引起越来越~~多学者的关注甚至屡次~~进入大众媒体的视野。⁷

7. 2012年起，《纽约时报》有近30篇文章提及同型婚配，并报道了学界认为它可能加剧了美国社会的不平等的观点。

如果遵循贝克尔的理论，美国家庭应普遍出现“男人工作、女人作为家庭主妇”的局面。这是因为工作与家务的劳动分工对夫妻提出了不同要求，夫妻用于外部劳动力市场的人力资本彼此成为替代品，致使异型婚配更有效率。在贝克尔写作的年代，这类安排或许是美国家庭的一种常见选择，但今天这一模式已经遭到挑战。20世纪60年代以来，随着美国女性受教育机会和工作机会的稳步增多，这种家庭分工已经被大大削弱，所占的比例从40%左右下降到20%左右。高收入的男性与高收入的女性结婚且女性婚后不退出劳动力市场的现象越来越常见。一个想当然的担忧是，富人与富人结婚、穷人与穷人结婚，自然家庭之间的贫富差距拉大，社会不平等程度上升。社会推进男女平权的努力可能导致家庭间贫富差距的拉大，这一吊诡的结果引起了欧美学界和民众的关心。很多学者对此进行研究，检验同型婚姻与社会不平等的关系。

有学者(Burtless，1999)发现夫妻工资收入的相关可以解释1979到1996年间不平等增加的13%；也有学者(Cancian and Reed, 1999)发现尽管相关确有增加，但解释的部分没有那么显著。施瓦兹(Schwartz，2010)发现，如果夫妻工资收入的相关程度保持在1967年到1970年的水平，家庭工资收入不平等增加的部分应该会下降25%到30%。

另一方面，由于在美国受教育程度与工资收入之间关系比较密切(Blossfeld and Timm, 2003)，学者担心即使不直接以工资匹配，考虑到社交网络或文化方面的原因，双方在受教育程度上进行匹配也可能导致同型婚姻增加、家庭工资收入不平等上升。但是，有学者(Western, et al., 2008)发现在有孩子的双亲俱在的家庭，教育同型婚姻并没有显著贡献；也有学者(Breen and Salazar, 2011)在对所有已婚夫妇和单户主家庭的研究中得到了类似的结论。克雷默(Kremer，1997)发现教育同型婚姻没有显著的长期的代际影响，但另有研究(Fernández and Rogerson, 2001)却得到了相反的结论。

对美国同型婚姻与社会不平等的讨论仍然众说纷纭，这一讨论也引发了学者对欧美其他国家进行研究的兴趣(如Breen and Salazar, 2010；Breen and Andersen, 2012)。回到对中国问题的研究上，被称作“般配”的同型婚姻实际上一直是中国社会关心的问题。借鉴欧美的定量研究框架对中国社会进行研究，不仅可以增进经验知识，还可以对理论有所补益。

(三) 同型婚姻的中国语境

需要注意的是，中国的国情与欧美社会不尽相同。首先，当今中国的社会不平等并非主要受教育水平影响，而是地域差异和城乡二元制度(Xie and Zhou, 2014)。其次，新中国革旧建新的一大努力就是提倡女性接受教育以及就业，因此女性受教育的机会一向不低，而且夫妻双方均参加工作是人们对家庭模式的主流预期。⁸即便传统观念中“男主外、女主内”的安排在改革开放前是主流，但由于中国大规模调查数据采集始于20世纪90年代，这一情况也难以用数据考察。最后，欧美国家的研究往往潜在地假定夫妻双方的收入与其婚姻彼此独立、夫妻的结合与其各自家族的经济情况独立。在个人主义盛行的欧美社会，这两个假设对大多数家庭来说与实际情况相差不远，但是在中国，这种假设就面临更大的挑战。虽然本文未能对此有所回应，但今后的研究可以在这一点上有所推进。

8. 实际上，在传统中国社会男耕女织的模式之下，女性已经承担了重要的生产任务，女性劳动力生产的手工制品是农村家庭重要的现金来源(周飞舟，2006)。

在同型婚姻问题上已经有不少中国学者进行了相关研究。在婚配机制的择偶观方面，徐安琪(2000)发现青年择偶时重视配偶的性格和人品，而社会经济地位方面的相关因素受重视的程度在近年才有所提升；孙秀艳(2002)认为，中国青年择偶观比较多元，在社会经济地位方面“般配”仍是很多人的选择。在同型婚姻的结果方面，李煜与陆新超(2008)发现，在不同维度上都能观察到匹配增强的情况；李煜(2008, 2011)认为，自致性维度发挥的作用不断加强，家庭背景的匹配相对稳定；齐亚强与牛建林(2012)研究发现，新中国成立以来受教育程度、职业和户口等自致性维度的匹配逐渐占据了主导地位，家庭背景的匹配程度下降了。

上述研究主要关心的是中国社会同型婚姻的程度及其变化趋势。在此基础上，同型婚姻与社会不平等的关联同样引人关注，其深层的动力不仅来自性别平等与经济平等之间的张力，而且来自对传统择偶价值观在转型期中国现代化的社会语境中如何发挥作用的兴趣。高收入者的婚姻结合可能导致阶层之间的差距在代际更迭中越来越大，社会流动性和社会开放性在这一自发的过程中遭到削弱。李静等(2015)采取再抽样(resampling)的方法发现，在夫妻个人和夫妻职业维度上都存在较强的同型婚姻，这加剧了家庭收入的不平等。有学者(Hu and Qian, 2015)兼取再抽样法和分解法(Breen and Salazar, 2011)发现，不断增多的教育同型婚姻拉大了不同教育组合的家庭间的收入差距，降低了相同教育情况的家庭间的收入差距，总体而言降低了城市夫妻的收入不平等程度。⁹

9. 这一研究对其再抽样法部分的阐释有误。它观察的是完全随机匹配和实际数据之间的差别，但实际数据反映的匹配过程并非只有教育这一个维度，因此两者之差反映的并非教育同型婚配的影响，而是所有维度上各种观察或未观察到的婚配机制的总效应。

本文关心同型婚姻与家庭工资收入不平等之间的关联，采用改进的置换检验方法，这一方法尤其适合进行夫妻匹配的模拟以及考察数据整体特征(例如家庭工资收入不平等指数)的变化，对后续研究具有一定的借鉴价值。本文以最有影响力的施瓦兹(Schwartz，2010)及布林和萨拉查(Breen and Salazar, 2011)的研究为主要参照对象，参考其问题意识和分析框架，采用新方法处理中国数据，希望能达到可比性与创新性的平衡。

(四) 研究设计与贡献

在中国，教育与社会分层和社会流动关系密切，“学而优则仕”是中国传统社会阶层流动的一种主要形式。中国开启现代化进程之后，教育仍与个体的社会地位和工资收入密切相关，同时也是人们择偶的重要标准。因此本文切入的角度是当代中国教育的同型婚姻与家庭工资收入不平等之间的关系，既借鉴欧美的研究问题为比较研究打下基础，又符合经验现实。

这里需要说明的一点是，本文所研究的“收入”(对应着英文研究中的earning一词)被限定为“工资收入”或者说“劳动收入”。何以这类研究主要关心的是工资收入？因为婚姻也是财产联合的过程，夫妻的总收入中有很大一部分可能源于双方共有的财产。例如，丈夫外出务工，妻子在家种地，那么种地卖粮的收入应不应该算作妻子的收入？所种之地本是丈夫户籍下分配的承包地，所付出的劳动则来自妻子，归属左右为难。又如，丈夫在外工作，主妇炒股挣钱，炒股所得应算作哪一方的收入？炒股本金来自丈夫的工资收入，而炒股的操作则全由妻子，归属又都为难。即便理论上可以在仔细研究后规定好来源所属，但实际调查中情况复杂，以往调查又未曾在意，数据勉强收集上来也未必准确。

同型婚姻论题的核心在于匹配，如果收入所属不清，则匹配难有效度。工资收入是个人工作所得，所属明确，独立性强，因此成为同型婚姻与不平等研究中相对容易研究清楚的问题。本文参照的两篇美国的研究同样也只讨论工资收入。当然这种简化也有代价，那就是社会中很大一部分人群的很大一部分收入实际上被忽略了。如何较好地估计收入的其他部分是后续研究应该关注的重要内容。

本文聚焦于两个实际问题：在当代中国社会，夫妻的受教育程度与工资收入有多相像？夫妻的教育匹配给整个社会的家庭工资收入不平等带来了怎样的影响？

为了回答这两个问题，本文采用LHSC1996与CGSS2012这两个截面数据，先采用对数线性模型测量夫妻在教育维度上的匹配程度、采用皮尔逊相关系数测量工资收入的相关程度，再使用改进的置换检验估量在控制年龄、地域和户口等变量之后，夫妻受教育程度的匹配对社会收入不平等指数泰尔指数(Theil Index)的影响。本文选取的是两个相对而言具有可比性的调查数据，希望通过对两个截面数据进行比较分析发现对发展趋势有益的信息。

在方法上，本文与此前的研究有所不同。本文主要采用的是改进的置换检验方法，这一方法的优势是它可以方便直观地控制更多变量。对数线性模型在测量同型程度时要求列联表中不宜有零值，而增加变量层数之后除非相应地增大样本数量，否则这一问题就难以避免，而这一问题在涉及年龄等定距变量时尤其麻烦。如果测量不准，按照以往方法进行不平等指数成分替换得到的结果就不一定准确。改进的置换检验方法可以模糊地控制定距变量，而且可以控制较多的变量而不必担心零值，因此对样本数量的要求降低了，计算所得的不平等指数的变化也更加可靠。

与此前研究相比，本研究的贡献不仅在于运用中国的社会调查数据考察了非欧美国家教育同型婚姻与家庭收入不平等的状况，还在于新方法带来了更加清晰的发现。布林和萨拉查(Breen and Salazar, 2011)指出，在历时的情况下，三种变化会导致教育同型婚姻的程度影响家庭工资收入不平等：受教育程度的收入回报率变了，某一受教育程度的收入回报的异质性变了，或者夫妻受教育程度的联合分布变了。实际上只有最后一点才是严格意义上的夫妻教育匹配对收入不平等的影响。本文所采用的模拟方法使社会成员自身的受教育程度和回报率都保持不变，而发生变化的仅仅是匹配结果，因此所得的结果也纯粹是同型婚姻的匹配对家庭收入不平等的影响。

二、数据与方法 (一) 数据：CGSS2012与LHSC1996

本文主要采用的是中国综合社会调查(Chinese General Social Survey，CGSS)2012年的数据。¹⁰这一调查为研究提供了11 765个家庭样本，对全国的家庭情况具有一定的代表性。这一调查着重收集了受访者及其配偶的信息，因此本研究聚焦于核心家庭的夫妻对，暂时无法有效地处理其他的家庭类型。如前所述，对中国社会进行研究，这一做法会导致一定程度上的信息遗失。这11 765个家庭并非都在研究的范围内。本文关注的是教育同型婚姻与社会收入分配的关联，为了得到具有可比性的样本，参照施瓦兹(Schwartz，2010)的研究设定如下条件：

10. 关于这一调查数据的情况，可进一步参考：http://www.cnsda.org/index.php?r=projects/view&id=85111874.

1. 家庭是指已婚的夫妻对构成的核心家庭，同居¹¹、未婚等其他没有配偶的情况不包括在内。

11. 同居共105例，尽管可能给本研究提供有益的信息，但是由于样本量较小，姑且忽略。

2. 夫妻中至少有一人有工资收入。

3. 丈夫的年龄在22岁至60岁之间且妻子的年龄在20岁至55岁之间。年龄划分的起点是我国的法定婚龄，上限是城市居民通常的退休年龄。这一条件保证了样本都有资格进入婚姻与就业领域，减弱外生的制度因素的影响。

4. 夫妻双方的受教育程度都不是缺失值。¹²

12. 据此剔除9例，样本的信息损失很小。

按照上述条件对CGSS2012进行筛选之后，得到了5 724个家庭案例，作为分析的样本。为了研究变化趋势，本文以生活史和当代中国社会变迁(Life Histories and Social Change in Contemporary China，LHSC)1996年的数据作为对比数据。这一调查是中国较早开展的大规模的有代表性的社会调查数据，共有6 473个家庭样本。这一调查的合作团队中国人民大学社会学系此后成为CGSS的实施团队，因此这两个调查存在一定的延续性。由于LHSC1996这一早期调查数据在不同变量上有若干缺失值，按照同样的条件筛选样本后，余下2 160个案例。对筛选后的样本各自进行加权，¹³得到LHSC1996的708 575个样本以及CGSS2012的713 741个样本。

13. 对于LHSC1996，按照其标准化后的家庭权重乘以500之后取整扩展样本，以得到与CGSS2012加权后规模差不多的样本。LHSC1996中有147个受访案例为村长，其标准化权重为“不适用”，不得不预先将其剔除。对于CGSS2012，按照家庭权重变量扩展样本。这种加权方式对LHSC1996而言些微损失了加权信息，但是不存在显见的系统性偏差。

本文之所以没有选取CGSS其他年份的调查数据用于对比，是由于它们要么城乡代表性较差(如CGSS2003)，要么缺乏单独的配偶工资收入变量而只有总收入变量(如CGSS2005、CGSS2006、CGSS2008、CGSS2010、CGSS2011)。如前所述，家庭总收入来源含混，无法作为本研究的研究对象。

(二) 自变量与控制变量

本文关心的主要自变量是教育维度上的同型婚姻。此外，在中国的社会语境下，户口、地域、年龄等变量对婚姻也具有重要影响。为此，本文在分析时逐步加入这些控制变量，试图分离出教育的作用。户口与地域的影响自不待言，为什么要把年龄作为控制变量呢？若不加控制，不论是采用传统的对数线性模型还是置换检验方法，在计算期望分布、建构反事实的时候，一位原本拥有30岁配偶的样本有同等的概率被匹配给任意年龄的配偶，这当然问题重重。受限于分析方法，此前研究未能有效地控制这一变量，本文对置换检验进行了改进，可以缓解这一问题。

上述变量之间当然存在内生性的问题，户口、地域和年龄都与受教育程度存在一定程度的相关，我们的分析并不能分辨哪一条路径真正发挥功效，何况就每个人而言，这个路径的结构都可能不同。截面数据对变量的内生性问题缺乏有力的应对策略，这是暂时无法解决的问题。

为了使分析框架在必要的程度上保持简洁，且可以与其他研究相比较，本文对户口和受教育程度进行了重新编码。

1. 核心自变量：教育

教育是本文格外关心的变量，我们不仅关心夫妻各自的受教育程度，还关心夫妻教育的联合分布，也就是教育同型婚姻的情况。本文对受教育程度进行了重新编码。在LHSC1996中，将“文盲”“能阅读”“私塾”编码为“无教育”，“初小”“高小”编入“小学”，“中专”并入“高中”。在CGSS2012中，将“没有受过任何教育”与“私塾”编码为“无教育”，“职业高中”“中专”和“技校”并入“普通高中”一类，“正规”与“成人”大专教育编为“大专教育”，“正规”与“成人”大本教育被编码为“大本教育”。本研究将受教育程度分为7类：无教育、小学、初中、高中、大专、大本、研究生。

为了衡量教育同型婚姻的程度，本文采用对数线性模型的线线相关(linear by linear association)来衡量夫妻教育的相关程度，也就能看出同型婚姻出现的比数(odds)是否显著地高于夫妻教育彼此独立情况下的期望值。这一模型可写作：

Log(μ_ij期望频数)=λ_i^{丈夫教育水平}+λ_j^{妻子教育水平} (1基本模型)

Log(μ_ij期望频数)=基本模型+β u_i v_j(2线线相关模型)

Log(μ_ij期望频数)=基本模型+λ_ij^{丈夫教育水平*妻子教育水平}(3饱和模型)

我们不需要关注饱和模型中各项的系数，因为它们只是相应项在列联表中对应的联合或边缘分布，只需要关注模型2中的β即可。由于基本模型及饱和模型不能带来有益的信息，模型2是唯一有价值的模型(见表 1)，这里为了节省篇幅就不详细报告模型筛选的情况。

表 1 线线相关模型交互项系数(教育水平相似程度)

结果表明，在中国社会，夫妻双方的受教育程度存在较强的正相关，教育同型婚姻比较普遍。与LHSC1996相比，CGSS2012的数据结果表明夫妻教育水平的正相关程度加强了。这一模型特别适合用来衡量定类变量的相似程度，与置换检验的契合度也非常高。值得一提的是，其测量的相似程度是排除了边缘分布变化之后的影响，因此主要是匹配的效果。

2.核心自变量：工资收入

工资收入与其他变量不同。在本文的研究框架下，置换检验就是直接改变夫妻工资收入的匹配，所以实际数据中工资收入的不平等程度与完全随机匹配得到的结果相比所得的差，就是在工资收入维度上的同型婚姻对家庭工资收入不平等的影响。

夫妻工资收入的相似程度如何测量是一个问题。施瓦兹(Schwartz，2010)采用对数线性模型加以测量，笔者在检验之后发现用这一方法识别工资收入的相关并不理想，因为离散化会损失太多信息。因此，本文通过两个普通的描述性方法报告夫妻工资收入的变化：一是计算双方均有工资收入的双收入家庭所占的比例，二是报告双收入家庭中夫妻工资收入的皮尔逊相关系数。

首先来看家庭结构的变化。根据表 2数据可知，在两个不同年代之间，我国的家庭结构和工资收入状况发生了巨大变化，这可能是因为越来越多的农民外出务工，甚至出现了很多夫妇均外出务工的情况，李代和张春泥(2016)对此现象有所讨论。具体而言，如果夫妻均在家种地，其收入不算作工资收入，这样的农村家庭就无法进入样本，所以各类家庭的比例变化未必是原本那些家庭发生了变化，而是很多家庭有了工资收入之后进入了样本。比较两个截面数据可以发现，城镇家庭的比例从64.1%下降到36.9%，这反映的不是城乡结构的实际变化，而是由于大量的农村家庭进入样本。

表 2 各类家庭所占的比例(%)

14. 两个调查对户口的统计不同，LHSC1996并没有区分受访者和配偶的户口类型，这可能是因为当时户口属性不一的家庭较为罕见，而CGSS2012则分别进行了调查。

无论是仅观察双城镇家庭的情况还是仅观察非双城镇家庭的情况，都可以看到双收入家庭的比重有明显的上升。这说明从有没有工资收入的角度观察夫妻的相似情况，在城镇、农村和总量上都可以看到双收入家庭在全部家庭中所占的比例大幅上升，这也支持了夫妻收入变得更加相像的看法。

再来看双方均有工资收入的家庭中夫妻收入相似程度的变化趋势。为了获得比较稳健的结果，本文计算了三种相关系数：对夫妻双方工资收入的绝对值、工资收入的对数以及在各自性别的收入队列中的百分位数分别计算皮尔逊相关系数，结果如表 3所示。从LHSC1996到CGSS2012，可以看到很明显的夫妻收入相关系数增大的结果，在不同方式的测量下相关性是比较稳健的，进一步支持了工资收入维度上同型婚姻增多的判断。

表 3 夫妻工资收入相似程度的皮尔逊相关系数

3.控制变量：户口

本文把CGSS2012的户口变量进行了重新编码，“以前是农业户口的居民户口”被编码为“农业户口”，“蓝印户口”“以前是非农户口的居民户口”和“军籍”被编为“非农户口”。居民户口是新政，单独划归一类并无太大的解释力；“蓝印户口”为暂住和新的非农户口之间的过渡期所用，通常是常驻城市的人口，因此编为非农户口比较合理；“军籍”比较复杂，但是一来定然从事“非农”的工作，二来所占数目较小，三来对持有者的社会流动有正向影响(Zhang，2013)，编为非农户口比较合理。LHSC1996中询问户口的问题有三个选项，农业、非农和未注册，与CGSS2012的数据可比。¹⁵表 4报告的是加权之后的夫妻户口分布的比例。

15. 值得一提的是，LHSC1996假定夫妻户口均相同；而在CGSS2012中，对夫妻双方的户口信息都进行了收集，夫妻两人户口类型可能不同。

表 4 夫妻户口的联合分布(%)

4.控制变量：地域

本文以省一级为单位划分地域，所用的变量是“访谈所在省/自治区/直辖市”，夫妻双方在这一变量上取值一致。LHSC1996的案例覆盖26个省级行政区划，¹⁶CGSS2012的案例覆盖29个省级行政区划，具体的地域分布可查询该调查的基本介绍，在此不赘述。

16. 重庆于1997年恢复成为直辖市。

5.控制变量：年龄

本文用受访年份减去出生年变量获得夫妻二人的年龄信息。这虽然并不完全准确，但误差较小，在本文的分析方法中不会产生特别重大的影响。用丈夫年龄减去妻子年龄获得夫妻的年龄差，多数情况下丈夫年龄比妻子大且年龄差多数在5岁以内。

(三) 因变量：工资收入的泰尔指数

本文研究教育同型婚姻的状况与中国社会收入不平等之间的关系。参考布林和萨拉查(Breen and Salazar, 2011)的做法，本文用于测量收入不平等的方法是对核心家庭夫妇双方的工资收入之和计算泰尔指数。

在众多测量不平等的指标中选用泰尔指数是因为它具备可分解的特点。泰尔指数是从信息论对信息熵的一般表达式修改而来，公式如下：

$ {\text{T = }}\frac{1}{n}\sum\limits_{i = 1}^n {\frac{{{x_i}}}{{\bar x}}} \ln \left[ {\frac{{{x_i}}}{{\bar x}}} \right] $

其中，T代表泰尔指数(Theil Index)，n为样本量，x_i为第i个案例的值，x是样本平均值。如果样本中的数据完全相等，则泰尔指数为0；反之则为1。它可以被拆解成如下形式：

$ {\text{T = }}\sum\limits_j {{p_j}} \frac{{{{\bar x}_j}}}{{\bar x}}\ln \left({\frac{{{{\bar x}_j}}}{{\bar x}}} \right) + \sum\limits_j {{p_j}} \frac{{{{\bar x}_j}}}{{\bar x}}{T_j} $

其中，p_j表示第j组在样本中所占的比例，x_j表示第j组的均值，T_j表示第j组自己的泰尔指数。该表达式的前半部分衡量组间的不平等程度，后半部分则衡量组内不平等程度按组大小加权后的值。在本文的分析中，由夫妻受教育程度交互组成的49种情况就是本研究关心的组。对本研究的样本数据进行计算，得到的泰尔指数如表 5所示：

表 5 家庭工资收入不平等指数的总体情况

为了与其他研究进行比较，本文还计算了研究样本的基尼系数。与使用CGSS2012数据的相关研究(Xie and Zhou, 2014)计算的按家庭规模权重调整后的0.563相比，数值较为接近。两个系数略有差别的原因可能在于后者的数据包含的不只是已婚核心家庭，还有未婚单人家庭和扩展家庭；收入来源不只是工资收入，还有其他方面的收入。泰尔指数与基尼系数之间不存在简单的线性关系，二者之间难以直接进行转化。不过二者的表现趋势相近，通过对二者的比较可以合理地认识家庭工资收入的不平等程度。

就某一年的截面数据而言，泰尔指数并非“变量”，作为某一特定时点的数据，谈不上“变”。为此，我们必须通过合理的方法找到它的“反事实”(counterfactual)。反事实并不是指与实际情况相反，而是说如果条件变化了，研究所关心的因变量会变成什么样。在本文中这意味着，如果同型婚姻的现状改变了，相当于所有已婚人士按照一定规则重新匹配伴侣，家庭工资收入的不平等程度会有何变化。要实现这一研究目的，本文采用改进的置换检验方法进行模拟分析。¹⁷

17. 关于该方法的详细说明和形式化讨论请与作者联系索取。

(四) 研究方法：置换检验

使用截面数据研究社会不平等这一对总体情况的概括性变量，最大的问题在于因变量只有一个点，没有变化的余地。因此，我们要合理地计算其反事实的情况，分析各个因素的影响。

本文提出的方法是一种改进的置换检验方法。简单而言，就是按照一定条件把夫妻配对打乱重来，对每一次重新组合的数据计算一次泰尔指数，以此给观察数据提供反事实结果。置换检验是统计学中进行重复抽样(resample)的一种重要方法，广泛应用于自然科学与社会科学的许多领域。得益于统计分析软件与硬件的进步，现在研究者可以更轻易地使用这类方法处理大量数据，绕开缺失值问题或者缓解数据违背参数方法的重要假设的问题。关于置换检验的基本情况，古德(Good，2000)进行了详尽的介绍。下面笔者谨摘录此书内容简要介绍置换检验的基本思想。

最基本的置换检验(Fisher，1935；Pitman, 1937, 1938)可以总结为如下步骤：

1. 选择一个要检验的统计量，即S(T)。

2. 对初始的数据计算S(T)。

3. 不断随机地重复排列观测值并在每一次重新排列后计算S(T)，从而获得S(T)的置换分布。

4. 根据初始数据S(T)与其置换分布临界值的相对关系，选择接受或拒绝原假设。

当初始数据的S(T)难于处理时，可以把它的数值转化为排序(rank)并实施类似的步骤。显然，置换检验的一个充分条件是在原假设下观测值可以彼此交换。与之类似的另一个重复抽样方法是自展法(bootstrap)，其与置换检验相比主要区别在于置换检验的重复排列相当于无放回抽取，而自展法是有放回抽取，也就是说经过自展法得到的数据中可能出现重复的观测值。

在本研究的实际操作中，即按照一定的条件重新分配夫(或妻，择一即可)的家庭编号，再通过编号与配偶进行匹配。重新匹配之后计算家庭工资收入总和，再对该次模拟计算泰尔指数并记录在案。

如果打乱编号的过程是在全部家庭范围内发生的，那么获得的泰尔指数反映的就是在社会成员完全随机选择配偶的前提下，家庭工资收入不平等的程度。经验来看，这一不平等程度未必是最低的，但与实际情况相比随机配对的结果应该较低，因为实际上人总有某种正向的选择偏好。

在此基础上，我们可以逐步加入定类变量，探讨其影响。置换检验可以通过对协变量的控制考察不同因素对S(T)的影响。控制协变量有两种策略：有学者(Gail, et al., 1988)建议先通过参数方法(例如线性回归)剔除协变量与S(T)的函数关系，再对残差进行置换检验；另一种方法是限制随机化(restricted randomization)(Edgington，1983)，如果协变量取值较少，那么可以在协变量的不同组合构成的组内进行置换检验，从而剔除协变量的影响。

具体来说，如果仅在同一户口身份的丈夫之间重新分配其编号，再与编号未改变的妻子进行匹配，那么虽然每次模拟某一个特定案例匹配到的丈夫未必相同，但所匹配到的丈夫总与其观察数据中的丈夫具有相同的户口身份。这就意味着，户口身份的联合分布保持不变。也就是说，这时候观察到的泰尔指数是控制了户口这一变量的联合分布之后得到的结果，其高低反映了人们在户口这一维度上进行匹配所造成的影响。与没有控制这一变量时相比，泰尔指数的变化就是这一维度上的同型婚姻对家庭收入不平等产生的影响。

但是上述处理协变量的方法不能有效地应对连续变量。罗森鲍姆(Rosenbaum，1984)指出这一方法对于连续变量来说很难适用，因为连续变量在每一个取值上数量有限，导致协变量组合对应的观测值太少。可以想象，在这种情况下严格地限制随机化所得的结果与初始数据不会有太大区别，意义不大。一种解决办法是把连续变量分组进而转化成取值较少的离散变量，但是这种“放到框里”的做法会人为地制造边界，例如设立30岁以下组，29岁的人就只能与28岁的人交换位置，尽管28岁的人可以与27和29岁的人交换位置，这样在边界附近的案例和中间的案例进行匹配的概率出现了人为制造的不同。

笔者尝试对限制随机化进行改进，在新的框架下把对全体的置换检验、限制随机化和对连续变量的处理统一到一起，这种改进的方法可称作“模糊置换检验”。在新的框架下理解置换检验，我们可以采取一种改进的策略应对连续变量。这一方法并不能化解罗森鲍姆指出的所有问题，但能有所帮助。改进的置换检验过程可以分为如下步骤：

1. 选择一个要检验的统计量，即S(T)。

2. 对初始的数据计算S(T)。

3. 选取关心的协变量X，对每一个X的观测值x按照离散的概率分布p加上一个随机数δ，获得新的协变量X’，并在X’的取值构成的组内重新排列观测值并重新计算S(T)。

4. 不断重复步骤3，从而获得S(T)的置换分布。

5. 根据S(T)与其置换分布临界值的相对关系，选择接受或拒绝原假设。

具体来说，就是在重新分配编号之前，先在变量取值上以一定的概率分布加一个值，以利于随机变化之后的取值分组进行重新分配，相当于使分组配对具有了“模糊性”。例如，某一29岁的丈夫在随机增减的过程中变成31岁，也就意味着他会与另一位随机增减后变为31岁的丈夫交换位置。如果上文这第二位丈夫原本年龄即为31岁，也就意味着第一位丈夫的配偶放松了在年龄上的择偶标准，在一定概率下匹配了一位年龄比元配大两岁的丈夫。

新的方法作为对置换检验的一种改进较好地解决了“放进框里”的弊病。年龄的限制作用有了一定的模糊性，对每一个个案重新进行匹配的概率分布也不会被人为地截断。上述置换检验采取的是无放回抽取，较少遗漏信息。

随机取值的概率分布决定了“模糊性”的程度。如果概率分布较为集中，则模糊性较低；若概率分布扁平，则模糊性高。这一概率分布作为研究者人为设定的参数，可以按照需要合理地进行调整。本文仅对年龄变量采取了模糊置换检验，设定的概率分布是把夫妻年龄差限制在两岁以内得到的比例分布，并将其对称化。这意味着在极端的情况下，按照年龄重新配对的实际范围可达上下4岁。¹⁸

18. 本文采用R 3.2.5进行演算，源文件已在《社会》杂志官网公开，rmd格式的文件可用RStudio打开。

本文在每一次模拟中对样本中的丈夫实施700次随机配对程序，在多次模拟间逐步加入年龄、户口、省份等控制变量，再加入教育变量考察教育同型婚姻的影响。通过比较观测值与多次模拟得到的统计量置换分布的关系，可以计算含义类似参数模型的p值。但是要获得统计量准确的置换分布，理论上来讲要进行N的阶乘次结果不同的置换，这对于一个有70万个案的样本来说是无法处理的天文数字。由于有限次置换检验得到的均值会向总体均值收敛，因此模拟次数达到一定规模就可以了。由于样本量巨大，本文进行的模拟次数肯定无法得出令人满意的置换分布(参考Knijnenburg, et al., 2009)，但如果目的仅是以其均值估计总体情况的话，所得的结果大概足以符合要求。

三、研究结果

表 6显示的是加入不同变量的若干次模拟所得的泰尔指数及其构成。不仅包含了每一次模拟的结果，还计算了与完全随机相比，每一次改变控制变量所计算出的组间不平等和总不平等的泰尔指数的增幅。

表 6 置换检验模拟所得的泰尔指数平均数及其构成¹⁹

19. 增幅表示该次模拟与完全随机时平均水平相比的增长率。

模拟a显示的是完全随机匹配得到的泰尔指数均值，图 1上方黑线表示的是截面数据的观测值。二者相距甚远，说明目前中国社会收入不平等的局面经由某种匹配机制产生，而且匹配的总效应加剧了家庭工资收入的不平等。

图 1 LHSC1996和CGSS2012各次模拟结果产生的平均泰尔指数²⁰

20. 误差条通过该次模拟所得的最大值和最小值获得，如前文所说，由于次数较少置换分布不够理想，其含义不是真正的误差。下同。

模拟b是仅控制受教育程度的影响。这相当于受教育程度维度上的匹配发生的主效应。

模拟c是控制了年龄后泰尔指数的变化程度，变化幅度很小，表明年龄上的匹配或者同期群效应尽管理论上可能有影响，但实际上并没有发挥很大作用。

模拟d和e分别控制了户口和省份，泰尔指数大幅增长，说明中国家庭工资收入的情况在城乡之间和地域之间差别很大，总的不平等有很大一部分可以分解为城乡之间与地域之间的不平等。

模拟f是控制了年龄、户口和省份三个变量后加入受教育程度对泰尔指数分布及其均值的影响。与模拟e相比，这一增幅也就是控制了若干合理变量之后，夫妻教育的联合分布给家庭工资收入不平等带来的净影响。

比较LHSC1996和CGSS2012这两个数据不同模拟的结果可以发现：

首先，与LHSC1996相比，CGSS2012中社会总的家庭工资收入不平等程度较高，而且与各自的完全随机模型相比，CGSS2012在各种维度上的匹配对不平等的影响幅度较大。

其次，各类变量在不同年份对不平等的影响性质差不多。与完全随机匹配相比，本文考察的各个维度上的匹配都对家庭工资收入不平等有正向的影响。其中，城乡和地域的影响较大，这与此前研究的发现相一致(Xie and Zhou 2014)。

第三，很明显的是，与LHSC1996相比，受教育程度上的匹配对不平等的影响在CGSS2012中大幅提高。在LHSC1996中，受教育程度的影响与“年龄+户口”差不多；而在CGSS2012中，其影响上升了一个台阶，超过了“年龄+户口”的影响程度。不论是考虑绝对值还是与完全随机模拟相比，这一增幅都引入注目；不论是仅仅考虑主效应还是在控制了其他变量之后，受教育程度这一维度上的匹配都加剧了不平等。

最后，研究发现组内不平等数值比较大而且比较稳定，这说明中国的家庭工资收入不平等按照目前的教育分组，主要是由组内的工资收入异质性推动的，也就是说是由相同教育程度对应的工资回报的差异推动的。这个差异可能有两个来源：一是已经纳入本文模型的年龄、户口和省份等控制变量的作用以及没有纳入控制的其他变量的作用；二是由于对教育层级的划分不够细，不足以反映教育在婚姻和就业市场上所发挥的实际作用。例如，婚姻和就业市场可能会有效地对大学本科中的不同情况进行细分，例如非重点大学的个体不被考虑作为结婚对象或不会被录用，本研究的划分方式未能有效地捕捉到这一实际存在的异质性。但是划分过细可能会高估教育同型婚姻的效果，而且调查数据也不支持过度细化。本研究认为从中国社会的现实出发，目前的7级划分是比较合理的，当然仍有进一步改进的空间。

比较组间不平等和总不平等的增幅还可以发现，组间不平等变化较大，而且组间不平等的增幅与总不平等相比更大。也就是说夫妻教育的不同组合内部不平等情况比较稳定，受前述变量的影响小；而不同组合之间的收入差距受前述变量的影响较大。由于本文是按照教育组合进行分组的，加入教育变量的效果在意料之中。如果户口与省份对不平等的影响与教育是独立的，应该观察到仅控制户口与省份的模拟其组间不平等与完全随机模型相差不多。这说明三个变量之间是彼此联系的。

总之，本文的研究表明，在中国的社会语境下，教育同型婚姻导致社会整体的家庭工资收入不平等程度上升，而且教育同型婚姻的这一效应有增强的趋势，即使控制了一些重要变量之后仍然如此。

为了检验研究的稳健性，本文参照以往研究，把样本局限为具有双城镇户口的双收入家庭，重复前面的主要分析。为了让加权更具可比性，比照符合条件的CGSS2012的数据情况，把LHSC1996数据的加权倍数调整为312，扩展后取整，得到两个大小接近的样本。计算结果如表 7所示：

表 7 线线相关模型交互项系数(教育水平相似程度)

就LHSC1996而言，教育相似程度略有下降；就CGSS2012而言，教育的相似程度略有上升。两个变化的幅度都很小，但也验证了上文发现的变化趋势。工资收入的相关程度可参照上文，几乎没什么变化。

再来观察置换检验的结果，如图 2所示。结果显示不平等水平总体有明显下降，各变量的影响改变不大，但是绝对值下降了一定的幅度，而由于基数变小，相对影响反而略有增大。尤其需要注意的是，“户口”变量加入之后影响几乎可以忽略不计，这说明置换检验的框架对该变量的控制是有效的，此前在这一维度上所表现出来的效果很大程度上是城乡家庭的差别。附上稳健性分析的结果数据，如表 8所示。

图 2 双收入双城镇家庭样本的稳健性分析

表 8 置换检验模拟所得的泰尔指数平均数及其构成²¹

21. 增幅表示该次模拟与完全随机时平均水平相比的增长率。

可以看出，各个变量在增幅上变化很小，这可能是抽样波动导致的，也就是说除了户口变量的效果被抵消之外，其他变量可能与正文的分析没有本质差异。

四、结论与讨论

正如本文在开篇提到的，同型婚姻与社会的家庭收入不平等问题之所以在欧美社会引发关注，核心的张力在于两种社会理想的矛盾。女性受教育程度与社会经济地位的提升是性别平等方面的进步，自然是值得称许的。但在婚配机制中如果同型婚配较多，高收入者与高收入者联姻，那么相应的结果就是家庭之间的经济鸿沟扩大、社会不平等的程度提高，这是当前欧美社会最担忧的社会问题。²²

22. “不平等”这一翻译并不十分完美。英文或法文中的“equality/ égalité”既可表示“平等”，又可表示“相等”。“平等”有价值判断的含义，例如法国大革命的口号“自由、平等、博爱”，美国《独立宣言》声称“人人生而平等”。另一方面，“相等”只是算术结果，是统计事实，不能进行任何价值判断。定量研究充其量能够计算“相等”，至于是否“平等”则需质性研究乃至社会理论与哲学的帮助。对所谓“不平等研究”的这一局限不能不加注意，故作惊人之语并非学者宜为。本文以为即便同型婚姻造成了“不相等”的增加，在现代社会自由结合的条件下未必是“不平等”的增加。可惜“收入不相等”并非现成的学术语言。

在中国，这一担忧同样存在。但是与欧美社会不同的是，我国改革开放以来的社会变化，其起点是意识形态力倡“工作无贵贱、男女都一样”的计划经济体制结束不久后的改革开放初期；而美国社会比较的基点是第二次世界大战后女权与民权运动开始产生较大效果的20世纪60年代，情况大大不同。尽管在统计分析时并无本质差异，但结果的指向却不一定相同。

随着改革开放的持续进行，我国的城市化、工业化带来了翻天覆地的变化，家庭安排也随之改变，进而改变了不同维度上的同型婚姻与工资收入不平等之间的关系。头等变化在于农民更深入地参与到有工资的劳动市场中来，尤其是来自农村的女性。国内有很多关于这方面的优秀研究，这里不再赘述，而其与本文论题的关系还需要更丰富的数据和进一步的研究加以考察。与欧美国家相比，中国的案例给研究者提供了一个难得的机会，可以了解国家主导的快速城市化与工业化进程中，家庭构成的变化与社会不平等之间的关系。在此基础上进行合理的国际比较研究可能为相关理论带来贡献。

本文的初步研究表明，这一进程中我们能观察到夫妻在工资收入和受教育程度方面的相似程度大大提升，而这一变化对社会整体的家庭工资收入不平等有显著影响，且这种影响还可能持续增加。具体而言，如果没有收入同型婚姻，家庭工资收入不平等在LHSC1996中会下降21.4%，在CGSS2012中会下降23.7%。收入同型婚姻可能是通过教育同型婚姻实现的。如果没有教育同型婚姻，家庭工资收入不平等在LHSC1996中会下降3.1%，在CGSS2012中会下降9.3%。控制了协变量之后，如果没有教育同型婚姻，家庭工资收入不平等在LHSC1996中会下降4.0%，在CGSS2012中会下降5.1%。²³尽管看上去教育同型婚姻的影响不大，但要考虑到它在收入同型婚姻的效果中占20%以上的比重，因此，教育同型婚姻是非常重要的影响因素。

23. 第一组通过计算(观察数据-a)/观察数据得到，第二组通过计算(b-a)/观察数据得到，第三组通过计算(f-e)/观察数据得到。

另一个问题是农村家庭与城市家庭的收入结构非常不同，而且丈夫务工而妻子留守或者丈夫富有而妻子主妇导致的妻子无工资收入家庭的分布对研究可能造成影响。为了检验研究结果的稳健性，笔者把样本进一步局限为夫妻均有工资收入且均为非农户口的城镇样本重复了前面的分析。分析表明，总体而言，前面的结论得到了验证，各个变量的影响和相互关系变化不大，除了“户口”变量。限制了样本之后，第一，总不平等幅度下降，控制了各个变量之后不平等程度也相应下降。就两个截面数据而言，各个变量的影响都在绝对值上下降了，但由于基数变小，相对影响不一定变小。第二，“户口”作为控制变量的效果几乎失去了，这也说明本文采取的分析框架对变量的控制是有效的。总之，稳健性分析基本支持了前面的分析。稳健性分析的另一个好处是，置换检验的方法需要很多次置换才能获得比较准确的置换分布(Knijnenburg, et al., 2009)，而本文处理的样本太大运算资源不足，并不能完成这一任务。稳健性分析之下各变量的行为符合正文的分析，这让笔者对整个分析更有信心。

需要指出的是，尽管同型婚姻与家庭工资收入不平等之间的关系可以通过婚配选择进行解释，但是这一关联并不局限在婚配机制上。可以想见，调查数据收集的信息并不是结婚时的数据，例如工资收入并非结婚时双方的收入，因此不能确切地用以解释二人的结合，尽管听上去有一定道理。类似地，在截面数据中可以观察到夫妻长相接近的程度，研究者可以推测有夫妻相的人更易结婚，但截面数据观察到的结果也可能是由于夫妻长期共同生活越长越像，孰是孰非难以判断。

正如前面一再强调的，采用常规的调查数据只能观察同型婚姻，无法确切地指向同型婚配，用婚配机制的变化解释同型婚姻变化的缘由是研究者的理论推测。本文研究的对象是“同型婚姻”而非“同型婚配”，研究的是婚姻的变化而非择偶行为，尽管后者与理论的联系更加紧密。本文在前面使用“匹配”“选择”这些词语主要是为了行文方便，准确所指应是夫妻双方某属性相像的这种静态的情况。这是类似研究的共同局限，而采用新数据新方法进一步厘清择偶行为以及夫妻婚后某一属性的变化影响的大小，是未来研究的很好课题。

最后，笔者把受教育程度作为核心变量，控制了年龄、城乡和地域等协变量，但可能还有其他维度上的匹配——如行业、职业、父母的收入和受教育程度等——间接导致受教育程度呈现为目前的匹配现状，这需要进一步研究才能解答。另外，本文只关注了夫妻的工资收入，尽管有理论对话的充分理由，但是在中国社会，夫妻各自的财富、双方父辈家庭的收入与财富情况对婚姻也有显著影响。在有可靠数据的基础上，研究者可通过扩展本文提供的置换检验的研究框架进行更细致的研究。

参考文献（Reference）

[]	李代, 张春泥. 2016. 外出还是留守?——农村夫妻外出安排的经验研究.社会学研究(5): 139-163.
[]	李静, 潘丽群, 踪家峰. 2015. "门当户对"加剧收入不平等吗. 统计研究(11): 65-71.
[]	李煜. 2008. 婚姻的教育匹配:50年来的变迁.中国人口科学(3): 73-79.
[]	李煜. 2011. 婚姻匹配的变迁:社会开放性的视角.社会学研究(4): 122-136.
[]	李煜, 陆新超. 2008. 择偶配对的同质性与变迁——自致性与先赋性的匹配.青年研究(6): 27-33.
[]	齐亚强, 牛建林. 2012. 新中国成立以来我国婚姻匹配模式的变迁.社会学研究(1): 106-129.
[]	孙秀艳. 2002. 青年择偶标准的历史演变和现实思考.社会, 22(4): 42-44.
[]	徐安琪. 2000. 择偶标准:五十年变迁及其原因分析.社会学研究(6): 18-30.
[]	周飞舟. 2006. 制度变迁和农村工业化——包买制在清末民初手工业发展中的历史角色. 北京: 中国社会科学出版社.
[]	Becker, Gary. 1974."A Theory of Marriage." In Economics of the Family:Marriage, Children, and Human Capital, edited by Schultz Theodore W. Schultz.Chicago: University of Chicago Press: 299-344.
[]	Becker, Gary. 1981.A Treatise on the Family.Cambridge: Harvard University Press.
[]	Blau, Peter. 1977.Inequality and Heterogeneity:A Primitive Theory of Social Structure.New York: Free Press.
[]	Blossfeld, Hans-Peter. 2009. "Educational Assortative Marriage in Comparative Perspective". Annual Review of Sociology, 35: 513-530.
[]	Blossfeld, Hans-Peter, Andreas Timm. 2003.Who Marries Whom?:Educational Systems as Marriage Markets in Modern Societies.Dordrecht: Kluwer.
[]	Breen, Richard, Signe Hald Andersen. 2012. "Educational Assortative Mating and Income Inequality in Denmark". Demography, 49: 867-887.
[]	Breen, Richard, Leire Salazar. 2010. "Has Increased Women's Educational Attainment Led to Greater Earnings Inequality in the UK?:A Multivariate Decomposition Analysis". European Sociological Review, 26: 143-158.
[]	Breen, Richard, Leire Salazar. 2011. "Educational Assortative Mating and Earnings Inequality in the United States". American Journal of Sociology, 117: 808-843.
[]	Burtless, Gary. 1999. "Effects of Growing Wage Disparities and Changing Family Composition on the U.S. Income Distribution".European Economic Review, 43(4): 853-865.
[]	Cancian, Maria, Deborah Reed. 1999. "The Impact of Wives' Earnings on Income Inequality:Issues and Estimates". Demography, 36(2): 173-184.
[]	Dahan, Momi, Alejandro Gaviria. 2001. "Sibling Correlations and Intergenerational Mobility in Latin America". Economic Development and Cultural Change, 49: 537-554.
[]	England, Paula, George Farkas. 1986.Households, Employment, and Gender:A Social, Economic, and Demographic View.New York: Aldine.
[]	Edgington, Eugene. 1983."The Role of Permutation Groups in Randomization Tests".: 121-135.
[]	Fernandez, Raquel, Nezih Guner, John Knowles. 2005. "Love and Money:A Theoretical and Empirical Analysis of Household Sorting and Inequality".Quarterly Journal of Economics, 120: 273-344.
[]	Fernández, Raquel, Richard Rogerson. 2001. "Sorting and Long-Run Inequality". Quarterly Journal of Economics, 116(4): 1305-1341.
[]	Fisman, Raymond, Iyengar Sheena S., Emir Kamenica, Itamar Simonson. 2006. "Gender Differences in Mate Selection:Evidence from a Speed Dating Experiment". Quarterly Journal of Economics, 121: 673-697.
[]	Fisher, Ronald. 1935.Design of Experiments.New York: Hafner.
[]	Gail, Mitchell, Wai-Yuan Tan, Steven Piantadosi. 1988. "Tests for No Treatment Effect in Randomized Clinical Trials". Biometrika, 75: 57-64.
[]	Good Phillip. 2000.Permutation Tests:A Practical Guide to Resampling Methods for Testing Hypotheses.New York: Springer.
[]	Hitsch, Günter, Ali Hortaçsu, Dan Ariely. 2010. "Matching and Sorting in Online Dating".American Economic Review, 100: 130-163.
[]	Hu Anning, Zhenchao Qian. 2015. "Educational Homogamy and Earnings Inequality of Married Couples:Urban China, 1988—2007". Research in Social Stratification and Mobility, 40: 1-15.
[]	Kalmijn Matthijs. 1998. "Intermarriage and Homogamy:Causes, Patterns, Trends". Annual Review of Sociology, 24: 395-421.
[]	Knijnenburg Theo, Lodewyk Wessels, Marcel Reinders, Ilya Shmulevich. 2009. "Fewer Permutations, More Accurate P-values". Bioinformatics, 25: i161-i168.
[]	Kremer Michael. 1997. "How Much does Sorting Increase Inequality". Quarterly Journal of Economics, 112(1): 115-139.
[]	Logan, John. 1996. "Rules of Access and Shifts in Demand:A Comparison of Log-Linear and Two-Sided Logit Models". Social Science Research, 25: 174-199.
[]	Merton Robert. 1941. "Intermarriage and the Social Structure:Fact and Theory". Psychiatry, 4: 361-374.
[]	Oppenheimer Valerie, Vivian Lew. 1995."American Marriage Formation in the Eighties:How Important was Women's Economic Independence?" In Gender and Family Change in Industrialized Countries, edited by Karen Oppenheim Mason and An-Magritt Jensen.New York: Oxford University Press: 105-138.
[]	Pearson Karl. 1896. "Mathematical Contributions to the Theory of Evolution. Ⅲ. Regression, Heredity, and Panmixia." Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 187: 253-318.
[]	Pearson Karl, Alice Lee. 1902. "On the Laws of Inheritance in Man:Ⅰ. Inheritance of Physical Characters". Biometrika, 2: 357-462.
[]	Pitman Edwin. 1937. "Significance Tests Which May be Applied to Samples from any Population". Journal of the Royal Statistical Society Supplement, 4: 119-130.
[]	Pitman Edwin. 1938. "Significance Tests Which May be Applied to Samples from any Population. Part Ⅲ. The Analysis of Variance Test". Biometrika, 29: 322-335.
[]	Rosenbaum Paul. 1984. "Conditional Permutation Tests and the Propensity Score in Observational Studies". Journal of the American Statistical Association, 79: 565-574.
[]	Rytina Steven, Peter Blau, Terry Blum, Joseph Schwartz. 1988. "Inequality and Intermarriage:A Paradox of Motive and Constraint". Social Forces, 66: 645-675.
[]	Schwartz Christine. 2010. "Earnings Inequality, the Changing Association between Spouses' Earnings". American Journal of Sociology, 115: 1524-1557.
[]	Schwartz Christine. 2013. "Trends and Variation in Assortative Mating:Causes and Consequences". Annual Review of Sociology, 39: 451-470.
[]	Smits Jeroen, Wout Ultee, Jan Lammers. 1998. "Educational Homogamy in 65 Countries:An Explanation of Differences in Openness Using Country-Level Explanatory Variables". American Sociological Review, 63: 264-285.
[]	Sweeney Megan. 2002. "Two Decades of Family Change:The Shifting Economic Foundations of Marriage". American Sociological Review, 67: 132-147.
[]	Sweeney Megan, Maria Cancian. 2004. "The Changing Importance of White Women's Economic Prospects for Assortative Mating". Journal of Marriage and Family, 66: 1015-1028.
[]	Torche Florencia. 2010. "Educational Assortative Mating and Economic Inequality:A Comparative Analysis of Three Latin American Countries". Demography, 47: 481-502.
[]	Western Bruce, Deirdre Bloome, Christine Percheski. 2008. "Inequality among American Families with Children, 1975 to 2005". American Sociological Review, 73(6): 903-920.
[]	Xie Yu, Xiang Zhou. 2014. "Income Inequality in Today's China". Proceedings of the National Academy of Sciences of the USA, 111(19): 6928-6933.
[]	Zhang Chunni. 2015. "Military Service and Life Chances in Contemporary China". Chinese Sociological Review, 47(3): 230-254.