文章快速检索     高级检索
  南方经济  2016, Vol. 35 Issue (6): 38-50  
0

引用本文 

胡志军, 谭中. 我国居民收入基尼系数的估计及城乡阶层效应——基于城镇、农村收入20分组数据的研究[J]. 南方经济, 2016, 35(6): 38-50.
Hu Zhijun, Tan Zhong. The Estimation of Income Gini Coefficient in China and Its Stratification Effect: based on the new 20 grouped data of urban and rural[J]. South China Journal of Economics, 2016, 35(6): 38-50.

基金项目

本研究受国家社会科学基金青年项目“具有普惠金融内涵的金融发展与我国居民收入分配的失衡调整研究”(14CJY064)和江西省高校人文社科项目“金融发展、普惠金融与居民收入分配问题研究(基地招标)”(JD1457)的资助。

作者简介

胡志军,江西财经大学,金融发展与风险防范研究中心、金融学院讲师,E-mail:hzhj.0325@163.com,通讯地址:江西省南昌市双港东大街169号蛟桥园北区翼轸楼117室,邮编:330013;
谭中,上海财经大学金融学院,E-mail: ztanshufe@163.com,通讯地址:上海市杨浦区国定路777号,邮编:200433。 感谢《南方经济》编辑部及匿名审稿专家的宝贵意见,作者文责自负。
我国居民收入基尼系数的估计及城乡阶层效应——基于城镇、农村收入20分组数据的研究
胡志军, 谭中     
摘要: 基于2013年调整的城镇、农村居民20分组收入数据,文章再估计了我国2005-2012年的城镇、农村及城乡混合的基尼系数,结果表明,我国总体基尼系数由2005年的0.4563下降到2012年的0.4293,城镇基尼系数有下降趋势,农村基尼系数较稳定;比较研究发现,以往基于未调整的农村分组数据的基尼系数估计会由于缺少大量高收入群体信息而高估了农村基尼系数,从而高估了总体基尼系数。而且,基于Yitzhaki(1994)的城乡分解框架,我们发现,城乡内部差距比城乡间差距对总体差距的贡献更大;城镇收入分布的阶层效应比农村的更强,即城镇群体更加趋向于形成一个阶层,而且我国的城乡阶层效应越来越明显。
关键词: 分组数据     基尼系数     交叉效应     阶层效应    
The Estimation of Income Gini Coefficient in China and Its Stratification Effect: based on the new 20 grouped data of urban and rural
Hu Zhijun, Tan Zhong
Abstract: Based on the new 20 grouped income data of urban and rural, wereestimate the gini coefficients of China from 2005 to 2012. Results show that the total gini are decreasing from 0.4563 in 2005 to 0.4293 in 2012, and urban's gini have declining tendency while rural's gini are stable. We find that it will overestimate the rural's gini based on the past grouped data because of missing lots of information about highest income group, resulting in overestimation of the total gini. What's more, according to the decomposition of Yitzhaki(1994), we find that the within group inequality is more important than between group inequality, and the urban's stratification effect is larger than rural's, i.e., comparing to rural, urban is more stratified; what's more, the society becomes more stratified.
Key words: grouped data     gini coefficient     overlapping     stratification effect    
一 引言

我国的收入不平等问题一直是学术界的热点,其中,很多学者都对我国收入差距变动的原因进行了研究(如陆铭、陈钊,2004万广华等,2005陈斌开等,2009陈钊等,2010等)。而本文则侧重于研究我国居民收入分布的不平等程度估计及其城乡阶层效应。

基尼系数是国际上通用的一个描述收入不平等程度的指标,而我国城乡混合的基尼系数是多少也一直受到广泛关注。2013年国家统计局首次对外公布了我国2003-2012年的总体基尼系数水平,而且也首次对外公布了经过调整后的城镇、农村分开的居民收入20分组数据(新增了城镇居民按可支配收入分组的户数占调查户比重的20分组数据,修改了农村居民按纯收入分组的户数占调查户比重的20分组数据的分组界限)。本文的目的之一就是根据这些最新调整的分组数据,重新给出我们对我国城乡混合基尼系数的一个估计。

基于分组数据如何对基尼系数进行估计,国内外已有大量研究文献。我们大致可以总结如下:一是参数方法,主要是基于分组数据拟合洛伦兹曲线或者收入分布函数,然后再根据洛伦兹曲线或收入分布估计基尼系数(如Gastwirth,1975Cowell and Mehta,1982McDonald,1984Slottje,1989Schader and Schmid,1994Ogwang and Rao,1996Chotikapanich et al.,2007等);二是非参数方法,主要是基于分组数据估计基尼系数的上下界(如Gastwirth,1972Mehran,1975Murray,1978Fuller,1979Ogwang,20032006等)。

由于我国的城镇和农村居民收入分组数据是分开的,没有城乡混合的分组数据,所以基于分组数据估计基尼系数的上下界研究主要是城镇、农村的基尼系数上下界研究(洪兴建,2010),大部分研究是如何构造全国的收入分组数据或更进一步如何构造出全国的收入分布或洛伦兹曲线,从而估计城乡混合基尼系数(如陈宗胜,2002胡祖光,2004王祖祥,2006程永宏,20062007胡志军等,2011胡志军,2012Chen et al.,2015等)。

本文基于2013年国家统计局调整后的农村、城镇20收入分组数据,采用拟合收入分布的方法来估计全国总体基尼系数。由于广义Beta II分布在拟合收入分布时具有很大优势(胡志军,2012),所以我们也采用广义Beta II分布来拟合收入分布函数,使用极大似然估计方法得到收入分布参数,从而得到总体基尼系数的估计。结果显示,2005-2012年,我国总体基尼系数一直在下降,由0.4563下降到0.4293;城镇基尼系数也在下降,由0.3389下降到0.3154;农村基尼系数比较稳定,由0.3721变为0.3810。而且,基于蒙特卡罗模拟试验,我们发现,以往基于未调整的分组数据的基尼系数估计,会由于缺乏大量农村高收入群体信息,高估农村基尼系数(而城镇分组数据的调整对城镇基尼系数估计的影响不大),从而高估了总体基尼系数。

通过估计总体基尼系数,我们能知道收入不平等程度,另一方面,我们也想知道一个社会对不平等的容忍程度如何?一个出现收入阶层效应(Stratification)的社会比没有出现收入阶层效应的社会更能容忍收入不平等(Yitzhaki and Lerman,1991),因此本文的另一个目的就是考察我国收入分布的阶层效应,这对政策制定者具有重要含义。如果阶层效应在逐渐显现,那么社会对收入不平等的容忍程度在上升;如果阶层效应在逐渐消失,那么社会对收入不平等的容忍程度在下降。

阶层效应涉及到基尼系数的群体分解,对于我国基尼系数的分解研究,国内已有较多研究文献(李虎,2005万广华,2008程永宏,2008洪兴建,2008等等),但是很少有专门研究阶层效应的。本文从阶层效应出发,基于Yitzhaki(1994)的基尼系数分解框架,对我国城乡收入分布的阶层效应进行研究。在该分解框架中,交叉效应(overlapping)与阶层效应互为逆过程,即如果交叉效应越小,那么阶层效应就越大,而且阶层效应对组内差距和组间差距都有影响。

分解结果显示,2005-2012年间,就对总体差距的贡献而言,组内差距比组间差距更为重要,且城乡内部差距对总体差距的贡献呈上升趋势,城乡间差距对总体差距的贡献呈下降趋势;城镇、农村收入分布的阶层效应使得组内差距增加了约0.07,却使组间差距减少了约0.05;平均来看,把一个城镇居民放到农村群体中去,他的收入可以排在90%的位置(由低到高),把他放到总体中去,他的收入可以排在70%的位置;把一个农村居民放到城镇群体中去,他的收入可以排在10%的位置,把他放到总体中去,他的收入可以排在30%的位置;城镇收入分布与总体收入分布的阶层效应比农村与总体之间的阶层效应更强,即,与农村相比,城镇群体更趋向于形成一个阶层;而且,随着时间的推移,我国的城乡阶层效应越来越明显了。

本文接下来的结构安排如下:第二部分介绍基于分组数据估计基尼系数的方法;以及阶层效应概念所涉及到的基尼系数分解框架;第三部分是基于我国城镇、农村居民收入20分组数据的基尼系数估计及我国总体收入分布的城乡阶层效应的实证研究;第四部分是结论。

二、基尼系数的估计及阶层效应含义 (一) 基于分组数据的基尼系数估计

基于分组数据,本文使用参数方法估计基尼系数。具体而言,就是选择一个合适的收入分布函数对收入分组数据进行拟合,然后使用合适的参数估计方法得到分布参数,最后基于分布参数估计基尼系数。

广义Beta Ⅱ分布(GB2)是McDonald(1984)提出的,该分布的密度函数为

$f\left(x\left| a,b,p,q \right.\right)=\frac{a{{x}^{cp-1}}}{{{b}^{ap}}B\left(p,q \right){{\left(1+{{\left(\frac{x}{b} \right)}^{a}} \right)}^{p+q}}},x\ge 0$ (1)

其中,a、b、p、q为分布参数,B(p,q)为Beta函数。由于常用的收入分布函数大多是该分布的特例或极限形式,所以该分布在收入分布拟合中具有很大优势,很多学者都使用过该分布拟合收入分布。我们也使用GB2分布来拟合我国城镇、农村居民的收入分布。

给定收入分布形式F(x;θ),x≥0,收入的基尼系数g可以表示为:

$g=\frac{\int_{0}^{\infty }{F\left(x;\theta \right)\left(1-F\left(x;\theta \right)\right)d{{x}^{①}}}}{\int_{0}^{\infty }{\left(1-F\left(x;\theta \right)\right)dx}}$

① 详细推导过程可见Kendall and Stuart(1958)Dorfman(1979)的著作。

所以,只要得到GB2分布参数的有效估计,便可得到基尼系数的估计值。

当已知分组数据形式为表 1时(所有的已知信息是akpkk=1,...,K),我们可以采用极大似然估计方法(MLE)估计参数。即θ的极大似然估计量为

② 详细估计过程可见胡志军等(2011)的论文。

$\hat \theta {\rm{ = }}\arg \;\mathop {\max }\limits_\theta \sum\nolimits_{k = 1}^k {{P_k}} \ln \left[ {F\left( {{a_k};\theta } \right) - F\left( {{a_{k - 1}};\theta } \right)} \right]$ (2)
表 1 收入分组数据形式
(二) 基于基尼系数分解的阶层效应

假设总体Ω被分成互不相交的N组群体,即

${{\Omega }_{i}}\text{I}{{\Omega }_{j}}=\varnothing \left(i\ne j \right),\Omega={{\Omega }_{1}}\cup {{\Omega }_{2}}\cup \ldots {{\Omega }_{N}}$

群体i的人口份额为pi,收入份额为${{q}_{i}}=\frac{{{p}_{i}}{{\mu }_{i}}}{\mu }$,其中$\mu=\sum\nolimits_{i=1}^{N}{{{p}_{i}}{{\mu }_{i}}}$是总体的收入均值,${{\mu }_{i}}=\int_{0}^{\infty }{xf}{{F}_{i}}\left(x \right)$是群体i的收入均值,Fi(x)是群体i的收入分布函数,x>0,i=1,...,N。那么总体的收入分布函数$F\left(x \right)=\sum\nolimits_{i=1}^{N}{{{p}_{i}}{{F}_{i}}\left(x \right)}$。

为了考察城乡阶层效应,本文按照Yitzhaki(1994)的基尼系数分解框架,对我国居民收入分布的阶层效应进行研究。

Yitzhaki(1994)的基尼系数分解框架如下

① 国内对基尼系数分解的实证研究大部分是基于另外一个分解框架,是一种不完全分解(Pyatt,1976),即G=GW+GB+R,其中${{G}_{W}}=\sum\nolimits_{i=1}^{N}{{{p}_{i}}{{q}_{i}}{{G}_{i}}}$为组内差距,Gi为群体i的基尼系数,${{G}_{B}}=\sum\nolimits_{i=1}^{N}{\sum\nolimits_{j=1}^{N}{\frac{{{p}_{i}}{{q}_{i}}\left| {{\mu }_{i}}-{{\mu }_{j}} \right|}{2\mu }}}$为组间差距,R为分解剩余项,但该剩余项难于精确解释(Mookherjee and Shorrocks,1982)。

$G={{G}_{b}}+{{G}_{wo}}$ (3)

其中${{G}_{b}}=\frac{2\operatorname{cov}\left({{\mu }_{i}},{{{\bar{F}}}_{i}} \right)}{\mu }=\frac{2\sum\nolimits_{i=1}^{N}{{{p}_{i}}\left({{\mu }_{i}}-\mu \right)\left({{{\bar{F}}}_{i}}-1/2 \right)}}{\mu }$为组间差距,${{{\bar{F}}}_{i}}=\int_{0}^{\infty }{F\left(x \right)d{{F}_{i}}\left(x \right)}$表示群体i中的个体在总体分布中的标准化排序值(他在总体分布中的分位数)的平均值;

${{G}_{wo}}=\sum\nolimits_{i=1}^{N}{{{q}_{i}}}{{G}_{i}}{{o}_{i}}$为组内差距,${{O}_{i}}=\frac{{{\operatorname{cov}}_{i}}\left(X,F\left(X \right)\right)}{{{\operatorname{cov}}_{i}}\left(X,{{F}_{i}}\left(X \right)\right)}=\sum\nolimits_{i=1}^{N}{{{p}_{j}}}\frac{{{\operatorname{cov}}_{i}}\left(X,{{F}_{j}}\left(X \right)\right)}{{{\operatorname{cov}}_{i}}\left(X,{{F}_{i}}\left(X \right)\right)}$表示群体i的收入分布与总体收入分布的交叉效应;

${{\operatorname{cov}}_{i}}\left(X,{{F}_{j}}\left(X \right)\right)=\int{\left(x-{{\mu }_{i}} \right)}\left({{F}_{j}}\left(X \right)-{{{\bar{F}}}_{ji}} \right)f{{F}_{i}}\left(x \right),{{{\bar{F}}}_{ji}}=\int{_{j}\left(X \right)d{{F}_{i}}\left(x \right)}$表示群体i中的个体在群体j分布中的标准化排序值(他在群体j分布中的分位数)的平均值

② 我们很容易发现,$\bar{F}=\sum\nolimits_{i=1}^{N}{{{{\bar{F}}}_{ji}}},{{{\bar{F}}}_{jj}}=1/2$。

定义${{O}_{ij}}=\frac{{{\operatorname{cov}}_{i}}\left(X,{{F}_{j}}\left(X \right)\right)}{{{\operatorname{cov}}_{i}}\left(X,{{F}_{i}}\left(X \right)\right)}$表示群体i的收入分布与群体j的收入分布的交叉效应,可以理解为群体j在多大程度上被包含于群体i的值域当中(特别的,Oii=1),那么${{O}_{i}}=\sum\nolimits_{j=1}^{N}{{{p}_{j}}{{O}_{ji}}}$,可以理解为总体在多大程度上被包含于群体i的值域当中

Oji一些主要的性质有:1.Oji≥0(它等于0表明群体i是完全的分层);2.Oji≤2(当群体j的所有个体的值都为群体i的均值时,它取最大值);3.一般而言,如果Oji越大,那么Oij越小。(Yitzhaki,1994)

阶层效应是一个社会学概念,Lasswell(1965)较正式的对阶层效应的定义是“社会阶层是一个水平分层。阶层效应是指形成一个可观测的水平分层的过程,…,社会由各个凝固的水平分层构成”;Yitzhaki and Lerman(1991)首次给出了一个相对阶层效应的指标,表示群体i的收入分布与总体收入分布的阶层效应,而交叉效应Oi是阶层效应的逆过程;Yitzhaki(1994)进一步完善交叉效应指标Oi,并把它作为群体i阶层效应的一个度量指标,一般而言,如果群体i与总体的交叉效应Oi越小,那么群体i与总体的阶层效应就越大;即,与其他群体相比,群体i更趋向于形成一个阶层。而且,交叉效应对组内差距、组间差距都有影响,其数值大小为Gwo-GWGb-GB(GW是基尼系数传统不完全分解框架中的组内差距,GB是基尼系数传统不完全分解框架中的组间差距)。Milanovic and Yitzhaki(2002)考察了该分解框架中交叉效应对组间差距的影响,提出以Gb/GB衡量交叉效应对组间差距的影响,并基于1993年的各个国家的分组数据分析了全球收入分布情况。

Liberati(2015)也基于该分解框架对1970-2009年的全球收入差距进行了分解研究,并进一步指出:Gwo-GW (是一个非负数)可以表示所有群体间收入分布的交叉效应,该数值越小,表明所有群体间交叉效应越小,从而总体收入分布的阶层效应越明显;同样的,Gb-GB(是一个非正数)也可以反映出总体收入分布的阶层效应,当该数值为0时,表明总体中各群体是完全的分层,总体的阶层效应最明显。

当进行总体的城乡分解时,Yitzhaki(1994)的完全分解可以简化为(下标u表示城镇,r表示农村):

${{G}_{b}}=\frac{2}{\mu }\left[ {{p}_{u}}\left({{\mu }_{u}}-\mu \right)\left({{{\bar{F}}}_{u}}-1/2 \right)+{{p}_{r}}\left({{\mu }_{r}}-\mu \right)\left(\bar{F}-1/{{2}_{r}} \right)\right]$ (4)

其中${{{\bar{F}}}_{u}}=\frac{1}{2}{{p}_{u}}+{{p}_{r}}{{{\bar{F}}}_{ru}},{{{\bar{F}}}_{r}}=\frac{1}{2}{{p}_{r}}+{{p}_{u}}{{{\bar{F}}}_{ur}},{{{\bar{F}}}_{ru}}+{{{\bar{F}}}_{ur}}=1$;

${{G}_{wo}}={{q}_{u}}{{G}_{u}}{{O}_{u}}+{{q}_{r}}{{G}_{r}}{{O}_{r}} $,

其中${{O}_{u}}={{p}_{u}}+{{p}_{r}}{{O}_{ru}},{{O}_{r}}={{p}_{r}}+{{p}_{u}}{{O}_{ur}},{{O}_{ru}}=\frac{{{\operatorname{cov}}_{u}}\left(X,{{F}_{r}}\left(X \right)\right)}{{{\operatorname{cov}}_{u}}\left(X,{{F}_{u}}\left(X \right)\right)},{{O}_{ur}}=\frac{{{\operatorname{cov}}_{r}}\left(X,{{F}_{u}}\left(X \right)\right)}{{{\operatorname{cov}}_{r}}\left(X,{{F}_{r}}\left(X \right)\right)} $。

当城乡收入分布不存在交叉效应时(Our=0,Oru=0),Ou=puOr=prGwo=GWGb=GB,表示城镇、农村都存在完全的阶层效应,城镇和农村各自形成独立的社会阶层,此时社会的城乡阶层效应最明显。

当城乡收入分布存在完全交叉效应时(Our=1,Oru=1),Ou=1,Or=1,表示城镇、农村都完全不存在阶层效应,城镇和农村完全融为一体,此时社会没有城乡阶层效应。

三我国城乡混合基尼系数的估计及城乡阶层效应 (一) 数据说明

本文所用的城镇、农村居民20分组收入数据来自2013年的《中国城镇住户调查年鉴》和《中国农村住户调查年鉴》,农村居民的收入分组数据是农村居民按纯收入分组的户数占调查户比重的数据;城镇居民的收入分组数据是城镇居民按可支配收入分组的户数占调查户比重的数据。城乡人口比重数据来自各年的《中国统计年鉴》。

① 本文采用的数据是家庭人均收入数据,所以我们计算的是基于家庭人均收入的基尼系数,而不是基于个人收入的基尼系数。因此,就没有考虑家庭人口规模、家庭内部收入分配等等因素对总体基尼系数的影响。

本文使用的20分组数据是2013年首次公布的经过调整数据,以往对我国总体基尼系数的估计研究都是基于农村20分组数据和城镇7分组数据。而且调整以前的农村20分组数据缺失5000元以上高收入组别的信息(这部分人口份额较大,缺失信息较多),调整后的农村20分组数据缺失20000元以上高收入组别的信息(相对而言,这部分人口份额较少,缺失信息较少);调整以前的城镇7分组数据是按人均可支配收入分组的10%最低收入户、10%较低收入户、20%中等偏下收入户、20%中等收入户、20%中等偏上收入户、10%较高收入户和10%最高收入户的平均可支配收入,调整以后的城镇20分组数据跟农村20分组数据类似。以2009年为例,详细情况可以见表 2所示。

表 2 2013年公布的城镇、农村分组数据调整情况(以2009年为例)

因此,基于调整后的城镇、农村分组数据提供的信息更加丰富,得到的基尼系数估计值更加精确。

(二) 总体基尼系数的估计结果

根据第二部分的内容,我们首先使用GB2分布拟合2005-2012年我国城镇、农村的收入分布,基于MLE估计的分布参数结果见表 3

表 3 城镇、农村收入分布参数估计结果

根据城镇、农村的收入分布函数,我们可以估计城镇、农村的收入基尼系数,而且还可以构造城乡混合的收入分布,从而估计全国的基尼系数。详细结果见表 4,2005-2012年,我国总体基尼系数一直在下降,由0.4563下降到0.4293;城镇基尼系数也在下降,由0.3389下降到0.3154;农村基尼系数比较稳定,由0.3721变为0.3810

表 4 城镇、农村及城乡混合的基尼系数估计结果

① 与使用同样数据来源的一项研究Chen et al.(2015)相比,我们的估计结果与他们的结论一致,仅仅在小数点后第4位上数值有差别,该差别可能来自于计算过程的误差(涉及到数值积分)。与统计局对外公布的基尼系数变化趋势是一样的。

接下来本文考察城镇、农村分组数据的调整对基尼系数估计值的影响。我们基于蒙特卡罗模拟试验方法,对比分析不同分组数据形式下的基尼系数估计效果。

(1)农村基尼系数估计的模拟:假设农村真实收入分布为GB2分布,真实的分布参数为a0=1.4365,b0=6088.0594,p0=1.9451,q0=2.8368。则真实的基尼系数g0=0.3814。试验步骤如下:1.从真实收入分布中随机抽取1000个样本,分别整理为调整前和调整后的农村样本数据形式;2.根据整理得到的数据形式,在GB2的前提下估计基尼系数;3.重复上述步骤(1和2)M次,得到基尼系数估计值g调整前,ig调整后,ii=1,2,...,M;4.比较基尼系数估计值的均值和标准差。模拟结果详见表 5

表 5 农村分组数据调整对基尼系数估计影响的模拟试验

① 真实分布参数的选择是根据2009年农村收入分布在GB2分布前提下的估计参数值。

(2)城镇基尼系数估计的模拟:假设城镇真实收入分布为GB2分布,真实的分布参数为a0=1.6167,b0=15763.3286,p0=2.4306,q0=2.6037。则真实的基尼系数g0=0.3332。试验步骤如下:1.从真实收入分布中随机抽取1000个样本,分别整理为调整前和调整后的城镇样本数据形式;2.根据整理得到的数据形式,在GB2的前提下估计基尼系数;3.重复上述步骤(1和2)M次,得到基尼系数估计值g调整前,ig调整后,ii=1,2,...,M;4.比较基尼系数估计值的均值和标准差。模拟结果详见表 6

表 6 城镇分组数据调整对基尼系数估计影响的模拟试验

② 真实分布参数的选择是根据2009年城镇收入分布在GB2分布前提下的估计参数值。

③根据调整前的城镇7分组数据估计基尼系数的方法可以见胡志军等(2011)的论文。

从模拟试验的结果来看,调整前的农村分组数据由于缺少大量高收入群体信息,基于该分组数据估计的基尼系数会高估真实收入差距,而基于调整后的农村分组数据的基尼系数估计是真实收入差距的良好估计。对于城镇分组数据而言,基于调整前或调整后的数据估计基尼系数值差别很小。

(三) 城乡阶层效应

根据本文第二部分的内容,我们按照Yitzhaki(1994)的分解方法,对我国总体收入分布的阶层效应进行研究。

首先分别考察城镇、农村收入分布的交叉效应,我们先列出了FruFurFuFr的变动情况,如表 7所示。

表 7 城镇、农村的收入分布排序值

我们可以发现,城镇居民收入在农村群体中排序值的平均值(Fru)约为0.90,在总体中的排序值的平均值(Fu)约为0.70,即平均来看,把一个城镇居民放到农村群体中去,他的收入可以排在90%的位置(由低到高),把他放到所有群体中去,他的收入可以排在70%的位置;农村居民收入在城镇群体中排序值的平均值(Fur)约为0.10,在总体中的排序值的平均值(Fr)约为0.30,即平均来看,把一个农村居民放到城镇群体中去,他的收入可以排在10%的位置,把他放到所有群体中去,他的收入可以排在30%的位置。

然后考察各群体的交叉效应,我们列出了Our、Oru、OuOr的变动情况,结果如表 8所示。

表 8 城镇、农村收入分布与总体收入分布的交叉效应

可以发现,Our大于Oru,这表明,城镇群体有更多的人落入农村群体收入分布的值域当中,相比而言,农村群体就有较少的人落入城镇群体收入分布的值域当中。Ou小于Or,意味着城镇收入分布与总体收入分布的交叉效应比农村与总体之间的交叉效应小,这表明城镇收入分布与总体收入分布的阶层效应比农村与总体之间的阶层效应要大。在一定程度上,这说明,与农村相比,城镇群体更趋向于形成一个阶层。

就整个社会的阶层效应而言,我们按照Liberati(2015)的思路,计算了交叉效应对组内差距和组间差距的影响,结果如表 9所示。我们可以发现:

表 9 总体基尼系数的城乡分解

就对总体差距的贡献而言,组内差距比组间差距更为重要,而且,城乡间差距对总体差距的贡献呈下降趋势,城乡内部差距对总体差距的贡献呈上升趋势。

① 这与基尼系数的传统分解结果不一致。传统分解结果显示,2005-2012年城乡间差距占比分别为58.6%、58.32%、57.37%、55.83%和55.93%,城乡间差距比城乡内部差距更为重要。

城乡收入分布的交叉效应使得组内差距增加了约0.07,但是又使得组间差距减少了约0.05。而且,Gwo-GW呈现下降趋势,表明我国城镇、农村居民收入分布的交叉效应越来越小,整个社会的城乡阶层效应越来越明显。Gb-GB(绝对值意义上)也呈现出下降趋势,也表明我国城乡阶层效应越来越明显了。

四、结论

国家统计局2013年首次对外公布了经过调整的城镇、农村20分组的收入数据,该分组数据较以往分组数据相比,城镇新增了已知人口份额和分组界限的20分组数据(以往是已知人口份额和平均收入的7分组数据),农村修改了已知人口份额和分组界限的20分组数据,主要是把以往的最高收入组左端点5000元提高到20000元了,即提供了更详细的农村高收入群体信息。因此,本文基于调整的20分组数据,采用广义Beta Ⅱ分布拟合城镇、农村收入分布,然后基于极大似然估计方法来估计分布参数,从而估计全国总体基尼系数。

另一方面,本文考察了我国收入分布的城乡阶层效应。基于Yitzhaki(1994)的基尼系数分解框架,对我国收入分布的阶层效应进行研究。在该框架中,交叉效应与阶层效应是互为逆过程的,而且阶层效应对组内差距和组间差距都有影响。

基于2005-2012年的城镇、农村20分组数据,我们对我国的基尼系数及阶层效应进行了实证研究,主要结论有:

1.2005-2012年,我国总体基尼系数一直在下降,由0.4563下降到0.4293;城镇基尼系数也在下降,由0.3389下降到0.3154;农村基尼系数比较稳定,由0.3721变为0.3810。

2.平均来看,把一个城镇居民放到农村群体中去,他的收入可以排在90%的位置(由低到高),把他放到总体中去,他的收入可以排在70%的位置;把一个农村居民放到城镇群体中去,他的收入可以排在10%的位置,把他放到总体中去,他的收入可以排在30%的位置。

3.就对总体差距的贡献而言,按照Yitzhaki(1994)的分解方法,组内差距比组间差距更为重要,且城乡内部差距对总体差距的贡献呈上升趋势,城乡间差距对总体差距的贡献呈下降趋势;城镇、农村收入分布的阶层效应使得组内差距增加了约0.07,却使组间差距减少了约0.05。

4.与农村相比,城镇群体更趋向于形成一个阶层。随着时间的推移,我国城乡收入分布的城乡阶层效应越来越明显。

参考文献
[1] 陈斌开、杨依山、许伟, 2009, "中国城镇居民劳动收入差距演变及其原因:1990-2005", 《经济研究》 , 第12期, 第30-42页.
[2] 陈钊、万广华、陆铭, 2010, "行业间不平等:日益重要的城镇收入差距成因-基于回归方程的分解", 《中国社会科学》, 第3期第65-76页.
[3] 程永宏, 2006, "二元经济中城乡混合基尼系数的计算与分解", 《经济研究》, 第1期, 第109-120页.
[4] 程永宏, 2007, "改革以来全国总体基尼系数的演变及其城乡分解", 《中国社会科学》, 第4期, 第45-60页.
[5] 程永宏, 2008, "基尼系数组群分解新方法研究: 从城乡二亚组到多亚组", 《经济研究》,第8期, 第124-135页.
[6] 陈宗胜、周云波, 2002, "再论改革与发展中的收入分配", 经济科学出版社, 2002.
[7] 胡志军、刘宗明、龚志民, 2011, "中国总体基尼系数的估计:1985-2008", 《经济学季刊》, 第4期, 第1423-1436页.
[8] 胡志军, 2012, "基于分组数据的基尼系数估计与社会福利:1985-2009年", 《数量经济技术经济研究》,第9期111-121页.
[9] 胡祖光, 2004, "基尼系数理论最佳值及其简易计算公式研究", 《经济研究》, 第9期, 第60-69页.
[10] 洪兴建, 2008, "一个新的基尼系数子群分解公式―兼论中国总体基尼系数的城乡分解", 《经济学季刊》, 第1期, 第307-324页.
[11] 洪兴建, 2010, "基于分组数据的样本基尼系数范围估计", 《统计研究》, 第2期, 第83-86页.
[12] 李虎, 2005, "关于基尼系数分解分析的讨论", 《数量经济技术经济研究》, 第3期, 第127-135页.
[13] 陆铭、 陈钊, 2004, "城市化、城市倾向的经济政策与城乡收入差距", 《经济研究》, 第6期, 第50-58页.
[14] 万广华, 2008, "不平等的度量与分解", 《经济学季刊》, 第1期, 第348-368页.
[15] 万广华、陆铭、陈钊, 2005, "全球化与地区间收入差距:来自中国的证据", 《中国社会科学》,第3期, 17-26页.
[16] 王祖祥, 2006, "中部六省基尼系数的估算研究", 《中国社会科学》, 第4期, 第77-87页.
[17] Chen et al. , 2015, "Chinese Gini Coefficient from 2005 to 2012: Based on 20 Grouped Income Data Sets of Urban and Rural Residents", Journal of Applied Mathematics, Accepted.
[18] Chotikapanich,et al.,2007, "Estimating Income Inequality In China Using Grouped Data And The Generalized Beta Distribution", Review of Income and Wealth , (1): 127-147.
[19] Cowell, F. A. , Mehta, F. , 1982, "The Estimation and Interpolation of Inequality Measures", The Review of Economic Studies, (49): 273-290.
[20] Dorfman,R., 1979, "A Formula for The Gini coefficient", Review of Economics and Statistics, (61):146-149.
[21] Fuller, M. , 1979, "The Estimation of Gini Coefficients from Grouped Data: Upper and Lower Bounds", Economics Letters, (3):187-192.
[22] Gastwirth, J. L. ,1972, "The Estimation of the Lorenz Curve and Gini Index", Review of Economics and Statistics, (54):306-316.
[23] Gastwirth, J.L.,1975, "The Estimation of a Family of Measures of Economic Inequality", Econometrica, (42):191-196.
[24] Kendall, M. G, Stuart, A., 1958,"The Advanced Theory of Statistics", Vol.1, in Distribution Theory,1st ed, Published by Hafner Publishing Company.
[25] Lasswell, T. E., 1965, Class and Stratum, Houghton Mifflin, Published by Boston, MA.
[26] Liberati, P. , 2015, "The World Distribution of Income And Its Inequality, 1970-2009", Review of Income and Wealth, (2):248-273.
[27] McDonald, J.B., 1984, "Some Generalized Functions For The Size Distribution Of Income", Econometrica, (52):647-663.
[28] Mehran, F. , 1975, "Bounds on Gini Index Based on Observed Points of the Lorenz Curve", Journal of the American Statistical Association, (70): 64-66.
[29] Milanovic, B., Yitzhaki, S., 2002, " Decomposing world income distribution: Does the world have a middle class?", Review of Income and Wealth, (2):155-178.
[30] Mookherjee, D., Shorrocks A., 1982, "A Decomposition Analysis Of The Trend In UK Income Inequality", The Economic Journal, (368):886-902.
[31] Murray, D. , 1978, "Extreme Values for Gini Coefficients Calculated from Grouped Data", Economics Letters, (1):389-393.
[32] Ogwang, T. , 2003, "Bounds of the Gini Index Using Sparse Information on Mean Incomes", Review of Income and Wealth, (49):415-423.
[33] Ogwang, T. , 2006, "An Upper Bound of the Gini Index in the Absence of Mean Income Information", Review of Income and Wealth, (52):643-652.
[34] Ogwang, T., Gouranga R. U. L.,1996, "A New Functional Form for Approximating the Lorenz Curve", Economics Letters, (52):21-29.
[35] Pyatt,G., 1976, "On the Interpretation and Disaggregation of Gini Coefficient", The Economic Journal, (86):243-255.
[36] Schader, M. , Schmid, F. , 1994, "Fitting Parametric Lorenz Curves to Grouped Income Distributions-A Critical Note", Empirical Economics, (19):361-370.
[37] Slottje, D.J., 1989, The Structure Of Earnings And The Measurement Of Income Inequality In The U.S, Amsterdam, Published by North-Holland.
[38] Yitzhaki, S., Lerman, R. I., 1991, "Income Stratification And Income Inequality", Review of income and wealth, (3):313-329.
[39] Yitzhaki, S., 1994, "Economic Distance and Overlapping of Distributions", Journal of Econometrics, (61):147-159.