一、 研究背景及问题提出
社会融合是流动人口研究中的重要问题,许多研究者提出了对社会整合的测度,一般包括经济融合、文化融合、身份认同和心理融合等指标。国家卫生与计划生育委员会的流动人口动态监测一直都关注流动人口的城市身份认同和心理融合问题,从2010年下半年调查开始加入了测量身份认同的量表,为流动人口社会融合问题研究提供了大样本的一手数据。
大量研究者对该量表进行分析,从各个方面对流动人口的社会融合、身份认同等问题进行探讨。但由于调查方未对量表结构及使用方法做统一说明,研究者们在量表使用过程中存在一些问题,表现在以下方面:首先,量表结构不一致,由于不同研究者感兴趣的地区不一样,在分析时根据不同的样本对量表结构进行探索性因素分析,导致出现同一个量表在不同研究中表现出的结构不一致,因子命名也不一致的现象[1, 2, 3]。其次,未对量表信度进行讨论。再次,量表结构的重复讨论,由于没有正式文献的指导,研究者们在各自研究中都不得不对量表结构进行讨论,造成工作的重复[1, 2, 3]。最后,所有研究未对量表项目的区分度进行分析,有的研究对项目的回答情况进行报告,发现在几个项目中做出肯定回答的人数比例为96.7%、95.3%、93.9%,这几个数据说明项目的区分度极有可能存在问题,但研究者并未关注此问题而继续分析数据[4];不同于一般的调查题目,项目区分度是量表的最基本的要求,如果绝大多数被访者在一个项目上做出一致的选择,该项目无法对不同的人进行区分,其存在意义值得商榷。以上问题的存在并不是研究者的研究水平所致,而是由于业界缺乏对量表质量的综合探讨,而数据发布方又未能及时对量表使用做出统一说明,以致出现误用和不一致的结果。
2013年流动人口动态监测对社会融合量表做了较大调整,主要对社会融合的心理方面进行测量(下称为社会融合心理量表),为了广大研究者可以更有效地使用该数据中的量表,减少误用,并避免重复劳动,本文将从项目区分度、量表信度及效度对该量表的心理测量学指标进行全面考察,确保量表质量,为各方数据使用者提供支持。
二、 数据来源及方法 1.数据来源
2013年流动人口动态监测调查 调查的具体方案见《中国流动人口发展报告2014》。 由“一大”和“一小”组合而成。其中“一大”调查全年开展一次,按照随机原则在全国31个省(区、市)和新疆生产建设兵团城市抽取样本点,调查结果对全国和各省有较好代表性。“一小”在2013年调查中专指流动人口社会融合调查,仅在部分城市中进行,社会融合量表归属“一小”。调查设计中计划对上海市松江区,江苏省苏州市、无锡市,福建省泉州市,湖北省武汉市,湖南省长沙市,陕西省西安市、咸阳市共计17000名流动人口在进行“一大”调查的同时加问“一小”。社会融合心理量表最终的有效样本量为16878,样本的年龄和性别分布见表 1。
| 人 | |||
| 年龄组 | 男 | 女 | 合计 |
| 15-19岁 | 516 | 427 | 943 |
| 20-24岁 | 1263 | 1574 | 2837 |
| 25-29岁 | 1716 | 1953 | 3669 |
| 30-34岁 | 1522 | 1475 | 2997 |
| 35-39岁 | 1359 | 1186 | 2545 |
| 40-44岁 | 1187 | 1101 | 2288 |
| 45-49岁 | 708 | 411 | 1119 |
| 50-54岁 | 252 | 89 | 341 |
| 55-59岁 | 100 | 39 | 139 |
| 人数 | 8623 | 8255 | 16878 |
根据心理测量学对量表的要求对社会融合心理量表进行分析,具体步骤及方法如下。
(1)通过鉴别指数评价每一个项目的区分度,根据鉴别指数对量表项目进行第一步删减。
(2)将样本随机分两个子样本,子样本A用于探索性因素分析,初步判断量表结构,并根据项目的因子载荷对项目进行第二步删减;子样本B用于验证性因素分析,对探索性因素分析结果进行验证。一方面澄清量表结构,确认量表计分方法,另一方面以此说明量表结构效度。
(3)通过Cronbach系数衡量量表的内部一致性信度。对30名外来人口进行时隔一周的重复测量,以两次总分的相关系数来考察量表的重测信度。
(4)以长期居住意愿、自我身份界定、户口迁移意愿等作为社会融合的效标,比较上述变量分组在社会融合量表得分的差异,从而验证量表的效标效度。三、量表的测量学指标
社会融合心理量表为包含8个项目的4点李克特量表,请被试对各项目表达自己的意见,包括:完全不同意,不同意,基本同意,完全同意。从项目反应方式看,包含6个正向项目,分数越高表示融合越好;2个反向项目,分数越高表示融合越差。以下将对反向项目进行反向赋值后进行区分度、量表结构、信度和效度指标的考察。
1.区分度
计算8个项目的总分,以总分排名最低的27%作为低分组(低于等于23分),以最高的27%作为高分组(高于等于29分)。将“完全同意”和“基本同意”编码为1,将“不同意”和“完全不同意”编码为0,分别计算高分组和低分数在每个项目中选择1的比例,以两组的差距作为各项目的鉴别指数 鉴别指数为心理测量学常用区分度指标,即高分组和低分组在该项目上的通过率差值。一般来说,项目的区分度在0.4以上表明区分度很好;0.3-0.39表明区分度较好;0.2-0.29表明区分度不太好需修改;0.19以下表明区分度不好,应淘汰。 ,以考察各项目的区分度。
从表 2可见,“我愿意与本地人做邻居”、“我愿意与我周围的本地人交朋友”和“我愿意融入社区”三个项目鉴别指数均小于0.190,同时这几个项目的标准差也相对较小,说明这三个项目区分度不佳[5]。从调查的角度来看,说明流动人口绝大部分都“愿意与本地人做邻居”、“愿意与周围的本地人交朋友”、“愿意融入社区”;但从心理测量学的角度来说,这几个项目对个体测量的意义不大,无法通过这些项目来表现社会融合的个体差异。在以下分析中,将分别以保留所有项目和删除区分度过低的项目(五项目版本)两种方法对量表的结构、信度和效度进行分析。
| 项目 | 平均分 | 标准差 | 低分组通过率 | 高分组通过率 | 鉴别指数 |
| 我愿意与本地人做邻居 | 3.548 | 0.563 | 0.906 | 1.000 | 0.094 |
| 我愿意与我周围的本地人交朋友 | 3.565 | 0.551 | 0.927 | 1.000 | 0.073 |
| 我愿意融入社区 | 3.516 | 0.590 | 0.856 | 1.000 | 0.143 |
| 我对目前居住的城市有归属感 | 3.314 | 0.677 | 0.675 | 0.998 | 0.323 |
| 我愿意自己或亲人与本地通婚 | 3.277 | 0.746 | 0.637 | 0.994 | 0.357 |
| 我觉得本地人愿意接受我成为其中一员 | 3.285 | 0.648 | 0.702 | 0.999 | 0.297 |
| 我感觉本地人不愿与我做邻居 | 2.996 | 0.743 | 0.392 | 0.996 | 0.604 |
| 我感觉本地人不喜欢外地人 | 2.975 | 0.780 | 0.333 | 0.983 | 0.650 |
将样本随机平均分为两个子样本,其中一个子样本A用于探索性因素分析,以考察项目间的关系,另一个子样本B用于验证性因素分析。
(1)探索性因素分析。 以子样本A对全部项目和五项目版本量表进行主成分法探索性因素分析并进行斜交旋转,均获得两个特征根大于1的因子。全部项目模型的两个因子分别可解释总体方差的47.4%和20.4%;删除项目模型的两个因子分别可解释41.3%和33.4%。
对项目意义进行分析,量表可分为两个维度,分别可命名为“融合意愿”和“融合体验”,融合意愿反映流动人口对自身在所居住城市的主观融合愿望和感受,表现为愿意与当地人有深入的交往并且在对所居住城市有归属感,包括第1至第5个项目;融合体验反映出流动人口有关本地人对外地人的态度的体验,表现为感受到本地人对自己的接纳以及喜爱程度,包括第6到第8个项目。但探索性因素分析结果并不完全支持该理论构想,无论是全项目模型还是五项目版本都有相似结果,即根据项目的正反反应方式析出因子。进一步分析项目内容,项目6“我觉得本地人愿意接受我成为其中一员”,从内容上指向融合体验,但在反应方式上为正向反应,因子归属不清晰,将其删除后的四项目版本探索性因素分析结果更为合理(见表 3四项目探索性因素分析结果),两个因子可沿用“融合意愿”和“融合体验”进行命名,共同解释79.9%的方差变异。
| 项目 | 全项目 | 五项目 | 四项目 | |||
| 因子1 | 因子2 | 因子1 | 因子2 | 因子1 | 因子2 | |
| 我愿意与本地人做邻居 | 0.859 | |||||
| 我愿意与我周围的本地人交朋友 | 0.851 | |||||
| 我愿意融入社区 | 0.821 | |||||
| 我对目前居住的城市有归属感 | 0.751 | 0.825 | 0.859 | |||
| 我愿意自己或亲人与本地人结婚 | 0.737 | 0.822 | 0.859 | |||
| 我觉得本地人愿意接受我成为其中一员 | 0.680 | 0.810 | ||||
| 我感觉本地人不愿与我做邻居 | 0.897 | 0.912 | 0.917 | |||
| 我感觉本地人不喜欢外地人 | 0.892 | 0.902 | 0.909 | |||
| 解释率(%) | 47.4 | 20.4 | 41.3 | 33.4 | 42.3 | 37.6 |
(2)验证性因素分析。 以子样本B对全项目版本和四项目版本进行验证性因素分析,结果如图 1和图 2所示。 四项目模型的模型拟合指数都非常好,接近于1,但该模型每一个潜变量之下只有两个观测变量,存在借用自由度现象,不适合对模型的拟合指数进行估计[6],为了对两种量表结果进行比较,文中对分析结果进行呈现。 从验证性因素分析的角度,两个模型都有较好的模型拟合指数。但全项目版本的验证性因素分析的模型拟合数不完全令人满意,其中TLI小于0.9,RMSEA大于0.08(见表 4)。从区分度到探索性因素分析再到验证性分析,都说明对原量表中的部分项目进行删除是合理且必要的。
![]() |
| 图 1 全项目版本验证性因素分析结果 |
![]() |
| 图 2 四项目版本验证性因素分析结果 |
| 项目类型 | CMIN | DF | CMIN/DF | p | NFI | TLI | CFI | RMSEA |
| 全项目 | 2447.903 | 19 | 128.837 | 0.000 | 0.922 | 0.885 | 0.920 | 0.123 |
| 四项目 | 0.511 | 1 | 0.511 | 0.475 | >0.999 | >0.999 | >0.999 | <0.001 |
以全体样本,对全项目、四项目量表的Cronbach α系数进行分析,作为量表内部一致性信度指标。对30名21-49岁流动人口时隔一周进行量表重测,以两次测量得分相关系数作为重测信度。具体结果表 5所示。无论是总量表还是分维度,量表都表现出良好的信度,在删除项目后,受累于项目较少,融合意愿分维度的内部一致性和重测信度相对较低,但基本满足要求。
| 项目 | Cronbach α | 重测信度 | |
| 全项目 | 融合意愿 | 0.866 | 0.867 |
| 融合体验 | 0.812 | 0.767 | |
| 全量表 | 0.831 | 0.911 | |
| 四项目 | 融合意愿 | 0.664 | 0.685 |
| 融合体验 | 0.812 | 0.767 | |
| 全量表 | 0.665 | 0.915 |
(1)构想效度。根据验证性因素分析可知,量表项目可构成两个潜变量,潜变量融合意愿与融合体验之间存在0.3以上的中度相关,与理论构想相符合。
(2)效标效度。流动人口的社会融合与其在流入地生活的其他变量应该存在一定关系,如长期居住意愿、自我身份界定、户口迁移意愿等。将上述三个变量作为流动人口社会融合的效标,以效标变量作为自变量,以社会融合分维度及总分作为因变量,进行单因素方差分析,以讨论量表的效标效度。结果发现,在总分及各分维度上,三个效标变量主效应均显著,且差异模式一致,说明不同居住愿意、不同自我身份界定、不同户口迁移意愿的流动人口在社会融合量表上得分存在明显差异。具体表现为愿意长期居住的流动人口社会融合得分高于不愿意长期居住的流动人口;在自我身份界定上,认为自己是本地人的流动人口社会融合得分高于“新本地人”再高于“是老家人”;愿意将户口迁入本地的流动人口社会融合得分高于不愿意的流动人口(见表 6)。以上结果与已有理论预期一致,证明社会融合量表有良好的效标效度。
| 变量 | 全项目融合意愿 | 四项目融合意愿 | 融合体验 | 全项目总分 | 四项目总分 | N | |||||
| M | SD | M | SD | M | SD | M | SD | M | SD | ||
| 是否愿意在本地长期居住 | |||||||||||
| 是 | 3.521 | 0.474 | 3.420 | 00.537 | 3.436 | 0.570 | 3.053 | 0.698 | 3.404 | 0.440 | 9256 |
| 否 | 3.292 | 0.480 | 3.137 | 0.565 | 3.125 | 0.627 | 2.903 | 0.690 | 3.195 | 0.439 | 7622 |
| 觉得自己应该是哪里的人 | |||||||||||
| 本地人 | 3.625 | 0.459 | 3.544 | 0.538 | 3.556 | 0.562 | 3.125 | 0.718 | 3.500 | 0.428 | 1464 |
| 新本地人 | 3.521 | 0.459 | 3.414 | 0.523 | 3.422 | 0.565 | 3.043 | 0.691 | 3.402 | 0.430 | 6729 |
| 老家人 | 3.299 | 0.488 | 3.152 | 0.569 | 3.150 | 0.626 | 2.919 | 0.689 | 3.204 | 0.445 | 8247 |
| 不知道 | 3.358 | 0.501 | 3.216 | 0.598 | 3.224 | 0.652 | 2.894 | 0.781 | 3.242 | 0.476 | 438 |
| 若没有任何限制,是否愿意把户口迁入本地 | |||||||||||
| 是 | 3.497 | 0.474 | 3.390 | 0.538 | 3.405 | 0.574 | 3.015 | 0.695 | 3.376 | 0.439 | 9155 |
| 否 | 3.323 | 0.492 | 3.176 | 0.580 | 3.166 | 0.639 | 2.951 | 0.701 | 3.230 | 0.453 | 7723 |
| 注:全项目和四项目量表中融合体验分维度同为项目g和h,故合并呈现。 | |||||||||||
经过完整的心理测量学考察,包含8个项目的社会融合量表有较好的内部一致性、重测信度及效标效度。但量表中部分项目区分度较差。同时,探索性因素分析表明个别项目意义指向不明,验证性因素分析中部分模型拟合指标较低,提示原量表的心理测量学质量不尽如人意,有待进一步完善。
2.社会融合心理量表使用建议
社会融合作为量表,应以整体作为变量纳入研究框架,可同时采用两个分维度得分或总分作为指标,不宜选用单个或者某几个项目。若因研究需要选取某些项目进行特别分析,在对项目进行加总时,需要对项目的区分度及信效度做具体分析。
原量表部分项目区分度较差,建议在以量表得分作为研究变量时,将区分度较差的项目删除后计算。在删除区分度较差的第1-3个项目后,本文通过探索性因素分析删除了意义模糊的项目5,得到四项目量表。进一步验证性因素分析及信效度分析,均证明删除4个项目后的量表仍然保留良好心理测量学指标。四项目量表一方面保持了原量表的结构,并使因子意义更清晰;另一方面保证了量表项目良好的区分度,确保可呈现被访者社会融合的不同水平;最后量表的两个分维度下项目数相等,可保证两个分维度在社会融合总指标上权重相同。建议在研究中仅使用四个项目进行分析。
3.有关流动人口社会融合测量的思考
社会融合是流动人口在城市居住发展的终极目标,除了在经济、文化等方面与城市人口趋于一致外,流动人口自身的感受非常重要。在研究流动人口社会融合问题中,必须对其心理层面的融合进行测量,量表是最常用的方式[7]。多次的实践已经证明在大规模调查中使用心理量表对流动人口社会融合测量是可能的,就以2013年流动人口动态监测结果来看,量表结果与理论构想基本吻合,说明量表的设计和使用是成功的。但作为综合调查的一部分,大型调查中所使用的社会融合量表应注意以下问题:①心理层面的社会融合涉及被访者个人的观念,特别是有关本地人、本地社区的一些体验和感受,对于有阅读能力的被访者,应使用自填形式,以避免出现社会赞许现象。②量表的项目一定要严格控制,不能完全沿用传统心理学量表以项目数量保证量表质量的设计路线,在保证量表基本测量学指标的前提下,分量表应以保持项目要求最低限为宜(3个项目)。③心理学量表中习惯通过正反两种表述方式来更全面准确地测量个体某一心理特征,同时借此避免被访者的思维惰性,但此方式在大型综合性调查中的适用性值得探讨。在大型综合性调查中,特别像卫生和计划生育委员会通过行政系统执行的调查中,调查员对心理测量技巧掌握有限,对项目的理解和解释准确性不足,同时调查时间紧迫,项目的正反转换给调查员和被访者都带来一定的认知负荷,增加了调查难度。在本研究探索性因素分析中所聚合出来的两个因子,除了分别指向意愿和体验外,分别也是正向题和反向题,也就是说现在的因子聚合有可能是由于项目反应方式导致的。因此,建议在大型综合性调查的量表中对项目使用统一方向表述,此举有助于提高项目实施效率,提升数据质量。
| [1] | 宋月萍,陶椰.融入与接纳: 互动视角下的流动人口社会融合实证研究[J].人口研究,2012(3):38-49. |
| [2] | 李虹,倪士光,黄琳妍.流动人口自我身份认同的现状与政策建议[J].西北师大学报(社会科学版),2012(4):68-74. |
| [3] | 李荣彬,张丽艳.流动人口身份认同的现状及影响因素研究——基于我国106个城市的调查数据[J].人口与经济,2012(4):78-86. |
| [4] | 杨菊华,张莹,陈志光.北京市流动人口身份认同研究——基于不同代际、户籍及地区的比较[J].人口与经济,2013(3):43-52. |
| [5] | 郑日昌.心理与教育测量[M].北京:人民教育出版社,2011:29. |
| [6] | 刘军,富萍萍.结构方程模型应用陷阱分析[J].数理统计与管理,2007(2):268-272. |
| [7] | 周皓.流动人口社会融合的测量及理论思考[J].人口研究,2012(3):27-37." |



