青少年学习倦怠量表的多元概化分析

引用本文

罗杰, 周瑗, 陈维, 潘运, 赵守盈. 青少年学习倦怠量表的多元概化分析[J]. 心理与行为研究, 2018, 16(5): 665-669, 712.

LUO Jie, ZHOU Yuan, CHEN Wei, PAN Yun, ZHAO Shouying. A Multivariate Generalizability Analysis of the Adolescent Student Burnout Inventory[J]. Studies of Psychology and Behavioral, 2018, 16(5): 665-669, 712.

青少年学习倦怠量表的多元概化分析

罗杰^1,2, 周瑗^1,2, 陈维^1,2, 潘运^1,2, 赵守盈^1,2

1. 贵州师范大学教育科学学院，贵阳　550001;
2. 贵州省普通高校基础心理与认知神经科学特色重点实验室，贵阳　550001

收稿日期: 2016-12-12

基金项目: 教育部哲学社会科学研究后期资助项目（14JHQ016）、贵州省科学技术基金项目（黔科合J字LKS[2013]54号）、贵州省教育厅自然科学研究项目（黔科合[2014]299号）和贵州省高等学校教学内容和课程体系改革培育项目（黔教高发[2012]426号）

通讯作者: 赵守盈，E-mail：zhaoshouying@126.com.

摘要：运用多元概化理论考察青少年学习倦怠量表（ASBI）的测量学属性。结果发现，ASBI各因子以及全量表的概化系数和可靠性指数均达到较好水平，既可用于常模参照测验，也可用于标准参照测验；各因子的分量比例还不尽完善，低成就感对全域总分的贡献略低于在全量表中的分值比重，对相对误差方差贡献最大的是低成就感，学业疏离对绝对误差方差的贡献最大；今后ASBI的修订工作，可考虑对学业疏离和低成就感因子条目质量的改进，同时适当增加身心耗竭因子的条目数以提高其测量信度。

关键词：学习倦怠青少年多元概化理论信度

1 引言

倦怠（burnout）一直是心理健康领域的热点话题。心理学中有关倦怠的研究最初起始于工作领域（Ammondson, 2000; Maslach, Schaufeli, & Leiter, 2001），如今已扩展和细化到学习领域，主要涉及学习倦怠的研究（Schaufeli, Martínez, Pinto, Salanova, & Bakker, 2002; Steele & Fullagar, 2009）。学习倦怠是一种主要发生在学生身上持续的、负性的、与学习相关的心理状态（吴艳, 戴晓阳, 温忠麟, 崔汉卿, 2010），这种状态主要表现为身心耗竭、学业疏离和低成就感等方面。研究表明，学习倦怠对学生反社会行为及其严重程度存在显著影响（Kokkinos, Panayiotou, & Davazoglou, 2005）。因此，探讨学习倦怠及其影响因素，对维护学生的心身健康具有重要意义。相应地，在客观实际中为了提高学习倦怠的研究水平，编制具有良好心理测量学性能的测评工具势在必行。

国外对学习倦怠进行测评的工具主要有三种：（1）将Maslach倦怠问卷（Maslach Burnout Inventory, MBI）进行修改后施测于学生（Fimian & Cross, 1986; Jacobs & Dodd, 2003）；（2）直接使用MBI公共服务版（Maslach Burnout Inventory for Human Service Surcey, MBI-HSS）（Ross et al., 2002）；（3）在Maslach问卷的基础上编制学习倦怠量表（Schaufeli et al., 2002）。在国内，学习倦怠的测评工具主要有两种：（1）直接修订国外研究者所编制的学习倦怠量表（张莹, 甘怡群, 张轶文, 2005; 方来坛, 时勘, 张风华, 2009）；（2）编制适用于我国学生群体的本土化学习倦怠量表（连榕, 杨丽娴, 吴兰花, 2005; 许清鹏, 张建新, 刘普强, 王晶, 王宝军, 2006; 胡俏, 戴春林, 2007; 吴艳等, 2010）。其中吴艳等（2010）以Maslach的工作倦怠三因素理论（心身衰竭、玩世不恭、低效能感）为基础所编制的青少年学习倦怠量表（Adolescent Student Burnout Inventory, ASBI）在小学生、中学生和大学生群体中均具有较好的信效度，为青少年学习倦怠的测评提供了良好的量化基础。然而该量表的编制以及信效度检验均采取经典测量理论（Classical Test Theory, CTT）的方法。在心理测量学中，CTT用于检验信效度指标时存在一定的不足与缺陷（Shavelson & Webb, 1991; Brennan, 2001a; 杨志明, 张雷, 2003a; 漆书青, 2003; Suen & Lee, 2007; Brennan, 2010）：如对测验信度的估计不够精确；不能辨别测验过程中可能产生的各种变异来源及其大小；无法提出减少测量误差的策略与方案等。因此，测量学家们一直在寻找客服这些不足的方法与技术，其中一个研究方向就是注重测验的宏观层面，继续沿着随机样本理论的思路，考察测评工具的测量条件与结论推广应用范围之间的关系，沿着这条思路最终导致概化理论（Generalizability Theory, GT）的出现与发展。

GT是在CTT的基础上，引入实验设计和方差分析技术，对测验情景中的各类误差进行分解和控制的一种测量理论（Brennan, 2001a, 2010）。GT包含两个研究阶段，即G研究和D研究（Brennan, 2001a; 杨志明, 张雷, 2003a）。其中G研究通过估计测量目标和测量侧面的方差协方差分量，来确认测量目标与测量侧面的关系。D研究则是通过对信度变化的评估来确定哪种决策更好，从而为测验的改进提供依据。与CTT相比，概化理论可以根据测量误差的来源把总误差划分为多个分量误差，在同时考虑多个误差来源的基础上进行信度估计，因此GT的信度估计比CTT更为细致和准确（杨志明, 张雷, 2003a）。当前GT的应用主要涉及两大方面：其一是教育测量与评估方面（杨志明, 张雷, 马世晔, 2004; Yin, 2005; 蔡艳, 陈抚良, 2007; 王晓华, 文剑冰, 2010; 关丹丹, 王博, 车宏生, 2011）；其二是心理测验的编制与开发（安哲锋, 骆方, 张厚粲, 2008; Føllesdal & Hagtvet, 2009; 骆方, 刘红云, 张月, 2010; 孙颖, 张慧, 曹小燕, 2012）。此外，GT也常用于表现性评价中评分者信度的评估（孙晓敏, 张厚粲, 2005; 徐思, 张敏强, 黎光明, 2009; 康春花, 姜宇, 辛涛, 2010）。

一般而言，GT分为一元概化理论（Univariate Generalizability Theory, UGT）和多元概化理论（Multivariate Generalizability Theory, MGT）。MGT中G研究的目的是明确测验设计，包括对测量目标、测验结构、测量对象、测量模式以及测量题目进行分析。其方法是采用方差分析技术对测验总分的变异进行分解，从而明确各种因素之间的关系，估计各效应在各个潜在因子上的方差与协方差分量矩阵等。而D研究则是考察概化系数和可靠性指数与测量目标或各个测量侧面之间的变化关系，准确地估计各种决策下测量结果的信度，从而为改进测量设计，提高测量质量提供必要依据。D研究涉及到的内容是先分别估计被试在各个潜在因子上的全域分数及相应的相对误差和绝对误差，概化系数和可靠性指数等。接着利用协方差贡献率等方法确定各个因子全域分数的权重系数，合成一个全域总分，并估计其相应的相对误差，绝对误差，概化系数，可靠性指数，相对信噪比和绝对信噪比等。最后根据估计出的结果做出相应的决策。较UGT而言，MGT在处理那些涉及到多个相关的潜在因子的测验时具有其独到的作用（杨志明, 张雷, 2003b）。Nuβbaum（1984）研究发现MGT更适宜处理多维度问卷的信度问题，可发现总体信度较高而维度信度较低的问题，并提供改进意见。

鉴于此，本文拟采用多元概化理论（MGT）对ASBI及其分量表的测量学性能进行分析，以期为改进ASBI的测验结构与提高测验精确度提供参考。

2 研究方法 2.1 被试

采用方便取样原则，以贵阳花溪大学城在校学生为调查对象，共发放问卷700份，最终获得有效问卷660份，有效回收率为94.3%。其中男生360人（54.5%），女生297人（45.5%），3人未注明性别；文科188人（28.5%），理科155人（23.5%），工科317人（48.0%）；大一278人（42.1%），大二213人（32.3%），大三169人（25.6%）；年龄（20.27岁±1.60岁）。

2.2 研究设计

采取多元p×i随机测量模式，其中测量目标为被试者（p），测量侧面为测验条目（i）。

2.3 研究工具

青少年学习倦怠量表该量表由吴艳等（2010）编制，包括3个因子：身心耗竭（4个条目）、学业疏离（5个条目）和低成就感（7个条目），共16个条目，采用Likert-5点记分，1代表“很不符合”，5代表“非常符合”，量表总分反映了个体学习倦怠的总体状况。根据量表已有的理论结构，使用Mplus6.11对量表的结构效度进行验证性因素分析，三因子模型得到了数据的有效支持，各项拟合指数分别是χ²=435.30, df=101, χ²/df=4.31, RMSEA（90% CI）=0.07（0.06, 0.08）, NNFI=0.89, CFI=0.91, SRMR=0.07。本研究中各因子的合成信度分别是0.73，0.78和0.84，95%的置信区间分别是[0.70, 0.75]，[0.76, 0.81]和[0.82, 0.85]

2.4 共同方法偏差的控制

由于本研究各变量均采用量表测量，并且由同一被试提供信息，故在进行数据分析之前对样本数据进行了共同方法偏差的检验（Podsakoff, MacKenzie, Lee, & Podsakoff, 2003; 周浩, 龙立荣, 2004）。本研究主要采取Harman单因素检验法（Malhotra, Kim, & Patil, 2006），单因子模型的各项拟合指标如下：χ²=1281.44, df=104, χ²/df=12.32, RMSEA（90% CI）=0.13（0.12, 0.14）, NNFI=0.62, CFI=0.67, SRMR=0.10。这表明本研究未发现明显的共同方法偏差问题。

2.5 数据处理与分析

运用SPSS16.0对数据进行了录入和整理。数据处理时是以各因子的原始得分为基础，多元概化分析在mGENOVA2.1统计软件（Brennan, 2001b）上运行。

3 结果 3.1 G研究

根据量表的3因子模型，使用mGENOVA2.1程序可得到被试者（p）、测验条目（i）以及被试与测验条目之间的交互效应（p×i）在3个因子上的方差协方差分量的估计矩阵（见表1）。

表 1 3因子模型的G研究结果

表1结果显示，被试在3个因子上得分的协方差不是很高，各因子之间呈中等程度的相关关系；各因子本身的方差分量（被试者p的方差分量）较大，而测验条目的方差分量相对较小，与被试有关的效应（被试者与测验条目间的交互效应）也相对较大。

3.2 D研究

依据G研究结果估计的方差与协方差矩阵，可得到被试在3个因子上的全域分数以及相应误差的方差分量，进而估计出各因子的概化系数、可靠性指数、相对信噪比和绝对信噪比。另外，根据各因子条目数所占比重可得出权重系数（W系数），通过对3个因子全域分进行合成，可估计全域总分的方差以及相应误差的方差分量，进而得出全域总分的概化系数、可靠性指数、相对信噪比和绝对信噪比（见表2）。

表 2 3因子模型的D研究结果

表2结果显示，3个因子的概化系数与可靠性指数均达到较好水平，ASBI分3个因子是可行的，并且分为3个因子后量表的拟合优度较好；同时，量表全域总分的概化系数和可靠性指数明显高于各因子的概化系数和可靠性指数，且全域总分的相对误差方差分量和绝对误差方差分量均小于各因子的相对误差方差和绝对误差方差。

3.3 各因子对总方差贡献率的分析

根据上述结果，可以得到各因子对全域方差的贡献情况，结果见表3。

表 3 各因子对全域总分的贡献比

表3结果显示，身心耗竭、学业疏离对全域总分的贡献均略高于各自在全量表上的分值比重，而低成就感对全域总分的贡献则略低于它在全量表中的分值比重；低成就感对相对误差方差的贡献最大，而学业疏离对绝对误差方差的贡献最大。

4 讨论

本研究对青少年学习倦怠量表进行多元概化分析，G研究结果显示，对被试在3个因子上得分进行方差协方差分量估计，各因子之间呈中等程度相关，这说明3个因子之间既有相对的独立也存在一定的关联性，但能否将3个因子合成为一个总分还有待于D研究的结果；另外，在各因子中被试者的方差分量均较大，这说明被试者以及与被试者有关的变异在测验分数变异中所占的比重较大，而测验条目的方差分量则相对较小，这说明测验条目引起的变异在测验分数变异中所占的比重较小，表明测验条目有较好的难度和区分度。

D研究结果显示，3个因子的概化系数和可靠性指数均达到较好的水平，这表明ASBI既可用于常模参照测验，也可用于标准参照测验。ASBI分3个因子是可行的，且提取3个因子后量表的测量优度较好。另外，全量表全域总分的概化系数与可靠性指数都达到0.85以上，且都高于各因子的相应指标。全域总分的相对误差方差分量和绝对误差方差分量均小于各因子的相对误差方差分量和绝对误差方差分量，因而将3个因子合成为一个总量表是合理的，3个因子合成为一个总量表使用时能更好地发挥量表的功效。对全域方差的贡献率（即对全域分数的重要性）由大到小依次为：低成就感、学业疏离和身心耗竭。身心耗竭、学业疏离对全域总分的贡献均略高于各自在全量表上的分值比重，而低成就感对全域总分的贡献（仅占41.37%）略低于它在全量表中的分值比重（占43.75%）。这表明它在总量表中的实际影响没有达到应有的水平。而在对相对误差方差的贡献率和对绝对误差的贡献率最高的分别是低成就感和学业疏离。另外，身心耗竭因子的概化系数（0.72）和可靠性指数（0.69）相对于其它2个因子均最低，这可能与它所包含的条目数相对较少（共4题）有关。因此今后对该量表进行修订时，可考虑对学业疏离和低成就感因子的条目质量进行修订，也可考虑适当增加身心耗竭因子的条目数以提高其测验信度。

总之，多元概化分析结果表明，基于本土文化环境编制的青少年学习倦怠量表的结构符合其编制理论的假设，支持原编者运用CTT所得的结果。该量表及其分量表（因子）既可以作为常模参照测验使用，也可作为标准参照测验使用，值得在实际中加以推广与使用。

5 结论

（1）ASBI的各因子和总量表的信度较高，既能作为一个总量表使用以了解个体的总体学习倦怠状况，也可以各因子为基线了解个体在学习领域中的倦怠状态。

（2）ASBI的概化系数和可靠性指数均达到较好水平，表明其该量表及其分量表（因子）既可以作为常模参照测验使用，也可作为标准参照测验使用。

（3）ASBI在决定各因子的分量比例方面还不尽完善。今后的修订工作，可考虑改进学业疏离和低成就感因子条目的质量，适当增加身心耗竭因子的条目数以提高其测量学指标。

参考文献

安哲锋, 骆方, 张厚粲. (2008). 多元概化理论在评定量表编制中的作用——以音像教材测评数据分析为例. 心理科学, 31(5): 1192-1194.

蔡艳, 陈抚良. (2007). 多元概化理论在教育评估信度分析中的应用研究. 江西师范大学学报(自然科学版), 31(3): 306-310. DOI:10.3969/j.issn.1000-5862.2007.03.023

方来坛, 时勘, 张风华. (2009). 中文版学习倦怠量表的信效度研究. 中国临床心理学杂志, 17(1): 29-31.

关丹丹, 王博, 车宏生. (2011). 2007-2010年心理学专业基础综合考试的多元概化理论研究. 心理科学, 34(4): 950-956.

胡俏, 戴春林. (2007). 中学生学习倦怠结构研究. 心理科学, 30(1): 162-164. DOI:10.3969/j.issn.1671-6981.2007.01.041

康春花, 姜宇, 辛涛. (2010). 概化理论在人事测评中的评分者一致性研究. 心理科学, 33(6): 1456-1460.

连榕, 杨丽娴, 吴兰花. (2005). 大学生的专业承诺、学习倦怠的关系与量表编制. 心理学报, 37(5): 632-636.

骆方, 刘红云, 张月. (2010). 应聘情境下作假识别量表的开发. 心理学报, 42(7): 791-801.

漆书青. (2003). 现代测量理论在考试中的应用. 武汉: 华中师范大学出版社.

孙晓敏, 张厚粲. (2005). 表现性评价中评分者信度估计方法的比较研究——从相关法、百分比法到概化理论. 心理科学, 28(3): 646-649. DOI:10.3969/j.issn.1671-6981.2005.03.036

孙颖, 张慧, 曹小燕. (2012). 基于概化理论的作假识别量表编制及其作用——以心理资本问卷中作假识别量表的编制为例. 心理与行为研究, 10(6): 473-479. DOI:10.3969/j.issn.1672-0628.2012.06.014

王晓华, 文剑冰. (2010). 多元概化理论在高等教育达标性考试中的应用. 心理科学, 33(5): 1233-1226.

吴艳, 戴晓阳, 温忠麟, 崔汉卿. (2010). 青少年学习倦怠量表的编制. 中国临床心理学杂志, 18(2): 152-154.

许清鹏, 张建新, 刘普强, 王晶, 王宝军. (2006). 中职生学习倦怠状况及其与人格特征关系. 中国行为医学科学, 15(4): 367-369. DOI:10.3760/cma.j.issn.1674-6554.2006.04.034

徐思, 张敏强, 黎光明. (2009). 基于GT和多面Rasch模型的结构化面试分析. 心理学探新, 29(5): 77-82. DOI:10.3969/j.issn.1003-5184.2009.05.016

杨志明, 张雷. (2003a). 测评的概化理论及其应用. 北京: 教育科学出版社.

杨志明, 张雷. (2003b). 韦氏儿童智力量表能否测量第3因子—WISC-CR的多元概化理论研究. 心理科学, 26(2): 305-307.

杨志明, 张雷, 马世晔. (2004). 从多元概化理论看高考综合能力测试的改进. 心理学报, 36(2): 195-200.

张莹, 甘怡群, 张秩文. (2005). MBI-学生版的信效度检验及影响倦怠的学业特征. 中国临床心理学杂志, 13(4): 383-385. DOI:10.3969/j.issn.1005-3611.2005.04.002

周浩, 龙立荣. (2004). 共同方法偏差的统计检验与控制方法. 心理科学进展, 12(6): 942-950.

Ammondson, P. (2000). Job burnout. Society of Management, 74(3): 11-12.

Brennan, R. L. (2001a). Generalizability theory. New York: Springer-Verlag.

Brennan, R. L. (2001b). mGENOVA (Version 2.1) [Computer software and manual]. Iowa City: University of Iowa. Available from http://www.education.uiowa.edu/casma/GenovaPrograms.htm

Brennan, R. L. (2010). Generalizability theory and classical test theory. Applied Measurement in Education, 24(1): 1-21. DOI:10.1080/08957347.2011.532417

Fimian, M. J., & Cross, A. H. (1986). Stress and burnout amoung preadolescent and early adolescent gifted students: a preliminary investigation. The Journal of Early Adolescence, 6(3): 247-267. DOI:10.1177/0272431686063004

Føllesdal, H., & Hagtvet, K. A. (2009). Emotional intelligence: The MSCEIT from the perspective of generalizability theory. Intelligence, 37(1): 94-105. DOI:10.1016/j.intell.2008.08.005

Jacobs, S. R., & Dodd, D. (2003). Student burnout as a function of personality, social support, and workload. Journal of College Student Development, 44(3): 291-303. DOI:10.1353/csd.2003.0028

Kokkinos, C. M., Panayiotou, G., & Davazoglou, A. M. (2005). Correlates of teacher appraisals of student behaviors. Psychology in the Schools, 42(1): 79-89. DOI:10.1002/(ISSN)1520-6807

Malhotra, N. L., Kim, S. S., & Patil, A. (2006). Common method variance in IS research: A comparison of alternative approaches and a reanalysis of past research. Management Science, 52(12): 1865-1883. DOI:10.1287/mnsc.1060.0597

Maslach, C., Schaufeli, W. B., & Leiter, M. P. (2001). Job burnout. Annual Review of Psychology, 52: 397-422. DOI:10.1146/annurev.psych.52.1.397

Nuβbaum, A. (1984). Multivariate generalizability theory in educational measurement: An empirical study. Applied Psychological Measurement, 8(2): 219-230. DOI:10.1177/014662168400800211

Podsakoff, P. M., MacKenzie, S. B., Lee, J. Y., & Podsakoff, N. P. (2003). Common method biases in behavioral research: A critical review of the literature and recommended remedies. Journal of Applied Psychology, 88(5): 879-903. DOI:10.1037/0021-9010.88.5.879

Ross, L. A., Attaway, T. L., Staik, I. M., Harwell, B. D., Burling, J. W., & Gilbert, D. K. (2002). Assessing knowledge of professional burnout in college students entering helping professions: A pilot study addressing the need for inclusion of burnout information in undergraduate curricula. Annual Meeting of the Mid-South Educational Research Association, Chattanooga, TN.

Schaufeli, W. B., Martínez, I. M., Pinto, A. M., Salanova, M., & Bakker, A. B. (2002). Burnout and engagement in university students: A cross-national study. Journal of Cross-Cultural Psychology, 33(5): 464-481. DOI:10.1177/0022022102033005003

Shavelson, R. J., & Webb, N. M. (1991). Generalizability theory: A primer. Newbury Park, CA: Sage.

Steele, J. P., & Fullagar, C. J. (2009). Facilitators and outcomes of student engagement in a college setting. The Journal of Psychology, 143(1): 5-27. DOI:10.3200/JRLP.143.1.5-27

Suen, H. K., & Lee, P. W. (2007). Classical versus Generalizability theory of measurement. Educational Measurement, 4: 1-13.

Yin, P. (2005). A multivariate generalizability analysis of the multistate bar examination. Educational and Psychological Measurement, 65(4): 668-685. DOI:10.1177/0013164404273940

A Multivariate Generalizability Analysis of the Adolescent Student Burnout Inventory

LUO Jie^1,2, ZHOU Yuan^1,2, CHEN Wei^1,2, PAN Yun^1,2, ZHAO Shouying^1,2

1. School of Educational Science, Guizhou Normal University, Guiyang 550001;
2. Guizhou General Colleges Key Laboratory of Fundamental Psychology and Cognitive Neuroscience, Guiyang 550001

Abstract: The primary purpose of this paper is to use Multivariate Generalizability Theory (MGT) to explore the psychometric properties of Adolescent Student Burnout Inventory (ASBI). The results indicated that: the generalizability coefficient and the index of dependability were good for each factor and the whole scale, and they could be used for the norm-referenced test and the criterion-referenced test; The component proportion of each factor in the scale was not good, the contribution of reduced efficacy in the universe score was lower than its proportion in the total scores, the variance of reduced efficacy was the biggest in the relative error variance contribution, the variance of learning cynicism was the biggest in the absolute error variance contribution. In future, the revision of the ASBI, researcher must not only improve the quality of learning cynicism and reduced efficacy, but also increase the item number of exhaustion, to enhance the reliability of the scale.

Key words: student burnout adolescent multivariate generalizability theory reliability


心理与行为研究 2018, Vol. 16 Issue (5): 665-669, 712	0