﻿ 纵向数据潜变量增长曲线模型及其在Mplus中的实现
 中华流行病学杂志  2017, Vol. 38 Issue (8): 1132-1135 PDF
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2017.08.027

0

#### 文章信息

Song Qiuyue, Wu Yazhou.

The latent variable growth curve model of longitudinal data and its implementation in Mplus

Chinese journal of Epidemiology, 2017, 38(8): 1132-1135
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2017.08.027

### 文章历史

400038 重庆, 第三军医大学军事预防医学系卫生统计学教研室

The latent variable growth curve model of longitudinal data and its implementation in Mplus
Song Qiuyue, Wu Yazhou
Department of Health Statistics College of Preventive Medicine, Third Military Medical University, Chongqing 400038, China
Corresponding author: Wu Yazhou, Email:asiawu5@sina.com
Fund program: National Natural Science Foundation of China (81573254)
Abstract: To discuss the latent variable growth curve model of longitudinal data and give its implementation method in Mplus. The application of Mplus software has been used to deal with the longitudinal data of mental health status of college students in an university. Results show that the model can process the longitudinal data with latent variables, which can compare the differences of the overall development trend and individual development, also taking a covariate into the model to improve the effect of model fitting. Using Mplus software to process the longitudinal data with latent variables, the program is simple and easy to operate. This study provides the latent variable growth curve model of longitudinal data and its procedure of implementation in Mplus, and the statistical methodology guidance and reference for practical applications of epidemiological cohort study.
Key words: Longitudinal data     Latent variable growth curve model     Mplus

LGCM源于探索性因子分析及相关文献，是结构方程模型的一种变式。可以分析某一变量的变化趋势，用不可测量或难以测量的潜变量来描述总体的平均增长趋势，还可分析总体发展趋势和总体之间存在的差异，也可以分析个体之间的发展差异[5]。LGCM与含有均值的结构方程模型类似，是将截距η0j和斜率η1j定义为潜在因素，以描述纵向数据的变化特征。如图 1y1y2y3ym分别表示m次重复测量，ε1ε2ε3εm表示每次测量误差，LGCM中2个潜在因子是截距因子η0j和斜率因子η1j。截距因子表示观察对象测量的初始水平，描述当时间变量等于0时，结果变量y的水平，是常数项，不考虑协变量；斜率因子表示观察对象的增长轨迹，合适的载荷因子有利于模型参数的解释。截距η0jm次观测的载荷均定义为1，斜率η1j的因子载荷称为时间分值，斜率η1jm次观测的载荷(ata)定义为0，1，……，m－1，也可自由定义，以减少自由度。

 注：xij为时间恒定的协变量，y1、y2、y3、ym分别表示m次重复测量，ε1、ε2、ε3、εm表示每次测量误差，η0j为截距因子，η1j为斜率因子 图 1 潜变量增长曲线模型

1.简单非条件潜变量增长曲线模型：即不考虑任何协变量，其模型为

(1)
(2)
(3)

2.条件潜变量曲线增长模型：在非条件潜变量增长曲线模型的基础上纳入协变量，用以预测截距因子和斜率因子。协变量又分为时间恒定和时间变化两种情况。

(1) 时间恒定协变量的LGCM：其模型为

(4)
(5)
(6)

(2) 时间变化的LGCM：其模型为

(7)
(8)
(9)

3. Mplus软件实现：Mplus主要包含10个常用命令，即TITLE、DATA、VARIABLE、DEFINE、ANALYSIS、MODEL、OUTPUT、SAVEDATA、PLOT、MONTECARLO[7]。本文使用Mplus 7.0软件进行编程，非条件和条件潜变量增长曲线模型分析纵向数据的Mplus程序见表 1

1.资料数据：该研究采用自制量表监测大学生心理健康状况，每隔1个月进行测量，该量表含有“感觉紧张不安”等5个条目以及“是否有自杀想法”1个特殊条目，每个条目有5个选项：0＝完全没有，1＝轻微，2＝中等程度，3＝厉害，4＝非常厉害，得分越高表示心理压力越大，需要给予适当干预。共观测了83名学生一学期4次的心理测评情况，其中男生29人，女生54人，结果见表 2

2.结果分析：

(1) 模型拟合情况：根据Mplus输出结果显示，无协变量情况下，χ2＝8.743，P＞0.05，模型拟合良好，近似误差均方根RMSEA＝0.095＞0.08，拟合结果可接受，但不理想。比较拟合指数CFI＝0.974，TLI＝0.968，均＞0.95，标准化拟合残差SRMR＝0.069，表示拟合效果好。协变量的引入可以提高模型的拟合效果，模型χ2＝11.763，P＞0.05，模型拟合效果良好，近似误差均方根RMSEA＝0.091，较前者更接近可接受界值。比较拟合指数CFI＝0.967，TLI＝0.953，也均＞0.95，标准化拟合残差SRMR＝0.069(＜0.08表示拟合效果好)，结果见表 3

(2) 非条件潜变量增长曲线模型结果分析：截距均值为4.475，斜率均值为0.048，学生心理评分随时间变化呈上升趋势。潜变量的方差估计结果显示，截距的方差为4.632，P＜0.05，斜率的方差为0.518，P＜0.05，差异有统计学意义，说明心理健康状况的初始水平和变化趋势存在个体差异。截距与斜率的协方差为-0.285，说明截距与斜率呈负相关关系，P＝0.461，差异无统计学意义，说明心理健康状况的初始水平与变化速度相关不显著(表 4)。

(3) 时间恒定潜变量增长曲线模型：在非条件潜变量增长曲线模型的基础上纳入性别协变量，探讨性别对大学生心理健康状况变化的影响。结果显示，η0＝4.005，为大学生心理评分的初始水平均值，η1＝0.151，为大学生心理评分平均变化趋势。σ2(μ0j)＝4.383，σ2(μ1j)＝0.511，均P＜0.05，说明心理健康状况的初始水平和变化趋势存在个体差异，γ01＝1.308，P＜0.05，γ11＝-0.283，P＞0.05，分别是性别对截距和斜率的影响，不同性别的学生的心理评分初始水平不同，变化趋势不受性别影响(表 6)。

 [1] 刘红云, 孟庆茂. 纵向数据分析方法[J]. 心理科学进展, 2003, 11(5): 586–592. Liu HY, Meng QM. A review on longitudinal data analysis method and it's development[J]. Adv Psychol Sci, 2003, 11(5): 586–592. DOI:10.3969/j.issn.1671-3710.2003.05.019 [2] 李丽霞, 周舒冬, 张敏, 等. 多水平模型和潜变量增长曲线模型在纵向数据分析中的应用及比较[J]. 中华流行病学杂志, 2014, 34(6): 741–744. Li LX, Zhou SD, Zhang M, et al. Comparisons of two statistical approaches in studying the longitudinal data:the multilevel model and the latent growth curve model[J]. Chin J Epidemiol, 2014, 34(6): 741–744. DOI:10.3760/cma.j.issn.0254-6450.2014.06.028 [3] Verbeke G, Fieuws S, Molenberghs G, et al. The analysis of multivariate longitudinal data:a review[J]. Stat Methods Med Res, 2014, 23(1): 42–59. DOI:10.1177/0962280212445834 [4] Gunzler DD, Morris N. A tutorial on structural equation modeling for analysis of overlapping symptoms in co-occurring conditions using Mplus[J]. Stat Med, 2015, 34(24): 3246–3280. DOI:10.1002/sim.6541 [5] 李丽霞, 郜艳晖, 张敏, 等. 潜变量增长曲线模型及其应用[J]. 中国卫生统计, 2012, 29(5): 713–716. Li LX, Gao YH, Zhang M, et al. Latent growth curves model and its application[J]. Chin J Health Stat, 2012, 29(5): 713–716. [6] 王济川, 王小倩, 姜宝法.结构方程模型:方法与应用[M]. 北京: 高等教育出版社, 2011. Wang JC, Wang XQ, Jiang BF.Structural equation models:methods and applications[M]. Beijing: Higher Education Press, 2011. [7] 裴磊磊, 任琳, 张岩波, 等. Mplus软件简介[J]. 中国卫生统计, 2013, 30(4): 614–616. Pei LL, Ren L, Zhang YB, et al. Mplus software profile[J]. Chin J Health Stat, 2013, 30(4): 614–616. [8] 高彩虹. 基于广义估计方程和潜变量增长曲线模型的阿尔茨海默病健康相关生命质量动态变化研究[D]. 太原: 山西医科大学, 2012. Gao CH. Dynamic study on health-related quality of life in the progression of Alzheimer's disease based on generalized estimating equations and latent growth curve model[D]. Taiyuan:Shanxi Medical University, 2012. http://d.wanfangdata.com.cn/Thesis/Y2127550