中华流行病学杂志  2018, Vol. 39 Issue (3): 368-373   PDF    
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2018.03.023
中华医学会主办。
0

文章信息

王琦, 王晓萌, 陈文明, 周琳, 孟琼, 陈松华, 柳正卫, 王伟炳.
Wang Qi, Wang Xiaomeng, Chen Wenming, Zhou Lin, Meng Qiong, Chen Songhua, Liu Zhengwei, Wang Weibing.
以广义估计方程研究浙江省肺结核耐药预测方程
Application of generalized estimation equations to establish prediction equation for tuberculosis drug resistance in Zhejiang province
中华流行病学杂志, 2018, 39(3): 368-373
Chinese Journal of Epidemiology, 2018, 39(3): 368-373
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2018.03.023

文章历史

收稿日期: 2017-07-06
以广义估计方程研究浙江省肺结核耐药预测方程
王琦1, 王晓萌2, 陈文明1, 周琳2, 孟琼2, 陈松华2, 柳正卫2, 王伟炳1     
1. 200032 上海, 复旦大学公共卫生学院流行病学教研室 教育部公共卫生安全重点实验室 健康风险预警治理协同创新中心;
2. 310051 杭州, 浙江省疾病预防控制中心 结核病预防控制所
摘要: 目的 耐药肺结核患者可能对一种或多种抗结核药物耐药。对这类因变量为多结局非独立的数据,本文探讨应用广义估计方程分析耐药危险因素,构建预测方程,探索预警模型建立方向。方法 对浙江省30个耐药监测点的涂阳患者进行药敏检测和问卷调查,以对13种抗结核药物的耐药情况为因变量,可能危险因素为自变量,用SAS的GENMOD模块构建广义估计模型。结果 本研究中基线水平下发生耐药的概率为20.26%,有统计学意义的耐药影响因素包括年龄、保险、是否合并乙型肝炎、治疗史及停药情况。根据各因素对耐药发生的影响程度得到预测方程。结论 广义估计方程解决了耐药数据因变量相关性的问题,有效利用非独立数据提供的信息,且参数估计稳健,为耐药危险因素评价和预警模型构建提供更全面的信息。
关键词: 广义估计方程     耐药肺结核     预测方程     影响因素    
Application of generalized estimation equations to establish prediction equation for tuberculosis drug resistance in Zhejiang province
Wang Qi1, Wang Xiaomeng2, Chen Wenming1, Zhou Lin2, Meng Qiong2, Chen Songhua2, Liu Zhengwei2, Wang Weibing1     
1. Department of Epidemiology, School of Public Health, Fudan University, Key Laboratory of Public Health Safety, Ministry of Education, Collaborative Innovation Center of Social Risk Governance in Health, Shanghai 200032, China;
2. Department of Tuberculosis Control and Prevention, Zhejiang Provincial Center for Disease Control and Prevention, Hangzhou 310051, China
Corresponding author: Wang Weibing, Email: wwb@fudan.edu.cn
Fund program: Major Science and Technology Research Project of Zhejiang Province (2014C03034)
Abstract: Objective Drug-resistant tuberculosis (TB) may be resistant to one or multiple anti-TB drugs. We used generalized estimation equations to analysis the risk factors of drug-resistant TB and provide information for the establishment of a warning model for these non-independent data. Methods The drug susceptibility test and questionnaire survey were performed in sputum positive TB patients from 30 anti TB drug-resistance surveillance sites in Zhejiang province. The generalized estimation model was established by the GENMOD module of SAS, with resistance to 13 kinds of anti-TB drugs as dependent variables and possible influencing factors, such as age, having insurance, HBV infection status, and history of anti-TB drug intake, as independent variables. Results In this study, the probability of drug resistance at baseline level was 20.26%. Age, insurance, whether being co-infected with HBV, and treatment history or treatment withdrawal were statistically significantly correlated with anti-TB drug resistance. The prediction equation was established according to the influence degree of the factors mentioned above on drug resistance. Conclusion The generalized estimation equations can effectively and robustly analyze the correlated binary outcomes, and thus provide more comprehensive information for drug resistance risk factor evaluation and warning model establishment.
Key words: Generalized estimation equations     Drug-resistant tuberculosis     Prediction equation     Influencing factor    

结核分枝杆菌耐药是指结核病患者体内感染的结核分枝杆菌经过药物敏感性试验(drug susceptibility test,DST)证实对一种或多种抗结核药物耐药。根据WHO 2017年的全球结核病报告,初治患者中耐多药结核病(MDR-TB)和耐利福平结核病(RR-TB)占4.1%,复治患者中MDR-TB和RR-TB占19%[1]。2007-2008年原卫生部组织的全国结核病耐药基线调查显示,5.7%的初治患者和25.6%的复治患者患有MDR-TB。耐药结核疾病负担没有显著下降,为此,寻找耐药结核病的危险因素,构建预警模型,从而帮助识别耐药结核病高危患者,进行规范的药敏试验诊断,对耐药结核病的治疗和管理至关重要。

耐药结核影响因素的传统分析方法是将耐药作为因变量,影响因素作为自变量。一种设耐药为1,敏感为0,采用两分类的logistic模型进行分析,另一种方法是将耐药分为单耐药、耐多药和广泛耐药结核病,采用多分类logistic模型进行分析[2-3]。但耐药结核病患者可能耐一种或多种抗结核药物,耐多药结核病患者间耐药种类也可能不同,所以将耐药情况作为一个应变量,将丢失大量有用信息。应该用多个应变量表示耐药情况,且对不同抗结核药物的耐药可能存在相关性,即多个应变量之间存在关联,传统分析方法也会丢失数据相关性所提供的信息[4-5]。广义估计方程(generalized estimation equations,GEE)由Liang和Zager在广义线性方程基础上提出,采用拟似然函数,对相关性变量,指定一个“工作”相关矩阵,实现了对非独立数据的稳健分析[6],GEE模型在对临床实验中的纵向数据,疾病并发症发生的分析中被有效应用[7-8]

本文采用GEE,识别肺结核耐药的危险因素并纳入模型,预警发生耐药肺结核的高危群体,提供控制耐药疫情的可操作建议,并对高危个体实行早期干预。

资料与方法

1.研究对象:选择2014年1月至2015年2月由浙江省耐药监测纳入的新发涂阳患者。耐药监测策略采用WHO提供的人口比例整群抽样方法,抽取浙江省30个县(市、区)耐药监测点为研究现场,该30个耐药监测点的分布和特征可代表浙江省全省的结核疫情情况。选择新登记的初治及复治涂阳结核病患者为研究对象。患者纳入方式为检测单位年内每个监测点连续、不间断纳入30例新发涂阳患者,其中包括了复治涂阳患者与长期排菌患者。

2.药敏检测方法:培养阳性的菌株统一送浙江省参比室作药物敏感试验,由省参比室应用比例法进行异烟肼(INH)、利福平(RFP)、链霉素(SM)、乙胺丁醇(EMB),应用比例法或绝对浓度法(间接法)对氧氟沙星(OFX)、丙硫异烟胺(PTO)、阿米卡星(AK)、卡那霉素(KM)、卷曲霉素(CM)、对氨基水杨酸(PAS)、环丝氨酸(CS)的药物敏感性测定。

3.患者信息收集:由经过培训的结防医生按照统一设计的信息表当面询问患者收集信息,包括结核病患者的人口社会学资料、生活习惯、既往史等信息。

4.分析方法和原理:

(1)数据转换:拟合GEE模型前需进行数据转换,假设原数据观测了n个研究对象的m项指标(抗结核药物耐药情况),需要将一个研究对象的一条记录转换为一个研究对象的m条记录[9]。第i个研究对象(i=1,2,…,n)第jj=1,2,…,m)种耐药发生情况记为YijYij=0,未对第j种抗结核药物耐药,Yij=1,对第j种抗结核药物耐药),YijXij1Xij2,…,Yijm)为与Yij相对应的自变量向量。不同研究对象之间的结局变量相互独立,同一研究对象对不同抗结核药物的耐药情况存在相关性。

(2)构建GEE模型[10]:首先建立应变量与自变量的函数关系,应变量Yij的边际期望函数是自变量Yij的线性函数,基本构成:

gμij)为联接函数,根据数据类型选择,本次选择Binary logistic作为联接函数。指定Yij的边际方差是边际期望的已知函数,其中Riα)为适合每个应变量Yim×m维“作业”相关矩阵,则有广义估计方程:

采用迭代法,估计方程中的三类参数:相关参数α,尺度参数Φ,解释变量系数β

本研究将患者对结核药物的耐药情况作为因变量,结核药物包括异烟肼(INH)、利福平(RFP)、链霉素(SM)、乙胺丁醇(EMB)、氧氟沙星(OFX)、阿米卡星(AK)、卡那霉素(KM)、对氨基水杨酸(PAS)、环磷酰胺(CPM)、环丝氨酸(CS)、丙硫异烟胺(PTO)、左氧氟沙星(LVFX)、拉氧头孢(MOX),应变量之间具有类似特征,变化方向一致,相关结构不确定,虽然GEE对于相关结构并不敏感,但是正确的相关结构提高估计效能[11],故引入准似然独立准则(quasi-likelihood under the independence model criterion,QIC)。GEE模型由广义线性方程(generalized linear model,GLM)发展而来,但其理论基础为准似然估计原理,最小信息准则(akaike information criterion,AIC)不适用于推断最佳模型,Pan[12]修订了AIC,称为QIC,以适应GEE分析中的模型选择并得到了应用与验证[13-14]

患者性别、年龄、住址、文化程度、医疗保险、糖尿病、乙型肝炎(乙肝)、结核病诊断史、结核病治疗史等作为自变量拟合GEE。应变量和自变量赋值情况见表 1

表 1 变量赋值情况

所有数据用SPSS 19.0软件进行分析处理,GEE用SAS 9.0软件中GENMOD模块实现。

结果

1.一般情况:实际收回有效调查问卷2014年872份,2015年1月83份,共955份。其中,有308例患者至少对一种抗结核药物耐药,占总调查患者的32.25%,其中链霉素耐药和异烟肼耐药率最高,分别为16.8%和14.2%。抗结核药物耐药情况见表 2

表 2 结核病患者耐药发生情况

2. GEE分析:以耐药情况为因变量,对选取的自变量进行共线性诊断,方差扩大因子均<10,提示不存在共线性,可纳入模型,拟合GEE。通过QIC统计量大小决定合适的大小相关矩阵,在同一个模型中QIC值越小模型越合适。本研究同一模型中,各“作业”相关矩阵的QIC值见表 3,故采用无结构的作业相关矩阵构建模型,P<0.05时,组间差异具有统计学意义,广义估计分析方程结果见表 4

表 3 各作业相关矩阵QIC值
表 4 广义估计方程分析结果

根据构建的模型显示,21~35岁、被诊断为乙肝、接受过抗结核治疗、第一次治疗停药情况是发生抗结核耐药的危险因素,购买商业保险是保护因素。以第一次治疗停药情况为例,累积停药超过2个月发生耐药的可能性为不停药的6.3倍,累计停药时间超过1个月且<2个月,发生耐药的可能性为不停药的8.2倍。

3.作业相关矩阵:GEE还可得到13个多重应答间的作业相关矩阵(表 5),反映的是控制了各自变量的影响之后,对13种抗结核药物耐药的关联性估计。说明某些抗结核药物的耐药性存在一定的正相关关系,对某一种抗结核药物耐药的患者更易对其他药物耐药。一线口服抗结核药中,异烟肼与利福平相关性较高;喹诺酮类抗结核药与头孢类抗结核药相关性高。

表 5 广义估计方程的作业相关矩阵

4.抗结核药物耐药预测:对13种抗结核药物(z1,z2 …,z13)的多重应答,分别拟合13个常数项,以Logit作为线性连接函数,第i个观察对象第j种抗结核药物的耐药情况记为YijYij为与Yij相对应的自变量向量,Yij的期望值为EYij)。构建广义估计模型:

13个(z1~z13)常数项的参数值,分别表示在基线水平下,对抗结核药物耐药的概率比数的自然对数值,各抗结核药物发生耐药的概率为:

纳入有统计学意义的参数项,年龄是否在21~35岁(Xij2/1),是否有商业保险(Yij5/4),是否诊断为乙肝(Yij7),治疗史(Xij14),第一次治疗停药情况(Xij15/3Xij15/4),结核病患者是否发生耐药的预测方程:

根据灵敏度与特异度找出区分是否为肺结核耐药高危患者的界限值,根据本预测方程,因变量临界值为-0.948,对应耐药概率为27.93%。该临界值对应的灵敏度为62.5%,特异度为74.7%。

讨论

医学研究中,常遇到一种疾病有多项指标的数据,如多重应答资料(知晓率、并发症),重复测量资料(新药临床试验)。这类数据不同于多分类资料,各结局变量并不独立,具有相关性,不符合模型独立性的要求,故不适合用普通的logistic相关模型进行分析;而如果不考虑这种相关性,将会低估标准误而高估检验统计量。这类数据也不同于多个独立的二分类资料,因为同一个体的结局变量具有相似性,所以每一个结局变量作为二分类资料不能提供研究对象的所有信息,且细分后,可能会出现同一自变量对不同抗结核药物影响不同的情况,不利于对结局的解读和预警模型的构建。

GEE在广义线性模型的基础上,引入了“工作”相关矩阵。“工作”相关矩阵是GEE的一个重要概念,表示的是因变量重复值两两之间相关性的大小,以Riα)表示。不同个体间因变量的相关性不完全相同,Riα)近似表示个体之间平均的相关,以Riα)构建作业协方差矩阵,解决了数据应变量相关性的问题[15],使得GEE的参数β得到一致性估计。因为仅需要每个对象被一致的估计,就可以得到回归参数的稳健估计,故GEE对相关结构的分析不敏感,但是,相关结构的正确指定,可提高参数估计的效能。GEE在本研究数据的应用中,体现了该方法具有一定优势,能较好的对多种药物耐药情况数据进行统计分析。

本研究发现,年龄在21~35岁的结核病患者对抗结核药物更易发生耐药,与其他研究有相似结果,可能由于年轻患者从事社会活动更频繁,感染耐药结核菌可能性大[16],并且,年轻患者由于工作时间冲突和心理因素,依从性反而难以得到保障[17]。购买商业保险作为保护因素,可能由于购买商业保险的患者有更高的健康意识,在甘肃省健康知识知晓率调查中,职工医疗保险及商业保险者的知识得分高于合作医疗患者[18]。在接受治疗方面,商业保险购买者具有较好的经济条件,不会因为经济负担影响治疗依从性[19]。被诊断为乙肝的肺结核患者更可能发生耐药性肺结核,可能因为抗结核一线药物大多以肝毒性为主要副作用[20-21],乙肝患者服用抗结核药物时导致肝损伤进一步加重,出现被迫停药或更换药物的情况,诱发耐药菌株的产生[22-23]。以及乙肝患者的身体机能较弱,使合并乙肝的肺结核患者血药浓度不稳定,易发生耐药。

研究发现,肺结核治疗史是耐药结核发生的重要因素[24-25],本研究也得出一致结论,同时进一步纳入第一次治疗的停药累积时间分析,停药时间累积>1个月的患者发生耐药的危险显著高于不停药或停药时间短的患者。不规则用药会导致患者治疗期延长、药物摄入量偏低。根据药物外排泵机制,机体在药物浓度达到最优浓度之前,外排泵通过排出吸收的药物来维持次优的药物浓度,这被认为是结核病耐药的一个重要原因[26-27]。Garima等[26]研究发现,在最小抑菌浓度的1/2或更低浓度下,异烟肼的浓度越高,外排泵基因的表达越高,从而导致结核菌体内的药物外排进入血液,引起结核菌体内的抗菌药物浓度不足,进一步导致细菌耐药的发生。因此我们推测,累计停药时间与耐药有较复杂的关系,整体药物血药浓度处于较低水平的同时,停药1~2个月较之停药>2个月的肺结核患者,有较高的药物摄入量,因此出现停药累积时间与耐药风险呈非线性剂量-反应关系的结果。

不同抗结核药物之间发生耐药的相关性不同,本研究发现喹诺酮类和头孢类抗结核药物的相关性高,说明患者对两种药物的耐药情况具有一定的趋同性,临床制定用药组合时,应慎重斟酌两种药物的同时使用。

本研究的不足之处在于耐药数据库资料不足,未能对方程进行多次验证。耐药预警模型构建及预警指标有赖于更完善的耐药监测资料,本研究以建立预测方程作为预警模型的初探,为耐药结核病的出现提供预测,有针对性的采取有效措施。


利益冲突:
参考文献
[1] WHO. Global tuberculosis report 2016[R]. Geneva: Organization World Health, 2016.
[2] 夏天, 夏珍, 沈鑫, 等. 上海市流动人口肺结核耐药情况及影响因素[J]. 环境与职业医学, 2011, 28(6): 327–331.
Xia T, Xia Z, Shen X, et al. Prevalence and risk factors of drug-resistant tuberculosis among migratory population in Shanghai, China[J]. J Environ Occup Med, 2011, 28(6): 327–331. DOI:10.13213/j.cnki.jeom.2011.06.020
[3] Wang K, Chen SH, Wang XM, et al. Factors contributing to the high prevalence of multidrug-resistant tuberculosis among previously treated patients:a case-control study from China[J]. Microb Drug Resist, 2014, 20(4): 294–300. DOI:10.1089/mdr.2013.0145
[4] 陈峰, 任仕泉, 陆守曾. 非独立计量资料的内部相关性研究[J]. 现代预防医学, 1998, 25(3): 269–271.
Chen F, Ren SQ, Lu SZ. Intra-unit correlation of dependent numerical data[J]. Mod Prev Med, 1998, 25(3): 269–271.
[5] Asar Ö, Ritchie J, Kalra PA, et al. Short-term and long-term effects of acute kidney injury in chronic kidney disease patients:A longitudinal analysis[J]. Biom J, 2016, 58(6): 1552–1566. DOI:10.1002/bimj.201500270
[6] Zeger SL, Liang KY, Albert PS. Models for longitudinal data:a generalized estimating equation approach[J]. Biometrics, 1988, 44(4): 1049–1060. DOI:10.2307/2531734
[7] 吴彬, 曹建平, 邹煌秀, 等. 广义估计方程在糖尿病并发症影响因素分析中的应用[J]. 中国卫生统计, 2016, 33(3): 385–388.
Wu B, Cao JP, Zou HX, et al. The application of generalized estimating equations in the research about influencing factors of complications of diabetes mellitus[J]. Chin J Health Stat, 2016, 33(3): 385–388.
[8] 华琳, 阎岩, 刘学宗. 用广义估计方程分析重复测量的定性资料[J]. 药物流行病学杂志, 2006, 15(1): 46–48.
Hua L, Yan Y, Liu XZ. Analyze repeated measures qualitative data by using generalized estimating equations[J]. Chin J Pharmacoepidemiol, 2006, 15(1): 46–48.
[9] 李运明, 封宗超, 李小凯, 等. EpiData和SPSS软件在多选题资料录入和统计分析中的应用[J]. 现代预防医学, 2010, 37(21): 4012–4014.
Li YM, Feng ZC, Li XK, et al. Application of EpiData and SPSS in statistical entry and analysis of the multiple-choice data[J]. Mod Prev Med, 2010, 37(21): 4012–4014.
[10] 陈峰. 非独立数据的统计分析方法[M]//方积乾, 陆盈. 现代医学统计学. 北京: 人民卫生出版社, 2002: 25-60.
Chen F. Statistical analysis methods for Non-independent data[M]//Fang JQ, Lu Y. Advanced Medical Statistics. Beijing: People's Medical Publishing House, 2002: 25-60.
[11] 张文彤, 田晓燕. 基于广义估计方程的多重应答资料统计分析方法[J]. 中国卫生统计, 2004, 21(3): 139–141.
Zhang WT, Tian XY. Application of generalized estimating equations in analysis of multiple response[J]. Chin J Health Stat, 2004, 21(3): 139–141. DOI:10.3969/j.issn.1002-3674.2004.03.003
[12] Pan W. Akaike's information criterion in generalized estimating equations[J]. Biometrics, 2001, 57(1): 120–125. DOI:10.1111/j.0006-341X.2001.00120.x
[13] 冯丽云, Cui J. 纵向数据准似然独立准则在GEE模型中的应用[J]. 中国卫生统计, 2008, 25(4): 369–372.
Feng LY, Cui J. Application of quasi-likelihood independence criterion in GEE analyses of longitudinal data[J]. Chin J Health Stat, 2008, 25(4): 369–372. DOI:10.3969/j.issn.1002-3674.2008.04.010
[14] Martus P, Stroux A, Jünemann AM, et al. GEE approaches to marginal regression models for medical diagnostic tests[J]. Stat Med, 2004, 23(9): 1377–1398. DOI:10.1002/sim.1745
[15] Zorn CJW. Generalized estimating equation models for correlated data:a review with applications[J]. Am J Polit Sci, 2001, 45(2): 470–490. DOI:10.2307/2669353
[16] Rifat M, Milton AH, Hall J, et al. Development of multidrug resistant tuberculosis in Bangladesh:a case-control study on risk factors[J]. PLoS One, 2014, 9(8): e105214. DOI:10.1371/journal.pone.0105214
[17] Law WS, Yew WW, Chiu LC, et al. Risk factors for multidrug-resistant tuberculosis in Hong Kong[J]. Int J Tuberc Lung Dis, 2008, 12(9): 1065–1070.
[18] 孙妍兰. 甘肃省肺结核患者健康状况及相关知识、行为调查研究[D]. 兰州: 兰州大学, 2013.
Sun YL. Research on the health status, health knowledge and behavior of tuberculosis patients in Gansu Province[D]. Lanzhou: Lanzhou University, 2013.
[19] 吕承菲. 综合干预措施下耐多药肺结核诊疗服务评价研究[D]. 济南: 山东大学, 2013.
Lv CF. Evaluation of multi-drug resistant tuberculosis medical service after comprehensive intervention[D]. Jinan: Shandong University, 2013.
[20] 易小萍, 黄丽晶, 彭学友. 抗结核药物对乙肝病毒标志物阳性肺结核患者肝功能的影响[J]. 现代医院, 2009, 9(4): 28–29.
Yi XP, Huang LJ, Peng XY. Affects of the anti-tuberculosis drugs on the liver function of the patients with HBVM-positive tuberculosis[J]. J Mod Hosp, 2009, 9(4): 28–29. DOI:10.3969/j.issn.1671-332X.2009.04.014
[21] Bliven EE, Podewils LJ. The role of chronic hepatitis in isoniazid hepatotoxicity during treatment for latent tuberculosis infection[J]. Int J Tuberc Lung Dis, 2009, 13(9): 1054–1060.
[22] Saitou Y, Hatazi O, Aonuma H, et al. Pulmonary tuberculoma in a patient with chronic hepatitis C:a clinical pitfall in the treatment strategy[J]. Intern Med, 2014, 53(15): 1669–1674. DOI:10.2169/internalmedicine.53.1992
[23] Miyazawa S, Matsuoka S, Hamana S, et al. Isoniazid-induced acute liver failure during preventive therapy for latent tuberculosis infection[J]. Intern Med, 2015, 54(6): 591–595. DOI:10.2169/internalmedicine.54.3669
[24] Kant S, Maurya AK, Kushwaha RA, et al. Multi-drug resistant tuberculosis:an iatrogenic problem[J]. Biosci Trends, 2010, 4(2): 48–55.
[25] Faustini A, Hall AJ, Perucci CA. Risk factors for multidrug resistant tuberculosis in Europe:a systematic review[J]. Thorax, 2006, 61(2): 158–163. DOI:10.1136/thx.2005.045963
[26] Garima K, Pathak R, Tandon R, et al. Differential expression of efflux pump genes of Mycobacterium tuberculosis in response to varied subinhibitory concentrations of antituberculosis agents[J]. Tuberculosis, 2015, 95(2): 155–161. DOI:10.1016/j.tube.2015.01.005
[27] de Rossi E, Aínsa JA, Riccardi G. Role of mycobacterial efflux transporters in drug resistance:an unresolved question[J]. FEMS Microbiol Rev, 2006, 30(1): 36–52. DOI:10.1111/j.1574-6976.2005.00002.x