文章信息
- 黄丽红, 陈峰.
- Huang Lihong, Chen Feng
- 基于阴性对照理论的未测量混杂因素控制方法
- Statistical methods of unmeasured confounder control based on negative control theory
- 中华流行病学杂志, 2023, 44(7): 1133-1138
- Chinese Journal of Epidemiology, 2023, 44(7): 1133-1138
- http://dx.doi.org/10.3760/cma.j.cn112338-20221212-01063
-
文章历史
收稿日期: 2022-12-12
2. 南京医科大学公共卫生学院生物统计学系, 南京 211166
2. Department of Biostatistics, School of Public Health, Nanjing Medical University, Nanjing 211166, China
因果推断是临床医学研究的方法之一。1974年,Rubin[1]正式提出潜在结局框架,该框架指出每个个体存在两种潜在结果,即接受干预的结果(yi1)和不接受干预的结果(yi0),个人因果效应(individual causal effect)定义:yi1-yi0。由于临床研究中同一个个体不可能同时接受两种不同的处理,这种因果效应是“反事实的”,在现实中并不存在。通常,临床研究中的因果效应为平均因果效应,即研究人群接受干预的平均潜在结果与不接受干预时的平均潜在结果的差值。在满足可交换性、一致性/明确的干预和正定性(positivity)的前提下,才能获得平均因果效应[2-3]。其中满足可交换性最具挑战,即研究中不存在混杂因素的影响。
在干预性研究中,混杂因素与干预因素和研究结局皆关联,但不是干预-结局的因果关系通路上的中间变量,该因素的存在将歪曲(夸大或缩小)干预因素与结局的真实关联[4]。混杂因素分为已知且已测量混杂和未知或未测量混杂,其中已知但未测量的混杂因素可能是设计上的局限性,而未知混杂因素往往是研究者对混杂因素认识的局限性导致,但都属于未测量一类。
控制混杂因素最为理想的方法是在研究设计阶段进行控制,如采用随机化分组技术,并在研究过程中维持随机化的完整性,可以有效平衡组间各类混杂因素。基于反事实的一致性假设,此时试验组的受试者如果接受对照组的治疗,可以得到与当前对照组一致的结果,反之亦然。因此,对照组的观察结果是试验组受试者接受对照组治疗潜在结果的无偏估计,从而得到平均处理效应的无偏估计值,这是随机对照试验可进行因果推断的理论基础。然而,非随机对照研究中,混杂因素的控制极具挑战,尤其是未测量混杂因素。
有比较才有鉴别,对照是临床研究设计的重要原则之一。在基础实验研究中,需设置阳性对照、阴性对照或空白对照。作为参照标准,阳性对照检测结果必须是阳性,阴性对照则必须是阴性,否则提示整个检测过程有偏。此时的对照并非用于比较,而是校准。受其启发,基于“阴性对照的检测结果必须阴性”的思想,在进行人群研究时,额外设置合适的阴性对照,就形成了阴性对照法[5]。2010年,Lipsitch等[6]提出阴性暴露对照(NCE)和阴性结局对照(NCO)的定义。NCO也称伪对照,其结局与拟研究暴露因素不存在因果关联;NCE的暴露与拟研究的结局无因果关联。2013年Groenwold[7]提出阴性时期对照,即不同时期研究暴露-研究结局的关联出现不同,将提示偏倚存在的可能。从阴性对照法的基本原理可知,阴性对照法是将关联特异度的思想融入了人群研究中,是将对照用于鉴别比较的进一步扩展。
本文从统计学角度就阴性对照理论如何进行未测量混杂因素的统计分析进行阐述,并结合代表性案例对其合理应用进行讨论和总结。
一、阴性对照法如何检测和控制未测量混杂因素阴性对照法用于检测是否存在未测量混杂因素U需满足可比性假设,即:
![](PIC/zhlxbxzz-44-7-1133-FE1.jpg)
式中,W为NCO,U为未测量混杂因素,X为已测量混杂因素,A为研究暴露因素,Z为NCE。影响研究暴露-研究结局的混杂因素结构(U|X, U|A,X)同样影响W或Z。即假设阴性对照中的混杂与研究暴露-研究结局中的混杂是相同的。
研究者常借助有向无环图展示不同变量在因果结构中的关系,阴性对照法的有向无环图见图 1。A-W或Z-Y间如出现效应则因受到未测量混杂因素影响,反之如A-W或Z-Y间呈现零效应则说明无未测量混杂因素。U常常无法获得,A-W或Z-Y间的效应间接反映了U的影响,因此NCO或NCE也被称为未测量混杂因素的替代变量[8-9]。
![]() |
图 1 阴性对照法有向无环示意图 |
以NCO为例,在线性模型中说明阴性对照对未测量混杂因素识别及控制的理论过程。
假设暴露因素A的理论效应为βYA,则在有混杂U的情形下:
![](PIC/zhlxbxzz-44-7-1133-FE2.jpg)
进而得到:
![](PIC/zhlxbxzz-44-7-1133-FE3.jpg)
![](PIC/zhlxbxzz-44-7-1133-FE4.jpg)
U常常未知,受到未测量混杂U的影响,所得暴露因素A的效应估计为βYA+βYU βUA,其中βYU βUA为未测量混杂偏倚的效应。在NCO模型E[W|A]中,由于A与W实际并不存在因果关联,βWU βUA为混杂偏倚的效应。如果NCO设置正确,则βWU=βYU,理论上βWU βUA即为未测量混杂偏倚βYU βUA的估计值。
二、基于阴性对照理论的控制未测量混杂因素的衍生方法近年来,阴性对照法不断衍生,不仅可检测是否存在未测量混杂因素,还可进一步应用于控制未测量混杂因素。具有代表性的4种方法:死亡率标准化校正法、校正P值法、广义双重差分模型(DiD)和双向阴性对照法。
1. 死亡率标准化校正法:利用NCO进行死亡率的标准化校正由Richardson等[10]提出。死亡率是最常用的远期疗效指标,但极易受到未测量混杂因素的影响,死亡率标准化校正法利用NCO对死亡率进行校正。
![](PIC/zhlxbxzz-44-7-1133-FE5.jpg)
式中,I1为观察到的研究人群在研究暴露因素A作用下的死亡率,I0为研究人群未暴露于A时的潜在死亡率,exp(α)为因果效应。事实上,我们无法观察到I0,可用外部获得的(例如文献报道)未暴露于A的潜在死亡率IR替代,exp(δ)为其带来的偏倚。随后,进一步应用NCO对该偏倚进行估计和校正。
![](PIC/zhlxbxzz-44-7-1133-FE6.jpg)
式中,J1代表观察到的暴露因素A作用下NCO的发生率,J0代表其潜在发生率,NCO的实际因果效应J1/J0=1。无法观察到的J0用基于外部信息获得的JR替代,由此带来的偏倚为exp(ε),即为外部信息替代带来的偏倚。通过NCO的发生率J1/JR进行死亡率的校正,获得的死亡率为标准化死亡率(aSMR)。如果exp(ε)=exp(δ),即阴性对照选择合适,借助NCO获得外部信息替代带来的未测量混杂偏倚,此时所得aSMR即为因果效应exp(α)的估计值。死亡率标准化校正法的优势在于易于理解,可推广用于二分类结局指标。
但是,死亡率标准化校正法需要获得潜在结局的外部信息,NCO的效应估计也可能受到未测量混杂因素的影响,且仅适用于二分类结局指标。
2. 校正P值法:Schuemie等[11]、Madigan等[12]、Jacob等[13]陆续就该方法进行了研究和讨论,该方法基于阴性对照的零效应特征,利用阴性对照效应构建经验零分布,用于估计校正P值及其可信区间[14]。该方法考虑了阴性对照法效应估计的抽样误差,拓展了阴性对照法的应用。Schuemie等[11]同时提出图示的方法可视化展现校准效果,并开发了该方法的R包EmpiricalCalibration,以便推广应用。校正P值法可明显降低假阳性结论的风险,从而提高结果的稳健性[15]。
校正P值法采用正态分布进行经验零分布的估计未能考虑复杂模型,例如混合正态分布、非参数密度估计等。
3. 广义DiD:可用于未测量混杂因素的控制。Sofer等[16]将该方法与阴性对照思想相结合,提出将暴露前结局Y(0)作为NCO即可用于未测量混杂因素的检测和校正。通常DiD法要求暴露前后的结局测量基于相同尺度,Sofer等[16]提出可应用于不同尺度的广义DiD法,进一步提高其应用价值。见图 2。需注意,广义DiD不可校正时依性混杂因素;NCO中的W与其未测量混杂因素U1、研究结局Y与其未测量混杂因素U0须呈单调关系。
![]() |
图 2 双重差分模型与阴性结局对照有向无环示意图 |
4. 双向阴性对照法:Miao等[17]提出双向阴性对照设计,即同时应用NCO和NCE进行混杂因素的识别或校正,进而获得因果效应的估计值,如采用非参数模型可不受观察数据分布的严格限制(图 3)。与设置单个阴性对照不同之处在于,双向阴性对照法假设未测量混杂因素同时影响暴露因素(A)和NCE(Z),即:E(U)=βU0+βUAA+βUZZ。NCO(W)为未测量混杂因素U的替代指标:E(W)=βW0+βWUU=(βW0+βWU βU0)+βWU βUAA+βWU βUZZ。将NCO的效应估计值
![]() |
图 3 双向阴性对照法示意图 |
1. 阴性对照在人群研究中的应用:阴性对照理论基础源自实验研究,逐步应用于人群研究中。近年来该方法开始应用于时间序列研究[20-21]、生存资料[9]、变异位点筛选[22]等。
基于孕期父亲的暴露与婴儿结局没有直接关联,但与孕期母亲的暴露存在相同混杂因素的假设,在评价母亲孕期暴露因素与婴儿疾病的关联性研究中,常用孕期父亲的暴露因素作为NCE。例如在研究孕妇吸烟与婴儿猝死综合征的风险关系、孕妇吸烟对后代身高或BMI的影响、孕妇吸烟对后代哮喘的影响时,均将父亲吸烟作为NCE[23-24]。
NCO的选择相对多样,例如:在评价流感疫苗是否能降低因肺炎/流感的住院或死亡时,可用流感季之前或之后的其他结局作为NCO[25];在评价吸烟是否易引发肺癌导致的死亡时,可用其他原因的死亡作为NCO[26]。
也有研究同时设置NCO和NCE,例如评价乳腺癌筛查是否能降低乳腺癌死亡率的研究中,将参与牙科保健作为NCE,将死于其他癌症、外部原因的死亡作为NCO[27]。
设置阴性对照首先可帮助识别未测量混杂因素的影响,识别后可将阴性对照效应值作为未测量混杂因素的替代估计值加以校正。因此,阴性对照的选择十分关键。通常,基于既往文献报告和专家意见可能得到一系列备选的阴性对照,此时需结合统计学检验判定其是否满足U-可比性等假设进行筛选。当满足上述要求的阴性对照有多个时,有学者设定其中一个为主要分析,其他作为敏感性分析,综合考察结论的稳健性[28]。
2. 阴性对照衍生方法案例分析:阴性对照理论的衍生方法大多较为新颖,处于应用推广的初步阶段。其中校正P值法近年来备受关注,双向阴性对照法的应用也初现成果。这里分别对校正P值法和双向阴性对照法进行案例分析。
(1)校正P值法:Lane等[29]利用来自英国、德国和美国的10个数据源的医保数据和电子病例数据,评价短期(30 d)或长期服用羟化氯喹(HCQ)对类风湿病患者发生抑郁、自杀倾向和精神疾病的风险,对照组为服用柳氮磺胺吡啶(SSZ)的患者。该研究共纳入918 144名服用HCQ的类风湿病患者和290 383名服用SSZ的类风湿病患者,每位患者的服药信息和结局信息均经过观察性医疗结局合作专家的审阅,所关注的3个终点指标(抑郁、自杀倾向、精神疾病)均按照年龄、性别和年份进行发生率的估计。针对已测量混杂因素,该研究采用倾向性评分分层的方法进行控制,并采用Meta分析汇总各数据源的结果。针对未测量混杂因素,根据既往文献和临床认知,该研究设置了一系列的NCO进行评价,并采用校正P值法进行阴性对照结局的效应估计。研究结果表明,HCQ药物对类风湿病患者发生抑郁、自杀倾向、精神疾病HR值(95%CI)分别为0.96(0.79~1.16),0.94(0.49~1.77)和1.03(0.66~1.60);长期服用HCQ药物的HR值(95%CI)分别为0.94(0.71~1.26),0.77(0.56~1.07)和0.99(0.72~1.35)。研究结果显示,几乎所有NCO的HR值为1.00,研究结论受未测量混杂因素的影响风险较小。
(2)双向阴性对照法:在Liu等[30]评价短期暴露于PM2.5、O3和NO2与非意外全因死亡的因果关系的研究中,采用了双向阴性对照法进行潜在未测量混杂因素的控制。该研究死亡数据来自美国的7个州。死亡发生后的空气污染不会导致死亡,但潜在的时依性未测量混杂因素同样会影响死亡后的空气污染情况,因此该研究将死亡后的空气污染暴露情况定义为NCE。研究同时采用非酒精性死亡性肝病作为NCO。
研究采用两步法获得因果效应估计值。第一步:假设未测量混杂因素同时影响NCE和研究暴露,将NCE和研究暴露同时纳入NCO模型,获得NCO的效应值,第二步:假设未测量混杂因素对研究结局和NCO的影响相同,第一步获得的NCO的效应值可作为未测量混杂因素的估计值,将其作为协变量纳入研究结局效应估计模型中,最终获得校正未测量混杂偏倚后的因果效应估计。校正了气温、绝对湿度等因素后,非意外全因死亡率的相对提高与PM2.5的浓度提高的关联有统计学意义,与NO2及O3的浓度提高的关联无统计学意义。采用双向阴性对照法校正未测量混杂因素后,仅PM2.5的结论不变,提示PM2.5与非意外全因死亡的关联稳健。
四、讨论阴性对照法的理论基础源自实验研究,实际应用于人群研究时有诸多注意事项。
1. 判定“阴性对照”的真实性:无论应对哪类偏倚,选择恰当的阴性对照至关重要。Shi等[31]提出确定阴性对照用于未测量混杂因素检测或控制的三大假设:独立于研究结局(或暴露因素);满足可比性(即阴性对照与主研究因素具有共同的混杂结构);阴性对照的统计效能足够大(当NCO罕见,NCE与未测量混杂因素弱相关时,需要更大样本量)。然而,前两条假设的验证并非易事。
实际应用时,建议从专业上多选几个NCE和/或NCO,以说明结果的可靠性和稳健性。
2. 确定偏倚的因果结构:在随机对照试验中,随机化后影响结局评价的伴发事件时常发生,甚至超出预期;在观察性疗效比较研究中偏倚情形更为复杂,尤其基于电子病例数据库的回顾性研究,偏倚可能是高维的,对暴露或结局的影响可能并非线性,且可能存在交互作用。阴性对照用于未测量混杂因素的检测需基于清晰的因果关系结构。
3. 量化偏倚的影响:基于阴性对照理论进行未测量混杂因素检测和控制的方法不断发展,已衍生出系列新方法。死亡率标准化校正法、校正P值法,广义DiD法均可量化未测量混杂因素的影响,但需满足特定的假设,例如单调性、正态分布等,双向阴性对照法则需构建恰当的混杂桥接函数。
综上所述,阴性对照具备识别、校正和控制未测量混杂因素的理论基础,且日渐成熟。统计学者已开始将阴性对照理论结合到未测量混杂因素的控制方法中,提出了不少新颖方法,只要合理应用,就能发挥价值。随着人们对医疗大数据认识的不断深入、统计计算理论的飞速发展,深入探索阴性对照理论,充分利用其理论精髓,不仅能够优化现有方法,还能衍生出具有实际应用价值的新方法。阴性对照是识别、校正和控制未测量混杂因素的一类统计设计思想和方法,是基于现实世界数据开展实效比较研究不可多得的利器。
利益冲突 所有作者声明无利益冲突
作者贡献声明 黄丽红:论文撰写、统计图绘制、案例解析、经费支持;陈峰:论文审阅
[1] |
Rubin DB. Estimating causal effects of treatments in randomized and nonrandomized studies[J]. J Educ Psychol, 1974, 66(5): 688-701. |
[2] |
Hernán MA, Robins JM. Causal inference: what if[M]. Boca Raton: Chapman & Hall/CRC, 2020.
|
[3] |
Pearl J, Glymour M, Jewell NP. Causal Inference in Statistics: A Primer[M]. Chichester: Wiley, 2016.
|
[4] |
黄丽红, 魏永越, 陈峰. 如何控制观察性疗效比较研究中的混杂因素: (二)未知或未测量混杂因素的统计学分析方法[J]. 中华流行病学杂志, 2019, 40(11): 1450-1455. DOI:10.3760/cma.j.issn.0254-6450.2019.11.020 Huang LH, Wei YY, Chen F. Confounder adjustment in observational comparative effectiveness researches: (2)statistical adjustment approaches for unmeasured confounders[J]. Chin J Epidemiol, 2019, 40(11): 1450-1455. DOI:10.3760/cma.j.issn.0254-6450.2019.11.020 |
[5] |
阚慧, 张淼, 郑英杰. 阴性对照法: 原理、方法及应用[J]. 中华流行病学杂志, 2020, 41(4): 594-598. DOI:10.3760/cma.j.cn112338-20191109-00796 Kan H, Zhang M, Zheng YJ. On 'Negative control methods': related principles, methods and applications[J]. Chin J Epidemiol, 2020, 41(4): 594-598. DOI:10.3760/cma.j.cn112338-20191109-00796 |
[6] |
Lipsitch M, Tchetgen ET, Cohen T. Negative controls: a tool for detecting confounding and bias in observational studies[J]. Epidemiology, 2010, 21(3): 383-388. DOI:10.1097/EDE.0b013e3181d61eeb |
[7] |
Groenwold RHH. Falsification end points for observational studies[J]. JAMA, 2013, 309(17): 1769-1771. DOI:10.1001/jama.2013.3089 |
[8] |
Miao W, Geng Z, Tchetgen Tchetgen EJ. Identifying causal effects with proxy variables of an unmeasured confounder[J]. Biometrika, 2018, 105(4): 987-993. DOI:10.1093/biomet/asy038 |
[9] |
de Luna X, Fowler P, Johansson P. Proxy variables and nonparametric identification of causal effects[J]. Econ Lett, 2017, 150: 152-154. DOI:10.1016/j.econlet.2016.11.018 |
[10] |
Richardson DB, Laurier D, Schubauer-Berigan MK, et al. Assessment and indirect adjustment for confounding by smoking in cohort studies using relative hazards models[J]. Am J Epidemiol, 2014, 180(9): 933-940. DOI:10.1093/aje/kwu211 |
[11] |
Schuemie MJ, Ryan PB, Dumouchel W, et al. Interpreting observational studies: why empirical calibration is needed to correct p-values[J]. Stat Med, 2014, 33(2): 209-218. DOI:10.1002/sim.5925 |
[12] |
Madigan D, Stang PE, Berlin JA, et al. A systematic statistical approach to evaluating evidence from observational studies[J]. Annu Rev Stat Appl, 2014, 1: 11-39. DOI:10.1146/annurev-statistics-022513-115645 |
[13] |
Jacob L, Gagnon-Bartsch JA, Speed TP. Correcting gene expression data when neither the unwanted variation nor the factor of interest are observed[J]. Biostatistics, 2016, 17(1): 16-28. DOI:10.1093/biostatistics/kxv026 |
[14] |
Schuemie MJ, Hripcsak G, Ryan PB, et al. Empirical confidence interval calibration for population-level effect estimation studies in observational healthcare data[J]. Proc Natl Acad Sci USA, 2018, 115(11): 2571-2577. DOI:10.1073/pnas.1708282114 |
[15] |
Schuemie MJ, Hripcsak G, Ryan PB, et al. Robust empirical calibration of p-values using observational data[J]. Stat Med, 2016, 35(22): 3883-3888. DOI:10.1002/sim.6977 |
[16] |
Sofer T, Richardson DB, Colicino E, et al. On negative outcome control of unobserved confounding as a generalization of difference-in-differences[J]. Stat Sci, 2016, 31(3): 348-361. DOI:10.1214/16-STS558 |
[17] |
Miao W, Tchetgen Tchetgen E. Invited commentary: bias attenuation and identification of causal effects with multiple negative controls[J]. Am J Epidemiol, 2017, 185(10): 950-953. DOI:10.1093/aje/kwx012 |
[18] |
Shi X, Miao W, Nelson JC, et al. Multiply robust causal inference with double-negative control adjustment for categorical unmeasured confounding[J]. J R Stat Soc Series B Stat Methodol, 2020, 82(2): 521-540. DOI:10.1111/rssb.12361 |
[19] |
Miao W, Shi X, Tchetgen Tchetgen E. A confounding bridge approach for double negative control inference on causal effects[J]. arXiv: 1808.04945, 2018. DOI:10.48550/arXiv.1808.04945 |
[20] |
Flanders WD, Strickland MJ, Klein M. A new method for partial correction of residual confounding in time-series and other observational studies[J]. Am J Epidemiol, 2017, 185(10): 941-949. DOI:10.1093/aje/kwx013 |
[21] |
Yu YY, Li HK, Sun XR, et al. Identification and estimation of causal effects using a negative-control exposure in time-series studies with applications to environmental epidemiology[J]. Am J Epidemiol, 2021, 190(3): 468-476. DOI:10.1093/aje/kwaa172 |
[22] |
Howe LD, Matijasevich A, Tilling K, et al. Maternal smoking during pregnancy and offspring trajectories of height and adiposity: comparing maternal and paternal associations[J]. Int J Epidemiol, 2012, 41(3): 722-732. DOI:10.1093/ije/dys025 |
[23] |
Brew BK, Gong T, Williams DM, et al. Using fathers as a negative control exposure to test the developmental origins of health and disease hypothesis: a case study on maternal distress and offspring asthma using Swedish register data[J]. Scand J Public Health, 2017, 45(17_Suppl): 36-40. DOI:10.1177/1403494817702324 |
[24] |
Mitchell EA, Ford RPK, Stewart AW, et al. Smoking and the sudden infant death syndrome[J]. Pediatrics, 1993, 91(5): 893-896. DOI:10.1542/peds.91.5.893 |
[25] |
Jackson LA, Jackson ML, Nelson JC, et al. Evidence of bias in estimates of influenza vaccine effectiveness in seniors[J]. Int J Epidemiol, 2006, 35(2): 337-344. DOI:10.1093/ije/dyi274 |
[26] |
Hammond EC, Horn D. The relationship between human smoking habits and death rates: a follow-up study of 187, 766 men[J]. J Am Med Assoc, 1954, 155(15): 1316-1328. DOI:10.1001/jama.1954.03690330020006 |
[27] |
Lousdal ML, Lash TL, Flanders WD, et al. Negative controls to detect uncontrolled confounding in observational studies of mammographic screening comparing participants and non-participants[J]. Int J Epidemiol, 2020, 49(3): 1032-1042. DOI:10.1093/ije/dyaa029 |
[28] |
i KQ, Shi X, Miao W, et al. Double negative control inference in test-negative design studies of vaccine effectiveness[J]. arXiv: 2203.12509, 2022. DOI:10.48550/arXiv.2203.12509 |
[29] |
Lane JCE, Weaver J, Kostka K, et al. Risk of depression, suicide and psychosis with hydroxychloroquine treatment for rheumatoid arthritis: a multinational network cohort study[J]. Rheumatology, 2021, 60(7): 3222-3234. DOI:10.1093/rheumatology/keaa771 |
[30] |
Liu RA, Wei YG, Qiu XY, et al. Short term exposure to air pollution and mortality in the US: a double negative control analysis[J]. Environ Health, 2022, 21(1): 81. DOI:10.1186/S12940-022-00886-4 |
[31] |
Shi X, Miao W, Tchetgen ET. A selective review of negative control methods in epidemiology[J]. Curr Epidemiol Rep, 2020, 7(4): 190-202. DOI:10.1007/s40471-020-00243-4 |