中华流行病学杂志  2020, Vol. 41 Issue (4): 594-598   PDF    
http://dx.doi.org/10.3760/cma.j.cn112338-20191109-00796
中华医学会主办。
0

文章信息

阚慧, 张淼, 郑英杰.
Kan Hui, Zhang Miao, Zheng Yingjie
阴性对照法:原理、方法及应用
On 'Negative control methods': related principles, methods and applications
中华流行病学杂志, 2020, 41(4): 594-598
Chinese Journal of Epidemiology, 2020, 41(4): 594-598
http://dx.doi.org/10.3760/cma.j.cn112338-20191109-00796

文章历史

收稿日期: 2019-11-09
阴性对照法:原理、方法及应用
阚慧1 , 张淼2 , 郑英杰1,2,3     
1. 复旦大学公共卫生学院流行病学教研室, 上海 200032;
2. 国家卫生健康委员会卫生技术评估重点实验室(复旦大学), 上海 200032;
3. 复旦大学公共卫生学院公共卫生安全教育部重点实验室, 上海 200032
摘要: 阴性对照法系基于"阴性对照的实验检测结果必须阴性"的思想而建立, 是人群研究多个比较组和关联特异度的进一步扩展。阴性对照不参与待研究的因果假设, 但具有与研究假设相同的潜在偏倚结构。阴性对照法可分为阴性暴露对照法、阴性时期对照法和阴性结局对照法, 主要用于探测和控制选择偏倚、混杂偏倚和测量偏倚, 以补充样本量为辅。合理应用阴性对照法有助于提高试验法和观察法因果推断估计的准确性。
关键词: 阴性对照    结局    暴露    时期    因果关联    偏倚    
On 'Negative control methods': related principles, methods and applications
Kan Hui1 , Zhang Miao2 , Zheng Yingjie1,2,3     
1. Department of Epidemiology, School of Public Health, Fudan University, Shanghai 200032, China;
2. Key Laboratory for Health Technology Assessment, National Commission of Health and Family Planning, Fudan University, Shanghai 200032, China;
3. Key Laboratory of Public Health Safety, Ministry of Education, School of Public Health, Fudan University, Shanghai 200032, China
Abstract: Negative control methods (NCM) are developed based on the idea that negative controls should be tested with negative results. It also extends to the multiple comparison groups and used for specificity of association in population studies. Negative controls do not take part in studying the causal hypothesis but sharing the same potential bias structures. Under different purposes, NCM can be divided into methods on negative exposure, negative period or negative outcome controls. They are mainly used to detect and control bias, such as:selection bias, confounding bias and measurement bias, but leaving the sample size at secondary importance. Rational application of NCM can help improving the accuracy of causal inference in both experimental and observational processes.
Key words: Negative control    Outcome    Exposure    Period    Causal association    Bias    

实验室检测中,设置对照是必需的,一般需设置阳性对照、阴性对照和空白对照。阳性对照和阴性对照用于指示整个检测过程是否完美无误:前者检测结果必须是阳性,而后者则必须是阴性,二者结合说明检测过程正确,从而提示标本的检测结果也将是准确的;否则,将提示检测过程错误,出现假阳性、假阴性结果等。阴性对照值偏高,cut off值偏高易导致假阴性;反之,则易出现假阳性。基于“阴性对照的实验检测结果必须阴性”的思想,在进行人群研究时,通过额外设置合适的阴性对照,即形成了阴性对照法(negative control methods,NCM)。NCM是人群研究多个比较组和关联特异度两个思想的进一步扩展。本文应用因果图,对NCM的原理、方法及其应用进行介绍。

1. NCM的基本原理:人群研究中,阴性对照的定义[1]:不参与拟研究的因果假设,但具有与研究假设相同的潜在偏倚结构的人群对照。阴性对照可分为3种:阴性暴露对照、阴性时期对照和阴性结局对照(或伪终点,falsification end points)[2-3],由此对应于3种方法:阴性暴露对照法、阴性时期对照法和阴性结局对照法。研究的暴露和结局分别以变量A和Y来代表,阴性暴露、阴性时期和阴性结局分别以变量NA、NT和NY来代表(图 1)。

注:暴露A,与之对应的为阴性暴露对照-NA;结局Y,与之对应的为阴性结局对照-NY;A-Y之间在非NT的间隔时期,与之同一时期对应的为阴性时期对照-NT,虚线代表同一横截面 图 1 阴性对照设置示意图

阴性对照具备两个特点:①不参与拟研究的因果假设,这意味着NA-Y、A-Y | NT(A-Y在阴性时期NT条件下)和A-NY之间的效应为零;②相同偏倚结构,意味着NA-Y(或A-NY)与A-Y,或A-Y | NT期和非NT期之间具有相似的混杂、选择偏倚或测量偏倚的结构。实际研究中,若NA-Y、A-Y | NT和A-NY之间的关联亦为零,则该关联正确地反映了阴性对照的零效应,从而提示着整个研究过程是无偏的,由此可推断A-Y之间的关联同样是无偏的。

2. NCM的种类:

(1)阴性暴露对照法:阴性暴露对照法即阴性暴露NA和结局Y在理论上为零效应,同时设置阴性暴露(NA)和待研究暴露(A),可以检验A-Y之间的内部有效性是否受到偏倚的影响。如Surén等[4]在孕期母亲补充叶酸(A)与儿童自闭症(Y)风险的关系研究中,把其他维生素补充(不含叶酸)者作为阴性暴露对照组NA,结果NA⊥Y(⊥:表示NA与Y间相互独立),A与Y呈相关,可认为是无偏估计(图 2)。

注:“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律;虚线代表着二者间可能存在关联;Cu和Cm对A-Y和NA-Y均表现为混杂子结构 图 2 孕期母亲补充叶酸和儿童自闭症的关系研究中阴性暴露对照的设立

(2)阴性时期对照法:从暴露到结局,必须有相应的时间或时期,才能保证暴露有足够的时间导致结局产生。如不同时期研究暴露-结局间的关系,不同时期这二者之间的关联若不同,将提示着偏倚存在的可能。阴性时期对照法有助于解决这一问题[2]。如老年人群流感疫苗接种对死亡风险的影响研究中[5-6],流感流行前期或夏季作为阴性时期,因在此时期流感尚未开始流行或一般无较大规模传播,此时期给老年人接种流感疫苗,老年人发生死亡或住院风险的下降并非因接种流感疫苗而产生的效果,即A⊥Y | NT;若A-Y | NT出现关联,则提示着该关联很可能因接种人群特征不同所致的虚假关联。若在流行前期存在A⊥Y,则认为流行期的A-Y间的关联结果为无偏(图 3)。

注:“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律;虚线代表着二者间可能存在关联;Cu,Cm对A-Y表现为混杂子结构 图 3 老年人群流感疫苗与死亡风险关联研究中阴性时期对照设立

(3)阴性结局对照法:在阴性结局对照法中,设置阴性结局对照(NY),通过A-NY间是否零关联,从而判断A-Y的内部有效性是否受偏倚的影响。如肺炎球菌疫苗有效性评价中,Broome等[7]将研究人群的结局分为3组:①疫苗型感染组(或病例组Y),发生疫苗所覆盖血清型的肺炎球菌感染的患者;②非疫苗型感染组(或阴性对照组NY);③健康人群(或常规对照组)。疫苗接种与否A与非疫苗型感染的风险NY无关,即b/N1=d/N2(A⊥NY表 1图 4),而疫苗型感染的风险应不同,即c/N2≠a/N1(A→Y)。基于此,我们才可正确地推断出肺炎球菌疫苗的保护效果。因该法系Broome首次采用[7],因此又将其称为Broome法或间接队列法(表 1)。

注:“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律;虚线代表着二者间可能存在关联;Cu和Cm对A-Y及A-NY均表现为混杂子结构 图 4 肺炎球菌疫苗有效性研究中阴性结局对照的设立
表 1 间接队列法肺炎球菌疫苗效果研究人群

3.阴性对照的可能来源:阴性对照的选择主要依据先验理论知识、已发表零效应研究及时序关系等。相同的偏倚结构的获知一般较难,通常从同一时期、同一经历等获取相应变量作为阴性对照。

(1)阴性暴露对照:阴性对照暴露与拟研究的结局之间无因果关联。此时,可采用与阳性暴露在同一环境下发生,但却出现非研究暴露的其他对象,如RCT中的安慰剂组。Ruckart等[8]研究孕妇饮用化学物污染水与新生儿神经管畸形和口唇裂疾病风险的相关性,发现神经管及口唇发育在早中期已发育完成,妊娠晚期孕妇的污水暴露可作为NA。这是从时序角度进行判断的,时间在后发生的事件不可能对其以前的事件产生影响,同时性事件与此类似。因此,这两种情形下的变量可以作为阴性对照。

(2)阴性时期对照:暴露到结局需要特定时间或时期。暴露和结局都出现,若二者间关系的研究是在不同时期进行的,若不同时期这二者之间的关联不同,容易引起争议。如老年人流感疫苗效果研究中,流感流行前期的死亡或住院风险和流感疫苗的效用无关,疫苗接种与死亡或住院的风险应为零关联,可作为阴性时期对照[5]

(3)阴性结局对照:阴性对照结局也可以称为伪结局[2],该伪结局与拟研究暴露间无因果关联。如Ivers等[9]研究海地农村居民口服霍乱疫苗效果的病例对照研究中,以非霍乱性腹泻为NY

4. NCM的用途:

(1)检测和控制偏倚:流行病学的观察性设计及实验流行病学,如随机对照临床实验,均可采用NCM以探测偏倚。阴性对照在鉴别因果和非因果关联上具有重要价值,可以帮助流行病学研究进行因果关联推断,排除虚假关联或偏倚,进而得到真实的因果关联[10]

① 混杂:NCM可用来检测混杂[11]。例如老年急性心肌梗死的强化治疗是否能降低第4年死亡率研究中,用第1天死亡情况做NY,并假定第1天老年人死亡情况NY和强化治疗措施A无关联,虽然死亡可能与老年人基本健康情况等相关。研究发现,强化治疗可降低第1天死亡率,则提示该结果存在着混杂偏倚;在调整了年龄、性别、种族、地区、多种疾病状态后,强化治疗依然可降低第1天死亡率,则提示该结果仍然受到残存混杂的影响。最终分析时,该研究采用工具变量法,用患者与医院之间的距离分组,从而降低强化治疗便利性作为混杂子对研究结果的影响[12]

② 选择偏倚:合理运用NCM可以检测选择偏倚[10]。如他汀类药物、质子泵抑制剂、血管紧张素转换酶抑制剂(ACE-inhibitors,ACEi)使用与社区获得性肺炎(community acquired pneumonia,CAP)风险关系研究中[13],选择5-羟色胺再摄取抑制剂(selective serotonin reuptake inhibitors,SSRI)为NA,UY表示CAP的定义方式(社区全科医生和大型医院采用不同疾病编码体系)。结果显示NA→Y,则提示其他3种药物A与Y间的推断有偏(图 5),NA、A、Y、UY均影响入选对象,尤其UY易导致选择偏倚。

注:“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律;C外围的方框代表着选择 图 5 他汀类药物、PPI、血管紧张素转换酶抑制剂使用与社区获得性肺炎的关系研究中的选择偏倚

③ 测量偏倚:研究中通过测量获取信息不可避免,然而往往容易产生系统误差,即信息或测量偏倚。信息偏倚种类多样,其中回忆偏倚常发生在回顾性研究中。Zaadstra等[14]研究儿童期感染与多发性硬化症之间的关系,设立探测变量(probe variable)以检测回忆偏倚是否存在。与多发性硬化症无关的儿童期暴露,如手臂骨折、脑震荡和扁桃体切除术作为探测变量NA。如研究结果显示探测变量测量值NA*和Y相关,则提示着回忆偏倚的存在(图 6),UA为影响NA和A测量值(NA*,A*)的因素,UA存在导致测量偏倚。

注:“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律 图 6 儿童期感染与多发性硬化症的关联研究中的测量偏倚

(2)补充样本量:流行病学研究方法的核心是一定数量人群基础上的比较。各组间均衡可比,有助于这种比较的合理性,从而保证因果关联推断的准确性。样本量限制及其可能导致的组间不均衡,均可能使得研究结果出现偏倚。研究设计时,暴露组与非暴露组一般按公式法计算研究所需的样本量。额外设置的阴性对照可以补充样本量[11],增强研究结果外推的可信度,提高研究结果的精确度[15-16]。如在巢式病例对照研究中,选择阴性暴露对照组,暴露组和非暴露组及阴性暴露组间尽可能均衡可比,从而起到控制混杂因素如年龄、地区等[17],降低混杂对因果关联推断的影响。

5. NCM分析基础:在NCM中,A⊥NY、NA⊥Y、A⊥Y | NT本为零关联的情形在实际中出现关联,则提示研究出现偏倚。如在队列研究中,暴露(A)与阴性结局对照(NY)间无关联,而在研究结果中发现暴露组和非暴露组阴性结局出现比例不同,或计算RR≠1(有统计学意义),则A和NY间将出现统计学关联,从而提示偏倚的存在。如病例对照研究中阴性暴露对照NA和结局Y间无关联,实际研究中若结局Y-病例组和非病例组对比其阴性暴露比例在Y的两个水平上存在着差别,或计算OR≠1(有统计学意义),即NA和Y有统计学关联,同样地提示偏倚存在。A⊥Y | NT提示着零关联,但研究结果计算A暴露的不同水平中出现Y的比例若不同,即RR≠1,或Y不同水平中A出现的比例不同(或OR≠1),则提示着真正A-Y间存在偏倚。综上,NCM设置阴性对照的研究若出现虚假关联,则提示着真正因果关联结论存在偏倚,需要改进设计或分析方法。

6.局限性:阴性对照设立基于因果关联的先验知识[18-19],即不参与因果假设和相同的偏倚结构。如研究者基于错误的零因果假设而确定阴性对照,则可导致阴性对照的选择错误,最终使得因果关联的推断结果有误。因此,实际研究中单纯采用统计检验等来探测混杂及其他偏倚是否存在,来进行因果关联估计的做法,值得商榷[20-23]

NCM探测的偏倚类型,其偏倚的方向和大小一般无法明确,这需要研究者丰富的理论知识以支撑分析。如动脉导管未闭的早期筛查与极早产儿住院死亡率之间的关联研究中[24],设置NY(出院后感染)用来探测混杂因素;孟加拉国农村地区饮水污染对儿童腹泻的影响[25],设置NY(皮疹、牙痛报告)则针对测量偏倚。

此外,NCM不能提供确定的测量法来证实不存在偏倚。零效应不出现关联,并不意味着推断的因果关系无偏,可能有残存或未测量混杂因素无法控制而相互抵消的情形[1]。零效应出现关联,可能是零效应两变量间混杂子存在着效应修饰,这并不意味着真正因果关联有偏倚[26]

NCM在因果推断上具有明显的优点,如探测未测量、未知的偏倚及难以控制的混杂因素如回忆偏倚,但阴性对照的选择较难,应加强NCM在因果推断上的认识。

利益冲突  所有作者均声明不存在利益冲突

参考文献
[1]
Arnold BF, Ercumen A. Negative control outcomes:a tool to detect bias in randomized trials[J]. JAMA, 2016, 316(24): 2597-2598. DOI:10.1001/jama.2016.17700
[2]
Groenwold RHH. Falsification end points for observational studies[J]. JAMA, 2013, 309(17): 1769-1770. DOI:10.1001/jama.2013.3089
[3]
Dusetzina SB, Brookhart MA, Maciejewski ML. Control outcomes and exposures for improving internal validity of nonrandomized studies[J]. Health Serv Res, 2015, 50(5): 1432-1451. DOI:10.1111/1475-6773.12279
[4]
Surén P, Roth C, Bresnahan M, et al. Association between maternal use of folic acid supplements and risk of autism spectrum disorders in children[J]. JAMA, 2013, 309(6): 570-577. DOI:10.1001/jama.2012.155925
[5]
Jackson LA, Jackson ML, Nelson JC, et al. Evidence of bias in estimates of influenza vaccine effectiveness in seniors[J]. Int J Epidemiol, 2006, 35(2): 337-344. DOI:10.1093/ije/dyi274
[6]
Groenwold RHH, Hoes AW, Hak E. Impact of influenza vaccination on mortality risk among the elderly[J]. Eur Respir J, 2009, 34(1): 56-62. DOI:10.1183/09031936.00190008
[7]
Broome CV, Facklam RR, Fraser DW. Pneumococcal disease after pneumococcal vaccination-an alternative method to estimate the efficacy of pneumococcal vaccine[J]. N Engl J Med, 1980, 303(10): 549-552. DOI:10.1056/NEJM198009043031003
[8]
Ruckart PZ, Bove FJ, Maslia M. Evaluation of exposure to contaminated drinking water and specific birth defects and childhood cancers at Marine Corps Base Camp Lejeune, North Carolina:a case-control study[J]. Environ Health, 2013, 12: 104. DOI:10.1186/1476-069X-12-104
[9]
Ivers LC, Hilaire IJ, Teng JE, et al. Effectiveness of reactive oral cholera vaccination in rural Haiti:a case-control study and bias-indicator analysis[J]. Lancet Glob Health, 2015, 3(3): e162-168. DOI:10.1016/s2214-109x(14)70368-7
[10]
Arnold BF, Ercumen A, Benjamin-Chung J, et al. Brief report:negative controls to detect selection bias and measurement bias in epidemiologic studies[J]. Epidemiology, 2016, 27(5): 637-641. DOI:10.1097/EDE.0000000000000504
[11]
Lipsitch M, Tchetgen ET, Cohen T. Negative controls:a tool for detecting confounding and bias in observational studies[J]. Epidemiology, 2010, 21(3): 383-388. DOI:10.1097/EDE.0b013e3181d61eeb
[12]
McClellan M, McNeil BJ, Newhouse JP. Does more intensive treatment of acute myocardial infarction in the elderly reduce mortality? Analysis using instrumental variables[J]. JAMA, 1994, 272(11): 859-66. DOI:10.1001/jama.1994.03520110039026
[13]
de Groot MCH, Klungel OH, Leufkens HGM, et al. Sources of heterogeneity in case-control studies on associations between statins, ACE-inhibitors, and proton pump inhibitors and risk of pneumonia[J]. Eur J Epidemiol, 2014, 29(10): 767-775. DOI:10.1007/s10654-014-9941-0
[14]
Zaadstra BM, Chorus AM, van Buuren S, et al. Selective association of multiple sclerosis with infectious mononucleosis[J]. Mult Scler, 2008, 14(3): 307-313. DOI:10.1177/1352458507084265
[15]
Obuchowski NA. Sample size calculations in studies of test accuracy[J]. Stat Methods Med Res, 1998, 7(4): 371-392. DOI:10.1177/096228029800700405
[16]
Malone HE, Nicholl H, Coyne I. Fundamentals of estimating sample size[J]. Nurse Res, 2016, 23(5): 21-25. DOI:10.7748/nr.23.5.21.s5
[17]
Dandjinou M, Sheehy O, Bérard A. Antidepressant use during pregnancy and the risk of gestational diabetes mellitus:a nested case-control study[J]. BMJ Open, 2019, 9(9): e025908. DOI:10.1136/bmjopen-2018-025908
[18]
郑英杰, 蔡倩莹, 范伟, 等. 因果思维在效应估计若干问题中的应用[J]. 中华流行病学杂志, 2019, 40(10): 1314-1323.
Zheng YJ, Cai QY, Fan W, et al. The application of causal thinking in several issues in estimation of effects[J]. Chin J Epidemiol, 2019, 40(10): 1314-1323. DOI:10.3760/cma.j.issn.0254-6450.2019.10.026
[19]
郑英杰, 赵耐青, 何一宁. 客观世界的因果关系:基于有向无环图的结构解析[J]. 中华流行病学杂志, 2018, 39(1): 96-99.
Zheng YJ, Zhao NQ, He YN. Causality in objective world:directed acyclic graphs-based structural parsing[J]. Chin J Epidemiol, 2018, 39(1): 96-99. DOI:10.3760/cma.j.issn.0254-6450.2018.01.019
[20]
Flanders WD, Klein M, Darrow LA, et al. A method to detect residual confounding in spatial and other observational studies[J]. Epidemiology, 2011, 22(6): 823-826. DOI:10.1097/EDE.0b013e3182305dac
[21]
Flanders WD, Klein M, Darrow LA, et al. A method for detection of residual confounding in time-series and other observational studies[J]. Epidemiology, 2011, 22(6): 59-67. DOI:10.1097/EDE.0b013e3181fdcabe
[22]
Shahar E. A new criterion for confounder selection? Neither a confounder nor science[J]. J Eval Clin Pract, 2013, 19(5): 984-986. DOI:10.1111/jep.12010
[23]
VanderWeele TJ, Shpitser I. A new criterion for confounder selection[J]. Biometrics, 2011, 67(4): 1406-1413. DOI:10.1111/j.1541-0420.2011.01619.x
[24]
Rozé JC, Cambonie G, Marchand-Martin L, et al. Association between early screening for patent ductus arteriosus and in-hospital mortality among extremely preterm infants[J]. JAMA, 2015, 313(24): 2441-2448. DOI:10.1001/jama.2015.6734
[25]
Ercumen A, Naser AM, Unicomb L, et al. Effects of source-versus household contamination of tubewell water on child diarrhea in rural Bangladesh:a randomized controlled trial[J]. PLoS One, 2015, 10(3): e0121907. DOI:10.1371/journal.pone.0121907
[26]
Prasad V, Jena AB. Prespecified falsification end points:can they validate true observational associations[J]. JAMA, 2013, 309(3): 241-242. DOI:10.1001/jama.2012.96867