文章信息
- 吕晓珍, 孙凤, 詹思延.
- Lyu Xiaozhen, Sun Feng, Zhan Siyan.
- 偏倚风险评估系列:(四)整群设计随机对照试验
- Risk related to bias assessment: (4) Revised Cochrane Risk of Bias Tool for cluster-randomized control trials (RoB2.0)
- 中华流行病学杂志, 2018, 39(2): 240-244
- Chinese Journal of Epidemiology, 2018, 39(2): 240-244
- http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2018.02.020
-
文章历史
收稿日期: 2017-07-12
2. 100191 北京大学公共卫生学院流行病与卫生统计学系
2. Department of Epidemiology and Biostatistics, School of Public Health, Peking University, Beijing 100191, China
整群设计随机对照试验(cluster-randomized control trials,CRCT)与平行随机对照试验的主要区别是随机分组的单位是群组而不是个体。群组的形式主要包括两种:①由多个个体组成的学校、村庄、医疗机构或家庭等;②由个体的多个身体部位(如双眼或多个牙齿)或单个个体被重复观察的数据组成。RoB2.0仅关注以①为群组形式的CRCT。
整群设计的一个主要影响是群内个体往往有相似性,数据不是相互独立的。然而,既往的很多CRCT研究却采用了同以个体为随机分组单位的统计方法,这种分析单位与分组单位不同的情况通常被称为“分析单位错误”,这会导致假阳性的结论。在Meta分析中,忽略群组效应的研究有较窄的置信区间和较高的权重,但其主要引起精度问题而不是偏倚。因此,RoB2.0没有关注是否考虑了群组因素进行恰当的分析。
CRCT与平行随机对照试验的一个重要区别是群内的个体可能不直接被随机分组,尤其是有些研究的研究对象是在群组被随机分组后才开始招募(或根据入组标准被选入分析),这有可能会引起因知道群组的干预分配而影响研究对象的招募或分析。这种因知道群组的干预分配而引起不同干预组群组内研究对象特征不同的选择性偏倚通常称为识别或招募偏倚(identification/recruitment bias)。RoB2.0为CRCT额外增加了该领域的信号问题以强调该偏倚。CRCT与平行随机对照试验的另一个重要区别是CRCT通常不直接识别谁是研究对象,RoB2.0中的研究对象指研究者试图对其进行结局评估的人群,当研究数据来自不同个体的多个时间点时,那些被纳入结局分析的所有数据提供者均是研究对象。
二、工具解读整群随机对照试验RoB2.0从6个领域评估偏倚风险,分别为:①随机分组过程中的偏倚;②识别/招募偏倚;③偏离既定干预的偏倚;④结局测量的偏倚;⑤结局数据缺失的偏倚;⑥结果选择性报告的偏倚。除了“②识别/招募偏倚”为CRCT独有外,其他偏倚评估与平行随机对照试验基本相似,但又有其特别之处:①多数采用最小化法进行随机分组,随机分组过程导致的偏倚较平行随机对照试验少;②多数采用实用性研究设计,干预具有多面复杂性,主要关注依从分配的干预效果,常常无法对研究参与人员设盲;③可能出现整群数据缺失;④在研究对象不知道他们是试验的一部分时,患者自报结局的偏倚风险较小。
1.信号问题解读:对6个领域的信号问题进行解读,尤其是CRCT独有的部分,与平行随机对照试验相同的部分请参考本系列讲座(二)[1]。
(1)随机分组过程中的偏倚:CRCT中,随机实施过程产生的偏倚与平行随机照研究相似,只是在群组水平上。同RoB2.0指南文件一样[2],恰当的分组程序需要精心设计。与平行随机对照试验相比,最小化法在CRCT中用的更多,主要是因为当群组数较少时,最小化法能使群组特征在不同研究组间达到较好平衡[3]。当最小化包含随机成分时,最小化引起偏倚的风险等同于随机化。
CRCT中,随机过程可以是对群组进行序贯随机、分批随机或一次性完成。本文给出序贯随机和分批随机进行恰当分组隐匿的例子。若试验是一次性完成所有群组的随机分组,实施分组隐匿将不成问题。
在IRIS试验中[4],研究者采用含随机成分的最小化对每位全科医生进行了序贯随机分组,研究者将某全科医生的具体情况(包括最小化因素)寄给负责分组的工作人员,该工作人员利用计算机辅助的最小化程序对该医生进行分组,然后将分组情况寄给研究者,研究者和该医生沟通分组情况。该研究每次仅对一名全科医生进行随机分组,几乎不可能出现分组颠倒(故意篡改分组导致群组在研究结束时所在分组同随机所分配组别不同)。
在糖尿病指南试验中[5],群组通过最小随机化法被分批分组。执行最小化法的工作人员将一些群组特征作为最小化因素的基础,这些特征即每个群所有研究对象的评估整合组成的主要连续性变量。即使最小化是分批次进行的,这些特征的特异性避免了分组颠倒的发生。
与平行随机对照试验相比,CRCT中由随机化过程产生的偏倚较少,主要原因是很难知道干预如何对群组起作用[6];同时,在很多CRCT中,有机会导致分组颠倒的主要是方法学家,而他们通常不会这样做。
对于CRCT,通过基线不均衡判断随机化过程是否存在问题、是否存在分组颠倒要更加困难。对CRCT来讲,在理想情况下,这些判断应基于群组的数量或特征(群组的大小、群组的工作人员构成或地理位置或整个群组人群的特征)及分组或配对因素(若这些方法被使用)。然而,由于群组数量较少,这导致CRCT出现组间不均衡的可能性较平行随机对照试验更大,根据不均衡判断随机化过程是否有问题通常不太可行。只要这些不均衡是随机误差引起的,Meta分析就没必要排除组间极端不平衡的研究。
(2)识别/招募偏倚:当研究对象是在群组被随机分组后识别和/或招募的,由于知道了群组的分组会对所招募或识别研究对象的类型产生影响,从而引起识别/招募偏倚。表 1总结了CRCT中群组随机化和研究对象识别/招募的几种可能顺序。在情形1~3中,尽管研究者可通过试验设计方法避免[7],识别/招募偏倚还是有可能产生,以下举例说明这3种情形可能存在的识别/招募偏倚。
情形1:研究对象是在群组随机化分组后识别和招募的:知道群组分组结果的工作人员通过访问群或一次急性事件(如急性哮喘发作)后招募研究对象,和/或潜在研究对象在签署知情同意书前知道了群组的分组情况。
若负责招募的工作人员知道了群组的分组情况,就会有意识或无意识地影响该群中研究对象的例数和类型。在糖尿病诊断后照护的试验中[8],研究对象是2型糖尿病新发患者,两组医生必须在为患者诊断后才能将其纳入试验。干预组的全科医生接受了治疗2型糖尿病新方法的培训,可能因此期望他们的表现与对照组有差异。最后,尽管两组的群组数相似,但干预组纳入了142名患者,而对照组仅入组了108名。若研究对象在被招募前知道了群组的分组情况,也会引起偏倚,研究对象更倾向于加入自己感兴趣的分组。
情形2:不直接招募研究对象,结局评估可能来自日常工作数据,但研究对象是在群组随机后被研究者识别的,研究者因知道群组分组情况会影响他们对研究对象的选择。例如,在一项评估膳食策略对ICU病房极严重患者效果的研究中[9],干预组的工作人员在识别研究对象之前开发了指南,而对照组没有。这将不同程度影响两组中研究对象的识别,虽然在发表文献中没有找到证据支持该观点。
情形3:在群组随机之前,识别潜在的研究对象(例如从门诊清单中),但是实际的研究对象是在随机后招募的,在该阶段,由于负责招募的工作人员或潜在的研究对象知道了群组的分组情况,会影响该群组所招募研究对象的数量和类型。
虽然识别/招募偏倚仅可能出现在以上3种情形中,但既往研究显示该偏倚并不罕见[6, 10-12],而且精心设计试验是可以避免的。Diaz-Ordaz等[12]研究发现多数试验由于报告信息缺乏无法判断是否存在识别/招募偏倚。当判断因随机分组前知道群组分组情况带来的问题时,考察基线不均衡可能比较有用。
(3)偏离既定干预的偏倚:CRCT中干预通常是多层面的,并且多数情况下不包含药物,可以认为此处的“干预”是由多个不同的干预组成,可能是针对研究对象(如血液检查、自我管理课程)或医务工作者(如对照护某方面的反馈、教育课程或计算机辅助工具)或群组(医院病房的新地板、候诊区的海报或视频文件)或医疗辅助人员(如联络护士或健康倡导者)。多数CRCT的干预是针对医务工作者和/或整个群组。CRCT中干预的多面复杂性导致偏离既定干预偏倚有其特殊性。在考虑偏倚来源之前,准确了解既定的干预非常重要。①对照的作用:除了干预的多层面特征,多数CRCT采用实用性设计,目的是评估干预是否在实际条件下起作用。因此,为了对比多个干预措施的实际效果,研究者常常采用整群设计。OPEAR试验即是一个例子[13],研究者想了解增加整个护理院入住者的体力活动能否减少抑郁。干预措施为对护理院的工作人员进行抑郁相关知识培训,理疗师开设锻炼课程、评估和反馈入住者的活动情况,并执行干预,以增加整个护理院的日常活动。由于很多CRCT中干预的复杂多面性,通常不易界定一个严格依从方案的人群,CRCT中研究者仅关注所分配干预的效果,考虑依从方案和依从干预的效果是不常见的。例如,OPERA试验中,所有同意数据收集的研究对象即进行ITT分析的人群[13]。当干预包含多个层面,干预对象同时包括护理院入住者和工作人员时,如何界定严格依从方案人群或依从方案效果比较困难。当试验中的干预相对简单时,依从方案效果可能是人们较关注的,依从方案人群也可能易界定,但实际上识别依从方案人群和/或方案偏离可能比较困难。以一项评估医院病房新安装地板减少伤害性摔倒发生的试验为例,该试验的群组是病房,假设新安装地板能使医务工作者放松警惕从而增加引起患者摔倒的机会,若既定干预是新地板和日常工作,医务工作者松懈的态度将是偏离预期结果的重要因素。在干预组,依从方案人群可以被界定为:若没有新地板,还是会被医务工作者和之前一样对待患者,但从实践角度,很难识别这个人群。因此,CRCT RoB 2.0中没有设置依从方案效果的信号问题。②盲法的作用:在一些整群随机对照中,研究对象可能不知道他们正参与一项试验,例如不直接招募研究对象的试验(如IRIS试验[4])或研究者在招募阶段告知研究对象正参与一项研究但不是试验(研究者在随机分组后招募研究对象时为了减少识别/招募偏倚会采用该方法)。若研究对象不知道正参与一项试验,即使知道干预内容,也不会有意转至另一组或超过日常实践地偏离既定干预。与平行随机对照试验相比,CRCT通常有更多或更多层面的工作人员参与。当以医务工作者和/或群组为对象进行多层面干预时,避免知道正接受的干预通常是不可能或不合适的。
(4)结局数据缺失的偏倚:结局数据缺失应同时从群组和个体水平考虑。在很多情况下,一些研究对象的结局数据缺失,但偶尔也会出现整群数据缺失。用于评估平行随机对照试验结局数据缺失引起的偏倚也适用于CRCT。一项系统综述研究显示多数CRCT存在数据缺失,但很少报道缺失情况,分析时也没有恰当处理[14]。因此,考察是否存在数据缺失的偏倚,应考虑缺失数据的数量、缺失的原因以及分析时对缺失数据处理的方式等方面。
(5)结局测量的偏倚:CRCT在结局评估阶段的偏倚与平行随机对照试验相似。关键问题是确定谁是结局评估者、结局评估是否有可能因知道了干预而受影响。在平行随机对照试验中,客观测量指标如死亡或痊愈引起的偏倚更少,这种情况在CRCT中也适用。然而,在CRCT中,当研究对象不知道他们是试验的一部分时,即使研究对象知道他们接受的干预,因为不知道可能接受的其他干预,研究对象自报结局可能不会引起同平行随机对照试验一样的偏倚。
(6)结果选择性报告的偏倚:同平行随机对照试验。
2.各领域整体评估标准:与平行随机对照试验类似,在完成某一领域的所有信号问题的评估后,评估者需要根据所有问题的回答情况对相应领域的整体偏倚风险按照相应判断流程作出“low risk”、“high risk”或“some concerns”的评估。不同的是,CRCT RoB2.0最后没有对“整体偏倚”这一领域作出综合评价。
3.评估相关基本信息的添加:与平行设计RoB2.0基本类似,需要强调的是,研究者很难判断CRCT依从方案或依从干预的效果,通常报告的是依从分配的效果。
三、实例分析以2015年1月发表在柳叶刀精神病学杂志上的一项CRCT为例说明RoB2.0的应用[15]。该研究采用单盲、CRCT设计,将40家精神康复机构随机分为2组,其中20家的工作人员接受培训干预,另20家不接受,主要结局指标是干预实施12个月时两组康复机构中住院患者的活动参与情况。结果显示,干预组患者活动参与情况与对照组相比差异无统计学意义。本研究除公开发表试验结果外,还在Current Controlled Trials进行了注册(ISRCTN25898179),并提前发表了研究计划书,这些资料都可以用于RoB2.0偏倚评估。与平行随机对照试验相比,CRCT RoB2.0主要在识别/招募偏倚领域和偏离既定干预领域进行了调整,对2个领域进行偏倚评估和解读,见表 2。
讨论CRCT RoB2.0结合CRCT的特点,在平行设计RoB2.0的基础上做了调整,主要是新增了识别/招募偏倚评估,在随机分组过程中的偏倚、偏离既定干预的偏倚、结局数据缺失的偏倚和结局测量的偏倚评估领域结合CRCT固有的特点做了部分调整和新的解读,结果选择性报告的偏倚的评估完全同平行设计RoB2.0。与平行设计和交叉设计类似,CRCT偏倚风险评估的可靠性依赖于研究报告的质量和规范性。CRCT的报告规范未对识别/招募研究对象与群组随机分组的先后顺序进行相应报告的规定[16],这在一定程度上为正确判断识别/招募偏倚带来了困难,除非研究者详细报告了研究过程。这也提示,与其他研究设计一样,报告规范的更新和偏倚评估工具的改进是一个相互支持和相互促进的过程,CRCT相关研究团队间的合作对提高CRCT原始研究和系统综述的质量至关重要。
该评估工具仍然处于完善阶段,如尚未考虑阶梯CRCT分析时未调整长期趋势引起的偏倚、忽视分析单位错误引起的偏倚,而且各领域整体风险判断程序的自动化方面还处于初步开发中。截至本文投稿时,RoB2.0工具尚未在正式刊物上发表,也未正式纳入Cochrane手册,但该版本已为研究者评估原始研究的质量方面提供了有力的参考,也提示CRCT原始研究者尽可能在设计、实施及数据分析阶段减少偏倚的发生,对易引起研究偏倚的部分进行科学报告。
利益冲突: 无
[1] |
杨智荣, 孙凤, 詹思延. 偏倚风险评估系列:(二)平行设计随机对照试验偏倚评估工具2.0介绍[J]. 中华流行病学杂志, 2017, 38(9): 1285–1291.
Yang ZR, Sun F, Zhan SY. Risk on bias assessment:(2) Revised Cochrane risk of bias tool for individually randomized, parallel group trials (RoB2.0)[J]. Chin J Epidemiol, 2017, 38(9): 1285–1291. DOI:10.3760/j.issn.0254-6450.2017.09.028 |
[2] | Higgins JP, Savović J, Page MJ, et al. A revised tool for assessing risk of bias in randomized trials[C]//Chandler J, McKenzie J, Boutron I, et al. Cochrane methods. Cochrane Database Syst Rev, 2016, 10 Suppl 1: 29-31. |
[3] | Scott NW, McPherson GC, Ramsay CR, et al. The method of minimization for allocation to clinical trials. a review[J]. Control Clin Trials, 2002, 23(6): 662–674. DOI:10.1016/S0197-2456(02)00242-8 |
[4] | Feder G, Davies RA, Baird K, et al. Identification and Referral to Improve Safety (IRIS) of women experiencing domestic violence with a primary care training and support programme:a cluster randomised controlled trial[J]. Lancet, 2011, 378(9805): 1788–1795. DOI:10.1016/S0140-6736(11)61179-3 |
[5] | Sturt JA, Whitlock S, Fox C, et al. Effects of the Diabetes Manual 1:1 structured education in primary care[J]. Diabet Med, 2008, 25(6): 722–731. DOI:10.1111/j.1464-5491.2008.02451.x |
[6] | Eldridge S, Ashby D, Bennett C, et al. Internal and external validity of cluster randomised trials:systematic review of recent trials[J]. BMJ, 2008, 336(7649): 876–880. DOI:10.1136/bmj.39517.495764.25 |
[7] | Eldridge S, Kerry S, Torgerson DJ. Bias in identifying and recruiting participants in cluster randomised trials:what can be done?[J]. BMJ, 2009, 339: b4006. DOI:10.1136/bmj.b4006 |
[8] | Kinmonth AL, Woodcock A, Griffin S, et al. Randomised controlled trial of patient centred care of diabetes in general practice:impact on current wellbeing and future disease risk[J]. BMJ, 1998, 317(7167): 1202–1208. DOI:10.1136/bmj.317.7167.1202 |
[9] | Doig GS, Simpson F, Finfer S, et al. Effect of evidence-based feeding guidelines on mortality of critically ill adults:a cluster randomized controlled trial[J]. JAMA, 2008, 300(23): 2731–2741. DOI:10.1001/jama.2008.826 |
[10] | Puffer S, Torgerson D, Watson J. Evidence for risk of bias in cluster randomised trials:review of recent trials published in three general medical journals[J]. BMJ, 2003, 327(7418): 785–789. DOI:10.1136/bmj.327.7418.785 |
[11] | Froud R, Eldridge S, Diaz Ordaz K, et al. Quality of cluster randomized controlled trials in oral health:a systematic review of reports published between 2005 and 2009[J]. Community Dent Oral Epidemiol, 2012, 40(Suppl 1): 3–14. DOI:10.1111/j.1600-0528.2011.00660.x |
[12] | Diaz-Ordaz K, Froud R, Sheehan B, et al. A systematic review of cluster randomised trials in residential facilities for older people suggests how to improve quality[J]. BMC Med Res Methodol, 2013, 13(1): 127. DOI:10.1186/1471-2288-13-127 |
[13] | Underwood M, Lamb SE, Eldridge S, et al. Exercise for depression in care home residents:a randomised controlled trial with cost-effectiveness analysis (OPERA)[J]. Health Technol Assess, 2013, 17(18): 1–281. DOI:10.3310/hta17180 |
[14] | Diaz-Ordaz K, Kenward MG, Cohen A, et al. Are missing data adequately handled in cluster randomised trials? A systematic review and guidelines[J]. Clin Trials, 2014, 11(5): 590–600. DOI:10.1177/1740774514537136 |
[15] | Killaspy H, Marston L, Green N, et al. Clinical effectiveness of a staff training intervention in mental health inpatient rehabilitation units designed to increase patients' engagement in activities (the Rehabilitation Effectiveness for Activities for Life[REAL] study):single-blind, cluster-randomised controlled trial[J]. Lancet Psychiatry, 2015, 2(1): 38–48. DOI:10.1016/S2215-0366(14)00050-9 |
[16] |
王波, 詹思延. 如何撰写高质量的流行病学研究论文第五讲整群随机对照试验的报告规范——CONSORT扩展声明[J]. 中华流行病学杂志, 2007, 28(2): 199–202.
Wang B, Zhan SY. How to write high quality epidemiological papers Lecture 5:CONSORT extension for cluster-randomized control trials[J]. Chin J Epidemiol, 2007, 28(2): 199–202. DOI:10.3760/j.issn:0254-6450.2007.02.024 |