2. 北京大学第一医院, 北京 100034
2. Peking University First Hospital, Beijing 100034, China
临床试验数据质量是评价临床试验结果的基础。在临床试验中进行科学规范的数据管理不仅是提高临床试验数据质量的必要手段,同时也为后期统计及其他工作打下良好的基础[1]。盲态审核 (blind review) 的概念来源于《临床试验生物统计学原则》 (ICH E9)[2],是指在试验结束 (最后一位受试者最后一次观察) 到揭盲之前对数据进行的核对和评估,以便最终确定统计分析计划[2, 3]。盲态审核是数据管理工作的最后一步,同时也是临床试验数据分析工作的开始,通常是由主要研究者、生物统计学家、数据管理员和申办者共同进行,在未揭盲的情况下做好统计分析的准备工作。
临床试验中的数据质量问题涉及到的范围较广,且数据管理和统计看待数据质量的角度不同: 数据管理关注的重点是数据的采集、处理直到锁定的过程中是否遵从了严格的质量管理体系,最终数据是否和原始资料保持一致; 而统计分析则相对更关注数据本身的特性,如缺失、离群值以及潜在的偏倚。而盲态审核是数据管理与统计分析的衔接环节,因而需要同时从数据管理和统计两个角度来评价试验数据的质量。
在本文中我们首先从数据管理的角度讨论了盲态审核中对数据的稽查和质量评价,然后从统计分析的角度探讨了方案违背 (protocol violation) 和/或偏离 (protocol deviation) 带来的数据质量问题以及在分析计划中对数据质量的考虑,为盲态审核中对数据质量的评价、分析和处理提供一定参考。
1 盲态审核的主要内容在临床试验中,数据采集的方式 (PDC/EDC) 不同,其盲态审核的流程会略有差别,但盲态核查的核心内容均为审阅研究数据和确定统计分析计划。以PDC为例,临床试验数据采集完成并对疑问 (query) 进行处理后,即可启动盲态审核流程。通常可以将盲态核查分为三个阶段。
1.1 启动阶段临床试验数据的最终审核,包括数据管理流程的稽查和比对、重要数据的汇总审核及外部数据的一致性比对,对数据质量进行评价; 并对方案违背和/或方案偏离情况进行总结。最终完成数据管理报告。
1.2 盲态审核会议主要包括数据管理报告和前期稽查结果的审阅,根据研究执行情况讨论统计人群划分,并根据数据情况对统计分析计划进行适当的修改。
1.3 盲态审核报告完成人群划分决议、定稿统计分析计划,并进行数据库锁定。
2 试验数据的稽查和质量评价盲态审核是衔接数据管理和统计的关键环节,其最主要的任务是保证经过数据管理后提交统计分析的数据能够达到足够的质量要求,保证研究结论的科学可靠。因此,盲态审核的首要工作是对试验数据进行稽查 (audit),以保证数据从产生到分析的所有流程中均保持一致,即数据的准确性。对试验数据的稽查一般包含三部分内容[4]。
2.1 数据管理流程及最终试验数据的稽查/比对由申办方或其委托方将数据库中的记录与CRF或其他原始资料进行比对,以确保数据的准确性。需要注意的是,在盲态审核阶段,对数据的比对不能代替数据管理过程中的质量控制,而是作为确保数据能达到统计分析要求的质量保证 (QA),因此进行数据稽查的人员应独立于数据管理团队,并按照QA的要求完成稽查的计划和报告。
对于稽查的数据量 (包括指标数和病例数),目前尚无公认的标准[5]。通常用的标准是对关键指标进行100% 的复查,与病例报告表及疑问表进行核对,发现的所有错误将被更正; 对于非关键指标随机抽样复查10% 病例的全部数据,将数据库与病例报告表及疑问表进行核对,可接受的错误率为: 数值变量不超过0.2%; 文本变量不超过0.5%。如错误率超标准,将进行100% 核对且最好对数据管理过程进行稽查。
对于采用EDC系统进行数据采集的临床试验,并不需要将eCRF的数据与数据库中的数据进行比较。因此对于EDC系统的数据稽查可以对试验的疑问管理进行核查,对疑问和稽查轨迹进行核对。
2.2 数据的汇总审核包括编制数据清单以及在不揭盲的情况下对初步的统计描述。对重要数据编制清单和汇总统计能够联合临床和统计学对数据进行初步的解读。
对数据清单的范围建议至少涵盖: 受试者的病史、诊断、生命体征等与入组/排除标准相关的数据; 与主要及次要疗效指标相关的数据,特别是主要疗效指标为有效率或生存时间等需要通过运算产生的数据时,列出清单有助于从临床角度审核疗效判定的合理性; 试验期间的合并用药、有临床意义的实验室检查结果以及不良事件等安全性数据。
对于盲态的统计描述可以考虑以下分析内容: 每个受试者的每次随访时间,可以反应受试者的试验完成情况; 定量指标的均值与中位数、标准差与极值等统计量; 定性指标的各类分布情况; 缺失数据量。
2.3 和其他数据的一致性比对其他数据是指通 过其他途径获取的数据或保存在其他系统中的数据。这部分数据与试验相关且同样来自于原始资料,因此可以将试验数据与这部分数据进行比对,确保试验数据的准确。最常见的外部数据是各中心的严重 不良事件 (SAE) 上报记录和中央随机化系统中的数据。
SAE的上报记录与CRF表中的数据在记录方式、关注内容等方面存在一定的差异。因此虽然不能保证两个数据能够完全重合,但至少应通过比对保证两个数据库能够相互印证并均有合理解释。
中央随机化系统 (IWRS/IVRS) 中记录了与受试者随机化相关的重要信息,通常包括年龄、性别以及分层因素等,因此应做到与CRF数据完全一致。
需要注意的是,SAE上报记录及中央随机化系统中记录的数据并非试验的原始记录,因此在发生不一致的情况下,应追溯原始记录,以原始记录作为修改研究数据的依据。
3 临床试验方案违背和/或偏离情况和统计分析人群划分临床试验过程中,由于有伦理学方面的考虑,无论研究者还是受试者均有可能存在方案违背和/或偏离现象的发生,根据意向性治疗 (ITT) 原则确认每个受试者所属的统计分析集是盲态审核的核心工作。一般情况下,临床试验的统计分析数据集包括全分析集 (full analysis set,FAS)、符合方案集 (per protocol set,PPS) 和安全集 (safety set,SS)。在人群划分时应尽可能地使偏倚减到最小,同时最大限度地保障检验效能 (power)。
在盲态审核时应对所有方案违背和/或偏离的严重程度逐个进行审查和评价,由临床试验的主要研究者 (PI) 判断其能否进入特定的分析集,对于没有纳入分析集的情况应阐明理由,并以文件形式(盲态核查报告) 写明[2, 3]。
除了以清单的形式进行审查外,还建议对方案违背和/或偏离的类型和原因进行分析,计算研究中方案违背和/或偏离的发生率,以衡量数据锁定后的数据质量。一方面可以通过各类方案违背和/或偏离的构成来总结临床试验整个实施过程中潜在的问题; 另一方面,还可以在此基础上对数据质量进行更深一步的评价,以分析数据质量对后期统计分析的影响。一般而言,由于方案违背和/或偏离造成的数据质量问题主要有两类。
① 影响数据完整性: 因不良事件中止、缺乏疗效或病情加重、失访或因其他原因退出、撤回知情同意等情况可能导致受试者脱落,从而造成缺失数据。在盲态审核中需要考虑分析由于脱落造成的缺失数据比例和缺失机制 (完全随机缺失MCAR、随机缺失MAR和非随机缺失MNAR),并可以进一步分析由脱落引入的偏倚的大小和方向。在盲态审核中应对中 止治疗和脱落进行区分。虽然多数研究中,中止治疗基本等同于脱落,但美国国家研究委员会 (NRC) 的一份缺失数据处理的报告中[6, 7]指出,中止治疗和脱落是两个不同的概念,对于中止治疗的受试者仍可进行访视,从而一定程度上避免缺失数据的产生。因此在盲态审核中应考虑对中止治疗的受试者数据予以利用。
② 影响疗效评价: 依从性不佳、访视超窗及违背入选/排除标准等情况有可能造成对疗效评价的偏差,导致观察值过高或过低,或增大指标的变异程度。在盲态审核阶段应考虑到这类方案违背和/或偏离的类型和比例进行分析,以判断其是否具有方向性。如果方案违背和/或偏离具有明显的方向性,则可能引入偏倚。例如大量受试者晚于访视窗进行疗效观察,则可能高估疗效。
对于方案违背和/或方案偏离的发生率目前尚无公认的标准。一项既往研究分析了2007~2010年间36项临床试验的方案偏离情况[8],发现平均每100个病例发生 (11.50 ± 6.97) 例次方案偏离,即约11.5% 的受试者发生方案偏离。表 1列出了常见方案偏离的发生率 (每百人)。
![]() |
表 1 常见方案违背/偏离的发生率及影响 |
统计分析计划内容涵盖试验中所涉及的所有统计学考虑,是方案中的统计分析部分的扩展。统计分析计划应在数据锁定和揭盲之前定稿[2, 3],因此在盲态审核中需要从统计角度对数据本身的特征和数据质量进行审核,进而对统计分析计划作出适当的调整。对于数据质量问题,在统计分析计划中应主要考虑以下几个方面。
① 缺失数据: 在统计分析计划中,应根据缺失数据量、缺失原因及缺失模式选择适当的缺失数据处理方式,并考虑其对统计分析的影响。
CFDA的指导原则[3]指出,对于完全随机缺失、随机缺失的处理有末次观测值结转 (LOCF)、基线观测值结转 (BOCF)、均值填补、回归填补、多重填补等多种不同的方法。
美国NRC的报告中[6, 8]提供了四种缺失数据的处理方法,即完整病例分析 (complete-case analysis)、单值填补法 (single imputation methods)、估计方程法 (estimating-equation methods) 及基于统计模型的方法。其中,估计方程法和基于统计模型的方法较受推崇。特别是估计方程法,能够一定程度地利用缺失数据提供的信息,其标准误和P值引入了缺失数据带 来的不确定性。另外,NRC的报告还主张针对缺失数据多进行敏感性分析以保证统计分析结果的稳健性 (robustness)。
② 对离群值的考虑: 一部分离群值有可能是数据采集和处理过程中的错误造成,一般通过数据管理过程可以得到解决; 但仍有一部分并非错误造成,而是真实的观察值。对于这种极端情况,在盲态审核中应分析极端值的数量和可能的原因,例如检测过程中的质控不佳导致测量指标的波动范围较大或测量指标本身并不服从正态分布等情况。在盲态审核阶段应对离群值的处理进行说明,对于重要指标的离群值还应考虑敏感性分析。
5 结语临床试验的盲态审核是临床试验中的一个关键节点,是数据管理工作和统计分析的衔接环节,对后续的分析工作起着至关重要的作用。在盲态审核中需要对数据管理的整个过程进行回顾,从而判断其流程和质量控制是否严密,并通过试验数据的稽查和比对保障数据的准确性。通过严格盲态审核,可以保证试验数据的准确性已经得到充分的验证,数据采集、数据处理中的各类错误均已得到修正。
另一方面,盲态审核还需要站在统计的立场上对整个试验的实施质量予以审视,即研究是否提供了科学可靠的数据来进行分析。方案偏离/违背情况的分析反映了临床研究的总体质量,通过对方案偏离/违背情况进行分析,有助于分析研究本身的局限,同时也是研究结论客观科学的必要保证。
[1] | Center of Drug Evaluation, CFDA. Technical Guidelines for Data Management in Clinical Trials (临床试验数据管理 工作技术指南) [S]. 2012.http://www.cde.org.cn/news.do? method=largeInfo&id=312673. |
[2] | International Conference on Harmonization. Guidance for Industry: E9 Statistical Principles for Clinical Trials [S]. 1998.http://www.ich.org/fileadmin/Public_Web_Site/ICH_Products/Guidelines/Efficacy/E9/Step4/E9_Guideline.pdf. |
[3] | CFDA. 2015. http://www.cde.org.cn/news.do?method=large Info&id=313477. |
[4] | Prokscha S. Practical Guide to Clinical Data Management [M]. CRC Press, 2011. |
[5] | Society for Clinical Data Management. Good Clinical Data Management Practices (GCDMP) [S]. 2007. |
[6] | Trials NRCU. The Prevention and Treatment of Missing Data in Clinical Trials [M]. Washington: National Academies Press (US), 2010. |
[7] | Little RJ, D'Agostino R, Cohen ML, et al. The prevention and treatment of missing data in clinical trials [J]. N Engl J Med, 2012, 367: 1355-1360. |
[8] | Zhu SN, Yu YP, Yan XY, et al. Protocol deviations in clinical trials of new drug application [J]. Chin J New Drugs (中国新药杂志), 2012, 21: 283−288. |