文章信息
- 肖毅
- Xiao Yi
- 源自右半结肠癌淋巴结清扫范围(RELARC)研究的启示
- Insights from radical extent of lymphadenectomy trial for right colon cancer (RELARC)
- 实用肿瘤杂志, 2022, 37(1): 40-44
- Journal of Practical Oncology, 2022, 37(1): 40-44
基金项目
- 首都临床特色应用研究与成果推广(Z161100000516014);中国医学科学院中央级公益性科研院所基本科研业务费临床与转化医学研究基金(2019XK32003)
-
通信作者
- 肖毅,E-mail:xiaoy@pumch.cn
-
文章历史
- 收稿日期:2022-01-10
RELARC研究是一项关于右半结肠癌根治性手术中淋巴结清扫范围的多中心随机对照研究[1],由结直肠外科医师发起,2016年1月开始入组,2019年12月入组结束,全国17家三级甲等医疗单位参与该研究。2020年初正式刊发术后并发症的初期结果,也是近年来得到业内人士广泛关注的一项胃肠外科临床研究[2]。作为外科临床医师,这项多中心随机对照研究(randomized controlled trial,RCT)的成功开展给笔者带来很多启示,现将体会转化为文字供读者分享和指正。
1 外科医师适合开展临床研究外科医师每天手术的患者是非常好的研究对象(patients);外科手术即是研究的干预手段(intervention);如果存在手术理念、手术方式或者手术器械的改进,可以按时间顺序将患者划分为对照人群(comparison)及试验人群;并发症的减少、功能的恢复和生存时间的延长都可以成为手术治疗的结局指标(outcome)。所以,外科医师以手术为干预手段的诊疗过程,并且总结诊疗结局的这个日常工作流程就非常适合临床研究的Patients、Interventions、Comparisons和Outcomes(PICO)原则。如果对这样的诊疗过程,先进行充分和良好的研究设计,如回顾性挑选数据或前瞻性收集数据以及单中心或多中心协助,然后完成数据的收集和分析,将是一个完整的临床研究过程。
2 临床研究开始前的准备工作 2.1 研究终点的确立临床研究的主要终点就是需要回答的主要临床问题,研究的设计、性质和样本量估算等重要环节将围绕主要研究终点来进行。其他附带回答的相关问题可以成为次要研究终点。
日常的临床工作可能使外科医师经常发现临床问题需要解决,但是如何将临床问题转化为科学问题,需要外科医师具备临床研究的思维和能力。RELARC研究最早的临床问题是清扫肠系膜上血管表面的中央组淋巴结时所面临的大血管损伤和出血,以及带来的严重副损伤。但是结合RELARC研究开始前的经验和文献阅读,发现血管损伤虽然可能造成严重后果,但是发生率很低,如果以此为科学问题设计临床研究,将面临庞大的入组病例;最后将肿瘤外科常用的生存获益作为RELARC研究的主要研究终点,血管损伤作为次要研究终点。
确立研究终点时还需要结合研究目的,考虑临床实用价值。肿瘤相关临床研究中以生存时间作为研究终点较为常见。如结直肠肿瘤往往以3年无瘤生存(disease free survival, DFS)或5年总生存(overall survival, OS)作为肿瘤治愈的标准,这样的生存标准就需要较长时间的随访和定期的数据收集。3年DFS随访时间短,但是需要每3~4个月的随访数据采集;5年OS虽然只关注术后5年的终末生存状况,但是延长了研究周期,而且OS有时难以回答肿瘤复发转移的相关问题。研究者也可以考虑一些替代指标,如直肠癌新辅助治疗中获得的病理完全缓解(pathological complete response,pCR),作为研究终点的优点在于研究入组结束即可获得研究终点数据,但是pCR率却不能作为生存获益的替代,所以pCR率往往用于放化疗近期效果、手术方式选择和功能保留等临床问题的评判。目前国内有两项针对高危直肠癌行全程新辅助治疗效果的研究(EXPLORE研究,ClinicalTrials.gov,NCT03038256;TNTCRT研究,ClinicalTrials.gov,NCT03177382),这两项相似的研究却选择了不同的研究终点。
所以,研究者在确立研究终点时需重点考虑所回答问题的重要性和实用性以及后续工作的可操作性。
2.2 样本量的估算研究者制定的临床研究的研究终点和研究性质(前瞻性或回顾性以及试验研究或观察研究等)是样本量估算的基础,但是统计参数的确定需要与方法学专家共同商议。样本量的大小关系到研究的规模和效能、研究经费、研究者的召集能力和完成研究的时限性等诸多问题。
对于一些创新性强的研究问题,可能没有文献数据的提示。此时应该开展单中心小样本量的前期试验,再以此为依据计算样本量,开展更大型的RCT研究。具体过程可以参照Idea, Development, Exploration, Assessment, and Long-term follow-up framework(IDEAL框架)的描述[3]。
在样本量的估算过程中切忌主观夸大目标效应值的差异,以达到减少样本量的目的。日本的一项单中心RCT研究,旨在探究肠系膜下动脉离断部位对直肠癌吻合口漏的影响。该研究在预测高位结扎和低位结扎肠系膜下血管时吻合口漏发生率时分别为15%和6%[4],仅肠系膜下动脉结扎部位的不同能导致如此差距的发生率,使人质疑其有故意降低样本量之虞。
在样本量的估算过程中应该详细、大量阅读相关文献,根据文献数据客观估算研究终点的效应值。即使将来的研究结果可能与现实出现差异,但是纵观研究的样本量估算只要客观,研究结果仍然具有实际价值。
2.3 可行性论证研究可行性的论证是一个重要环节,顶级专业人士的讨论可以帮助研究者优化研究目标和设计。参与RELARC研究论证会的专家来自中华医学会外科学分会的腔镜学组、结直肠学组、胃肠外科学组和手术学学组的组长以及影像、病理学、临床药理和生物统计方面的专家,围绕研究的终点问题、研究性质、研究设计、研究中心及研究者的遴选等问题进行了充分讨论。
2.4 研究中心的遴选中国地域辽阔,但是高质量的医疗资源和医疗中心相当集中。即使如此,各大城市和各级医院之间的诊疗水平仍然参差不齐,更罔论临床科研水平。对参与中心的遴选需要考虑入选中心的体量、临床实力以及科研水平等因素。外科医师往往注重手术技能,缺乏科研意识。针对这一特点,RELARC研究除了依据研究者的腹腔镜技术水平和手术量之外,还结合科研团队和专业科研助理等因素进行了遴选。
一项研究的遴选标准过于严格,可能降低入组速度,同时限制研究结果的推广和普及。但是盲目扩大研究中心数量,降低研究者遴选标准,虽然可以加快入组速度,但是势必降低数据质量,严重影响研究结果的可信度。因此,研究者应该综合考虑这些因素对研究实施过程的影响。
2.5 研究计划书计划书是研究实施的蓝本,经过论证会之后的研究计划书将更加详实,为下一步的研究注册做好准备。对证据级别较高的研究,强烈建议公开发表研究计划书;或者在独立的网页上展示详细的研究计划、统计方法和研究进度,内容越详细越说明研究者的认真态度。这就要求研究者在研究启动之前做到万事俱备,只等实施。
2.6 研究注册注册一项临床研究的目的在于公开和透明,是对研究过程和结果的一种监管,同时也避免开展雷同的研究项目。国际医学期刊编辑委员会(International Committee of Medical Journal Editors,ICMJE)旗下的期刊几乎都要求只发表注册研究。
“谋定而后动,先设计,后实施”是前瞻性临床研究模式的主要特点。研究者一旦注册研究和发表计划书后,不能随意改动研究方案,以免影响研究的声誉。
2.7 制定标准临床研究中的终点事件以及其他所有观察指标都应该有明确的定义和标准,这些定义可以来自指南或共识,也可来自临床经验的修改,但必须在研究计划书中有明确说明。比如关于腹部外科手术的“术中出血”这一概念,从开腹时代到现在的腔镜时代,人们对其理解都存在变化。
参与RELARC研究的各医疗中心在围手术期抗生素的使用、术前肠道准备和术后辅助治疗实施的标准及方案等方面不尽一致,这些相关概念和措施都需要在各中心之间得以平衡,并加以规范化。
研究相关的概念、措施和治疗标准的规范化,有利于研究质量的控制并消除试验组与对照组之间因基线特征不均衡而存在潜在的选择偏倚。各项标准的制定是临床研究质量控制和规范化的重要标志。
3 临床研究实施过程中的质量控制 3.1 随机化随机化是消除混杂因素、规避选择偏倚和提高研究级别的重要手段。随机化涉及随机方法、比例、分组隐匿和盲法等问题,需要与方法学专家共同协商而定。比如在区组随机和每组样本量少的时候,在完成前几例患者的随机之后,就可以猜到最后1~2例患者的分组情况,对于手术量少的中心,可能会出现外科医师以此猜测挑选手术患者的情况,导致研究的选择偏倚。
外科手术相关的临床研究很难做到双盲,但是可以很好地规划随机时间点。过早地进行随机之后,患者可能对就诊的单位、医师和手术方案存在质疑而改变选择,浪费随机号码。所以,随机时间点的把握越临近干预措施的实施,就越能规避因盲法导致的选择偏倚。
3.2 及时纠正违背方案行为有些患者随机进入对照组之后,术者却故意实施试验组的手术方式,这是一种违背方案的行为,必须得到制止。这会导致交叉治疗的现象,意向治疗(intention-to-treat,ITT)的全数据集分析是RCT研究所依赖的数据集,能最佳体现研究的随机化原则,交叉病例的出现可能改变最终数据集分析的结果。因此,这种现象应该及时得到发现和纠正。
3.3 避免中心效应多中心临床研究的目的在于研究结果的推广和普及,排除医疗单位或医师个人水平或能力导致的结果推广受限。牵头单位的积极性和患者数量等因素都可能导致患者入组量位居前列,为避免中心效应(以个别中心为主导的研究),可以适当控制入组速度,鼓励其他中心加快入组。
3.4 重视研究时效性根据临床研究终点或结局事件,研究者需要把控整体研究进度,重视研究时效性。比如比较开腹和腹腔镜胃癌手术效果的中国CLASS研究虽然起步晚于国外同类研究,但是参与中心齐心协力且入组迅速,给研究结果刊发带来巨大优势[5-6]。如果因入选标准等各种原因导致入组时间漫长,不但落后于他人,而且届时腔镜的理念已得到普及,这样的结果就不具有任何临床实用价值了。
3.5 完整收集基础数据,部分生存数据的缺失是难免的及时、全面和完整收集Electronic Data Capture System(EDC系统)数据是研究成功的基石。这些数据往往包含人类学特征、肿瘤基线特征、检验和影像等数据,这些数据能否得到完整收集是研究者工作能力和研究能力的体现。我国幅员辽阔,多中心研究患者可能分布广泛,给生存随访带来严重影响,生存数据的缺失是客观存在的。所以,研究者需要整体把握数据缺失情况和分布,一定要使主观数据齐全。
生存和随访数据收集的难易程度取决于研究终点的选择。如前所述,不同的研究终点决定了研究的时限和随访项目。以3年DFS为研究终点的临床研究需要收集每3~4个月的各种随访数据(包括检验和影像结果),患者的依从性和研究者的积极性都关系到数据的缺失问题。宁可让数据缺失情况发生在生存随访阶段,也不让其发生在EDC数据收集上。
4 研究关闭入组之后的工作重点 4.1 数据清理一项多中心的临床研究不太可能使每例入组患者都符合研究标准。如果严格按照入排标准清理数据,可能造成一些无谓的病例流失。比如许多涉及3~5年生存获益的研究中都会排除其他恶性肿瘤的同时存在,但是20年甲状腺癌和乳腺癌病史这些较好预后的癌种患者还是可以考虑留在研究之中的。少数超越入组年龄界限的患者也可以保留。
病种不同等严重违背方案的病例需要坚决剔除。通过数据清理,本研究组发现很多问题和缺陷是可以通过实施过程中的质控所消除的。
4.2 利益共享多中心临床研究体现集体的力量和水平,其结果产出也应考虑集体利益共享。主要终点和次要终点可以产生多篇文章,作者的排序、数量,(共同)第一作者和(共同)通信作者的确定应该取决于各中心对研究的贡献大小、入组病例的数量和质量以及基金的提供等。其他的利益共享还涉及科研成果、课题基金、经费和专利等,应该由主要研究者带领的相关委员会来统筹决定。
以外科医师为发起者的临床研究往往缺少研究经费,需要多中心的无私奉献和协作精神,这就需要良好的利益共享机制来维护大家的积极性。
5 结语RELARC研究是全国第一项针对结肠癌外科手术的大型多中心随机对照研究,这项研究的完成与各单位的强力支持是密不可分的。一项设计良好的临床研究必定离不开方法学专家的全程参与。尤其在早期如何将临床问题转化为科学问题、样本量的估算、生物统计方法的确立、后期的数据清理和文章的写作方面都离不开方法学专家的帮助。
研究标准的制定在于重大事件的定义以及诊疗过程的规范化,过于严格将限制各中心的入组,过于宽松又势必影响研究的质量,这需要研究者的适当把握。研究中心和研究人员临床科研水平的参差不齐会导致数据的完整性下降,出现数据缺失。
所以,研究主导者对研究流程和细节的掌控以及方法学专家的帮助是提高研究质量的关键所在。合理共享研究成果是提高研究积极性必不可少的环节。
[1] |
Lu JY, Xu L, Xue HD, et al. The radical extent of lymphadenectomy-D2 dissection versus complete mesocolic excision of laparoscopic right colectomy for right-sided colon cancer (RELARC) trial: study protocol for a randomized controlled trial[J]. Trials, 2016, 17: 582. DOI:10.1186/s13063-016-1710-9 |
[2] |
Xu L, Su X, He Z, et al. Short-term outcomes of complete mesocolic excision versus D2 dissection in patients undergoing laparoscopic colectomy for right colon cancer (RELARC): a randomised, controlled, phase 3, superiority trial[J]. Lancet Oncol, 2021, 22(3): 391-401. DOI:10.1016/S1470-2045(20)30685-9 |
[3] |
Hirst A, Philippou Y, Blazeby J, et al. No surgical innovation without evaluation: evolution and further development of the IDEAL framework and recommendations[J]. Ann Surg, 2019, 269(2): 211-220. DOI:10.1097/SLA.0000000000002794 |
[4] |
Fujii S, Ishibe A, Ota M, et al. Short-term and long-term results of a randomized study comparing high Tie and low Tie inferior mesenteric artery ligation in laparoscopic rectal anterior resection: subanalysis of the HTLT (High Tie vs. low Tie) study[J]. Surg Endosc, 2019, 33(4): 1100-1110. DOI:10.1007/s00464-018-6363-1 |
[5] |
Hu YF, Huang CM, Sun YH, et al. Morbidity and mortality of laparoscopic versus open D2 distal gastrectomy for advanced gastric cancer: a randomized controlled trial[J]. J Clin Oncol, 2016, 34(12): 1350-1357. DOI:10.1200/JCO.2015.63.7215 |
[6] |
Yu J, Huang C, Sun Y, et al. Effect of laparoscopic vs open distal gastrectomy on 3-year disease-free survival in patients with locally advanced gastric cancer: The CLASS-01 randomized clinical trial[J]. JAMA, 2019, 321(20): 1983-1992. DOI:10.1001/jama.2019.5359 |