中华流行病学杂志  2021, Vol. 42 Issue (7): 1312-1317   PDF    
http://dx.doi.org/10.3760/cma.j.cn112338-20200828-01105
中华医学会主办。
0

文章信息

刘璇, 张一方, 湛永乐, 岳和欣, 桂路婷, 边峰, 王宇萍, 江宇.
Liu Xuan, Zhang Yifang, Zhan Yongle, Yue Hexin, Gui Luting, Bian Feng, Wang Yuping, Jiang Yu
AGREEⅡ在评价食管癌筛查实践指南质量中的应用
Application of AGREE Ⅱ in evaluating quality of esophageal cancer screening practice guidelines
中华流行病学杂志, 2021, 42(7): 1312-1317
Chinese Journal of Epidemiology, 2021, 42(7): 1312-1317
http://dx.doi.org/10.3760/cma.j.cn112338-20200828-01105

文章历史

收稿日期: 2020-08-28
AGREEⅡ在评价食管癌筛查实践指南质量中的应用
刘璇 , 张一方 , 湛永乐 , 岳和欣 , 桂路婷 , 边峰 , 王宇萍 , 江宇     
中国医学科学院/北京协和医学院群医学及公共卫生学院, 北京 100730
摘要: 高质量的临床实践指南对规范临床诊疗过程、提高卫生保健总体质量意义重大。指南研究和评估工具Ⅱ(AGREEⅡ)是公认的用以评估临床实践指南质量的工具之一,目前已被国内学者翻译成中文版本并广泛应用于指南制定和质量评价。本研究拟以中国食管癌筛查领域质量相对较高的临床实践指南《中国早期食管癌及癌前病变筛查专家共识意见(2019年,新乡)》为范例,对AGREEⅡ的使用进行逐条解读,以期为医疗卫生工作者更好地理解和使用该工具提供参考。
关键词: 指南研究和评估工具Ⅱ    临床实践指南    质量评价    循证决策    
Application of AGREE Ⅱ in evaluating quality of esophageal cancer screening practice guidelines
Liu Xuan , Zhang Yifang , Zhan Yongle , Yue Hexin , Gui Luting , Bian Feng , Wang Yuping , Jiang Yu     
School of Population Medicine and Public Health, Chinese Academy of Medical Sciences and Peking Union Medical College, Beijing 100730, China
Abstract: High-quality clinical practice guidelines are of great significance for standardizing the clinical diagnosis and treatment process and improving the overall quality of health care. The Appraisal of Guidelines for Research & Evaluation InstrumentⅡ (AGREEⅡ) is one of the recognized tools for the evaluation of the quality of clinical practice guidelines. It has been translated into Chinese and is widely used in guideline formulation and quality evaluation. This article intends to take the comparatively high-quality clinical practice guidelines in the field of esophageal cancer screening in China, i.e. "Expert Consensus on Early Esophageal Cancer and Precancerous Lesion Screening in China (2019, Xinxiang)" as an example, to interpret the use of AGREEⅡ item by item, which might provide a reference for medical and health workers to better understand and use the assessment tool.
Key words: Appraisal of Guidelines for Research & Evaluation InstrumentⅡ    Clinical practice guideline    Quality assessment    Evidence-based decision-making    

临床实践指南(指南)是针对特定临床情况,系统制定出帮助医患做出恰当处理的指导性意见[1-2]。指南对规范临床诊疗流程、提高卫生服务质量、保证患者生命安全具有重要价值。尽管国内外指南的数量逐年增加[3-4],但并未完全解决临床实践中的问题:同一问题往往有多个指南可供参考,但其质量良莠不齐,且各地医疗水平存在差异,让医生难以取舍。因而有必要对指南的质量进行评估。指南研究和评估工具(AGREE)于2009年进行了修订,并更名为“AGREEⅡ”[5],新版本不仅可用于评估指南开发方法是否严谨透明,还可为开发新指南提供方法学策略、明确指南报告的内容和形式。2013年谢利民和王文岳[6]发表的中译版使其得以在中国推广。本研究以中国食管癌筛查领域质量相对较高的《中国早期食管癌及癌前病变筛查专家共识意见(2019年,新乡)》为范例[7],对AGREEⅡ进行逐条解读,方便医疗卫生工作者更好地理解和使用。

一、AGREEⅡ简介

1. 内容:AGREEⅡ包括6个质量评估领域(共23个重要条目)和2个总体评估条目:每个领域都对应着指南质量评价的一个特定问题;指南全面评价包括对指南质量的全面评估,以及是否推荐在实践中使用该指南。见表 1

表 1 AGREEⅡ的领域及条目

2. 使用方法:每个领域的最终得分等于该领域中所有条目分数之和,并标准化为该领域可能的最高分数的百分比,具体评估方法见图 1

图 1 AGREEⅡ使用方法
二、AGREEⅡ解读实例

1.范围和目的:

(1)明确描述指南的总目的:

条目要求:详述指南总目的,明确对社会、患病人群及个人的潜在健康影响,并落实到具体临床问题或健康主题。

实例内容:为提高我国食管癌早诊早治水平,改善我国食管癌高发病率、高死亡率现状,探索有中国特色的食管癌筛查策略……

评分解读:虽未明确列举总目的,但在背景部分清晰描述了该指南总目的,建议给6~7分。

(2)明确描述指南涵盖的卫生问题:

条目要求:详述涉及的卫生问题,主要包括目标人群、干预/暴露、结局和卫生保健背景等。

实例内容:推荐40岁为食管癌筛查起始年龄,至75岁或预期寿命小于5年时终止筛查……合并其他食管癌高危因素……

评分解读:按循证医学中提出临床问题的“PICO”原则,该指南仅指出了目标人群(40岁以上合并上述一项危险因素者)和干预措施(食管癌筛查),建议给5~6分。

(3)明确描述指南的适用人群(患者、公众等):

条目要求:明述目标人群,包括年龄、性别、临床症状和并发症等,若有明确排除的人群,也应加以说明。

实例内容:同条目(2)。

评分解读:适用人群的描述清晰全面,建议给6~7分。

2. 参与人员:

(1)指南开发小组包括了所有相关专业的人员:

条目要求:应列出制定过程中涉及的专业人员(不包括外审人员和目标人群)的姓名、研究领域、单位、地址和在指南制定小组中的职务。

实例内容:2019年由多个相关学会组织我国消化、内镜、肿瘤等多学科专家联合……参与本共识意见制定的专家……杨××(河南省××医院)。

评分解读:仅列出了参与制定指南专家的研究领域、姓名、单位,但未具体说明专家在指南制定小组的职务等信息,建议给5~6分。

(2)收集目标人群(患者、公众等)的观点和选择意愿:

条目要求:应表明指南制定过程中考虑了患者/公众的观点:可通过问卷调查、文献综述等方法获取,或使其参与指南外审。

实例内容:研究显示卢戈液染色内镜(LCE)检查完成后……可显著减少碘液引起的食管刺激症状,提高患者舒适度和对内镜筛查的耐受性。

评分解读:部分考虑了筛查人群的观点,但表述内容较少、不易发现,也未说明意愿收集方法,建议给3~4分。

(3)明确规定指南的使用者:

条目要求:应明确其使用者,使读者判断指南是否适用于自身。

实例内容:2019年由多个相关学会组织我国消化、内镜、肿瘤等多学科……,以期确立并细化适合我国实际情况的早期食管癌筛查流程,为筛查工作提供指导和参考。

评分解读:虽未指明适用人群,但可推断出适用于食管癌高危人群和消化、内镜、肿瘤等学科的医生,建议给4~5分。

3. 严谨性:

(1)应用系统方法检索证据:

条目要求:应提供搜集证据时的检索策略,包括检索来源、时间和检索词等,检索策略应尽量全面并规避潜在偏倚。

实例内容:在前几版共识意见基础上,结合我国实际情况,制定了《中国早期食管癌及癌前病变筛查专家共识意见(2019年,新乡)》。

评分解读:仅参考前几版指南和意见,未说明是否采用循证方法,建议给1~2分。

(2)清楚描述选择证据的标准:

条目要求:应提供检索获得证据的纳入、排除标准,并描述上述标准及其使用的根据。

实例内容:无。

评分解读:未说明检索获得证据的纳排标准,建议给1分。

(3)清楚描述证据的强度和局限性:

条目要求:应明述证据强度和局限性,可用表格来比较不同的质量领域,或用正式的工具/策略(如Jadad量表、GRADE评价),或在正文中描述。

实例内容:本共识意见基于“推荐等级的评估、制定与评价(GRADE)系统”评估证据质量和推荐强度。

评分解读:质量评价标准明确,但未提及局限性,建议给5~6分。

(4)清楚描述形成推荐建议的方法:

条目要求:应描述形成推荐意见的方法和得出最终决定的方法(如投票法),以及争议之处和解决争议的方法。

实例内容:无。

评分解读:未描述建议形成的过程,给1分。

(5)形成推荐建议时考虑了对健康的益处、副作用以及危险:

条目要求:在形成推荐建议时应考虑对健康的益处、不良反应和危险等,平衡利弊后给出合适的推荐意见。

实例内容:LCE灵敏度高、并发症少、价格低廉、操作简便,因此长期以来一直是食管鳞癌及癌前病变筛查的标准方法,但该方法具有如下缺点……提高患者舒适度和对内镜筛查的耐受性。

评分解读:对LCE优缺点进行了说明,并给出合适的推荐建议,建议给5~6分。

(6)推荐建议和支持证据之间有明确的联系:

条目要求:每条推荐意见应与关键证据的描述/参考文献有明确的联系,读者能识别与每个推荐建议相关的证据。

实例内容:TNE联合窄带光成像(NBI)诊断食管癌及重度异型增生……。因此对于不能耐受普通上消化道内镜检查者,超细经鼻胃镜联合LCE或NBI可作为筛查备选方案。

评分解读:推荐建议与关键证据的描述有明确联系且附有参考文献,但并非每一条建议后都给出,建议给5~6分。

(7)指南在发布前经过外部专家评审:

条目要求:评审人员不能是指南开发小组成员,应包括临床专家、方法学专家,目标人群代表也可包括在内。

实例内容:无。

评分解读:未提及是否经过专家外审,建议给1分。

(8)提供指南更新的步骤:

条目要求:应提供指南更新步骤的明述,包括是否会被更新、更新方法、时间和周期。

实例内容:无。

评分解读:未提及是否会更新,建议给1分。

4. 清晰性:

(1)推荐建议明确、不含糊:

条目要求:应明述某一推荐意见在何种情形下对何种患者适用、有无证据支持,应包括陈述推荐、推荐意见目的、适用人群和条件。

实例内容:对于食管癌极高发地区,对于筛查目标人群推荐每5年1次内镜普查。对于其他地区,推荐对目标人群进行食管癌风险分层初筛,对高危个体每5年进行1次内镜筛查。

评分解读:明述了推荐意见、适用人群和条件,有证据支持,建议给6~7分。

(2)明确列出不同的选择或卫生问题:

条目要求:应考虑到涉及的临床筛查、预防、诊断和治疗存在的不同选择,应明述可能的选择。

实例内容:推荐上消化道白光内镜检查联合1.2%~1.5% LCE或NBI作为食管癌内镜筛查首选方法,有条件者可联合使用放大内镜。对于不能耐受普通上消化道内镜检查者,超细经鼻胃镜联合LCE或NBI可作为筛查备选方案。

评分解读:对不同人群考虑了不同筛查方案,建议给6~7分。

(3)容易识别重要的推荐建议:

条目要求:读者能容易发现最相关的推荐建议,如总结在一个方框中,或用黑体字、下划线、流程图、运算式等表示。

实例内容:详见指南原文。

评分解读:该指南采用黑体、加粗、筛查流程图且每条建议注明推荐强度,重点内容清晰易辨,建议给6~7分。

5. 应用性:

(1)指南描述了应用时的促进和阻碍因素:

条目要求:指南应用中可能存在的促进/阻碍因素影响推荐建议的实施。

实例内容:食管癌及癌前病变筛查的受重视程度进一步提高,筛查技术手段不断进步。

评分解读:受重视程度的提高,某种程度上促进指南推荐建议的实施,但未指明阻碍因素,建议给3~4分。

(2)指南提供应用推荐建议的意见和/或工具:

条目要求:应提供相关配套文件和建议,如总结文件、快速参考指南、培训工具等。

实例内容:本共识推荐的早期食管癌及癌前病变筛查流程如图 1

评分解读:提供了筛查流程图,方便快速参考,但尚无总结文件、培训工具等,建议给3~4分。

(3)指南考虑了推荐建议应用时潜在的相关资源:

条目要求:应讨论推荐意见对资源投入的潜在影响。

实例内容:40~70岁每10年1次内镜筛查和40~70岁每5年1次内镜筛查具有最高且相同的效益成本比,10年1次的筛查策略投入更低,5年1次的筛查策略带来的效益和挽救的生命年则更多。

评分解读:考虑了经济学效益,但无卫生保健预算板块,建议给4~5分。

(4)指南提供了监督和/或审计标准:

条目要求:主要推荐意见中应明确监控和审计标准,可能包括过程测试、行为测试、临床/健康结局测量。

实例内容:内镜筛查前应完善检查前准备:禁食 > 6 h,禁水 > 2 h。

评分解读:规定了内镜筛查前准备的具体要求,但部分建议未给出明确的监控和审计标准,建议给4~5分。

6. 独立性:

(1)赞助单位的观点不影响指南的内容:

条目要求:应明述:资助机构的观点/利益不会对指南的制定产生任何影响。

实例内容:无。

评分解读:未说明赞助情况及其是否会对指南制定产生影响,建议给1分。

(2)指南开发小组成员的利益冲突要记载并公布:

条目要求:应明述每位指南制定小组成员是否存在利益冲突。

实例内容:利益冲突 所有作者均声明不存在利益冲突。

评分解读:表述明确,建议给6~7分。

7. 指南全面评价:包括2个条目,首先要求用户全面考虑上述所有条目,对指南总体质量进行综合评分:该指南范围和目的描述清晰、目标人群明确、制定过程较严谨、推荐意见表述清晰,总体质量较高,但并不能满足所有的AGREEⅡ条目,如缺少系统检索策略和纳排标准、外部专家评审和指南更新过程等,建议给5~6分。其次要求用户提出是否愿意推荐使用该指南的建议:该指南质量较高且制定年份较新,暂时不需修订,因而推荐应用该指南进行食管癌筛查。

三、AGREEⅡ结果评价

AGREEⅡ分别计算6个领域的质量分值,各领域的分值独立、不能合并。这些领域分值可用来比较并帮助决定是否推荐某一指南,但该工具并未设置最小领域分值,也没有界定识别指南质量高低的领域分值界限[6]。2017年AGREE协作组在用户手册中更新了对领域得分的解释,建议用户通过确定优先领域或全面考虑各领域的标准化得分,对指南总体质量评分做出综合判断,但仍需使用者自行设立界值,具有一定主观性[8]

目前用于评价指南质量高低的方法主要包括权重法、百分位数法、综合领域法和优先领域法:

1. 权重法:AGREEⅡ的每个领域按分配到的条目数量可得到各自的权重,分别为13%、13%、35%、13%、17%、9%。针对同一问题的多篇指南,可在计算出各领域标准化得分后再乘以各领域的权重,最后求和得到一个合并值,该结果同预先设定好的界值进行比较,从而判断一篇指南的质量。

2. 百分位数法:针对同一问题的多篇指南,在分别计算出6个领域的标准化得分后,分别记录各领域得分超过P50的指南,有≥3个领域的得分超过P50的,即可认定为高质量指南。该方法也可以按照三分位数进一步划分,得到高、中、低质量的指南。

3. 优先领域法:除了可以对6个领域得分设立统一界值外(综合领域法)[9],也可以通过专家决断或共识,确定一个优先于其他领域的领域,然后基于优先领域得分来设立界值。有研究显示[10],在确定指南总体质量时,AGREEⅡ用户倾向于重点考虑严谨性和独立性。可以将严谨性设为优先领域,只要优先领域得分高于界值即可认定为高质量指南[11]

四、总结与讨论

迄今为止,全球已开发出20多个指南质量评价工具,如Cluzeau量表、美国指南标准化会议评价标准等[12]。但AGREEⅡ可用于评估国际、国家、地方等各种层级的初版和更新版指南,无论是卫生政策的制定者、卫生保健的提供者,还是指南的开发者均可使用该工具开发和评价指南,该工具已被译成多种语言版本,是目前应用最广泛、唯一使用数字评分且经过验证的国际指南质量评价工具。但该评价工具仍存在缺乏对指南内容真实性的评价、条目内容复杂、权重分配模糊、结论存在一定主观性等问题,有待进一步完善。此外,也有学者认为该工具可能不完全适合我国指南的评价,有必要开发一套中国临床实践指南质量评价工具[4, 13-15]。AGREEⅡ结果的评价方法尚未达成统一,上文提到的4种常见方法操作简单、实用性强。权重法和百分位数法仅用于比较针对同一问题的多篇指南的相对质量,但不能评价单篇指南;而综合领域法和优先领域法可用于评价单篇指南的绝对质量,是AGREE协作组推荐的评价方法。但上述方法都需要依靠使用者人为设置界值,评价的准确性与用户的专业水平和利益考量相关,具有一定主观性。而且这些评价方法的一致性也有待进一步研究。

本文首先回顾了AGREEⅡ的出现与发展,然后以中国食管癌筛查领域质量相对较高的临床实践指南《中国早期食管癌及癌前病变筛查专家共识意见(2019年,新乡)》为范例,对AGREEⅡ的使用进行逐条解读,简单介绍了AGREEⅡ结果解读的4种方法,并进一步讨论AGREEⅡ的优缺点,以期为医疗卫生工作者更好地理解和使用该工具提供参考,为开发符合我国国情的指南评价工具提供思路。

利益冲突  所有作者均声明不存在利益冲突

志谢 本研究应用了《中国早期食管癌及癌前病变筛查专家共识意见(2019年,新乡)》作为实例进行解读,使用中国中医科学院广安门医院循证实践小组的中译版AGREEⅡ,在此对实例指南的制定者及AGREEⅡ的翻译者致以最诚挚的谢意

参考文献
[1]
王小钦. 正确理解和应用临床实践指南[J]. 浙江医学, 2017, 39(6): 413-415, 420.
Wang XQ. Correct understanding and application of clinical practice guidelines[J]. Zhejiang Med J, 2017, 39(6): 413-415, 420. DOI:10.3760/cma.j.issn.0578-1426.2016.12.001
[2]
詹思延. 临床指南研究与评价工具简介[J]. 中国循证儿科杂志, 2007, 2(5): 375-377.
Zhan SY. A brief introduction of appraisal of clinical guidelines research and evaluation[J]. Chin J Evidence-Based Pediatr, 2007, 2(5): 375-377. DOI:10.3969/j.issn.1673-5501.2007.05.008
[3]
GIN. International guidelines library[EB/OL]. (2020-08-17)[2020-08-17]. https://g-i-n.net/library/international-guidelines-library.
[4]
王琪. 中国临床实践指南质量评价研究[D]. 兰州: 兰州大学, 2017.
Wang Q. The research on ouality assessment of Chinese clinical practice guidelines[D]. Lanzhou: Lanzhou University, 2017.
[5]
Brouwers MC, Kho ME, Browman GP, et al. AGREEⅡ: advancing guideline development, reporting and evaluation in health care[J]. J Clin Epidemiol, 2010, 63(12): 1308-1311. DOI:10.1016/j.jclinepi.2010.07.001
[6]
谢利民, 王文岳. 《临床指南研究与评价系统Ⅱ》简介[J]. 中西医结合学报, 2012, 10(2): 160-165.
Xie LM, Wang WY. A brief introduction to Appraisal of Guidelines for Research and EvaluationⅡ[J]. J Chin Integr Med, 2012, 10(2): 160-165. DOI:10.3736/jcim20120206
[7]
国家消化内镜专业质控中心, 国家消化系统疾病临床医学研究中心(上海), 国家消化道早癌防治中心联盟, 等. 中国早期食管癌及癌前病变筛查专家共识意见(2019年, 新乡)[J]. 中华健康管理学杂志, 2019, 13(6): 465-473.
National Quality Control Center of Digestive Endoscopy, National Clinical Research Center for Digestive Diseases (Shanghai), National Early Gastrointestinal-Cancer Prevention & Treatment Center Alliance (GECA), et al. China experts consensus on the protocol of early esophageal cancer and pre-cancerous lesion screening (2019, Xinxiang)[J]. Chin J Health Manag, 2019, 13(6): 465-473. DOI:10.3760/cma.j.issn.1674-0815.2019.06.001
[8]
AGREE. Interpreting Domain Score Guidance[EB/OL]. (2020-08-17)[2020-08-17]. https://www.agreetrust.org/resource-centre/agreeⅡ/agree-Ⅱ-translations/.
[9]
邢鹏, 张娜, 梁辉, 等. 基于AGREEⅡ对男性不育症指南的质量评价[J]. 生殖医学杂志, 2020, 29(3): 363-368.
Xing P, Zhang N, Liang H, et al. Quality assessment of male infertility guidelines based on Appraisal of Guidelines for Research and EvaluationⅡ[J]. J Reprod Med, 2020, 29(3): 363-368. DOI:10.3969/j.issn.1004-3845.2020.03.015
[10]
Hoffmann-Eßer W, Siering U, Neugebauer EAM, et al. Guideline appraisal with AGREEⅡ: online survey of the potential influence of AGREEⅡitems on overall assessment of guideline quality and recommendation for use[J]. BMC Health Serv Res, 2018, 18: 143. DOI:10.1186/s12913-018-2954-8
[11]
胡志强, 漆婷婷, 蒋倩, 等. 采用AGREEⅡ评价抗肿瘤药物心脏毒性预防用药指南[J]. 药物流行病学杂志, 2020, 29(4): 268-275.
Hu ZQ, Qi TT, Jiang Q, et al. Appraisal of guidelines on drug prevention for cardiotoxicity of cancer therapy with the AGREEⅡtool[J]. Chin J Pharmacoepidemiol, 2020, 29(4): 268-275.
[12]
袁帅, 李亚斐. 临床实践指南的制定方法和评价原则[J]. 中华乳腺病杂志: 电子版, 2014, 8(4): 283-287.
Yuan S, Li YF. Methods and evaluation principles for the Development of clinical Practice Guidelines[J]. Chin J Breast Dis: Electr Ed, 2014, 8(4): 283-287. DOI:10.3877/cma.j.issn.1674-0807.2014.04.012
[13]
刘道践, 陈俊国, 李源, 等. 一个中国化医学临床指南评价工具的研发[J]. 中国医学装备, 2012, 9(9): 11-14.
Liu DJ, Chen JG, Li Y, et al. Development of an appraisal tool for clinical guidelines in China[J]. China Med Equip, 2012, 9(9): 11-14. DOI:10.3969/j.issn.1672-8270.2012.09.006
[14]
吴凡, 华炜, 赵婉秋, 等. AGREEⅡ在评价口腔临床实践指南质量中的应用[J]. 湖北医药学院学报, 2014, 33(3): 225-229, 234.
Wu F, Hua W, Zhao WQ, et al. Using AGREEⅡto evaluate the quality of clinical practice guidelines in stomatology[J]. J Hubei Univ Med, 2014, 33(3): 225-229, 234. DOI:10.13819/j.issn.1006-9674.2014.03.007
[15]
韦当, 王聪尧, 肖晓娟, 等. 指南研究与评价(AGREEⅡ)工具实例解读[J]. 中国循证儿科杂志, 2013, 8(4): 316-319.
Wei D, Wang CY, Xiao XJ, et al. Guidelines research and evaluation (somethingⅡ) tool instance interpretation[J]. Chin J Evidence-Based Pediatr, 2013, 8(4): 316-319. DOI:10.3969/j.issn.1673-5501.2013.04.017