治疗质量评价是利用可测量的指标反映医疗技术是否合理地用于患者的治疗,发现治疗过程中存在的问题,促进治疗质量的改善。目前,医院治疗质量的评价在国际上得到广泛关注[1-3],但医生治疗质量的评价研究相对较少。在医生水平上进行治疗质量评价,可以增加医护人员对治疗质量的理解和提高治疗质量评价指标的使用。本研究收集哈尔滨市四家医院内出院时间为2011年6月—2013年6月的结直肠癌患者病历信息共1 559份,利用已建立的结直肠癌治疗质量评价指标体系,计算单指标使用率及综合得分进行医生治疗质量合理有效的评价,为促进结直肠癌治疗质量的改善提供参考依据。
1 对象与方法 1.1 对象收集4家医院结直肠癌患者的病历资料,患者的出院时间为2011年6月—2013年6月,年龄≤70岁,主要诊断为原发性结直肠癌,TNM(tumor-node-metastasis)分期为Ⅰ-Ⅲ期,排除Ⅳ期患者及非该院首次治疗的患者。病例调查表内容包括结直肠癌患者一般人口学特征、入院时病情、体格检查、治疗过程、病理报告信息及治疗质量评价指标等。调查员经统一培训,根据结直肠癌病例调查表从患者病历中提取相应信息,共收集病例1 935份。本研究评价的是治疗结直肠癌的手术医生,根据文献[4-5]及本课题组的数据模拟结果显示,为保证计算的指标使用率的稳定性,每个评价指标的分母至少为30例患者,符合标准的手术医生有14名,共治疗1 559名患者。
1.2 方法 1.2.1 评价指标在已建立的结直肠癌评价指标体系[6]中选择11个与手术相关的过程指标:按照TNM系统对结直肠癌患者分期;术前对肝进行超声、CT或MRI检查;术前检查生化指标、肾功能、胸部X线;术前检查CEA(carcinoembryonic antigen)、CA199(carbohydrate antigen 199);术中探查肝、腹膜、卵巢和子宫,或记录不能探查的原因;术中发现肿瘤侵犯局部组织器官进行整块切除;中低位直肠癌手术需进行全直肠系膜切除;病理报告中记录检出淋巴结数和阳性淋巴结数;病理报告中记录至少检出12个淋巴结或检出不足12个的原因;病理报告中记录肿瘤大小及分化程度;病理报告中记录切缘状况。
1.2.2 评价方法 1.2.2.1 单指标评价在治疗质量评价中,每个指标有其特定的使用人群。使用率计算的分母是指适合使用某指标的患者数,分子是在适合的人群中真正使用该指标的患者数;计算每位医生每个指标的使用率进行单指标评价。
1.2.2.2 综合评价潜变量模型(latent variable model, LVM)源自项目反应理论,该理论认为被测试者的某种相对稳定的潜在特质(或称能力水平)支配其对项目作出正确反应的概率,两者之间的关系可以用单调递增的函数表达[7-8]。在医生结直肠癌治疗质量评价中,医生是被测试者,医生的治疗质量相当于项目反应理论的潜在特质,该特质支配评价指标的使用。通过对潜变量模型中的参数进行估计,计算每名医生的潜变量值即综合质量得分。
(1) 潜变量模型 假设每位医生有k个评价指标,每个指标的使用情况由不可观测的潜变量θh决定,医生治疗质量为潜变量效应;第h位医生第k个指标实际使用的人数Ykh服从参数为PMkh、nkh的二项分布:
|
Pkh为第h位医生第k个指标的使用概率,nkh为第h位医生第k个指标应该使用的人数。构建第h位医生第k个指标的使用概率Pkh与该医生不可观测的治疗质量θh的广义线性关系,以logit函数连接:
|
其中:θh为潜变量,反映第h为医生不可观测的治疗质量;β0k为区分度参数,其值越大,第k个指标对不同治疗质量的医生区分能力越强。β1k为难度参数,其值越大,对第个指标的使用概率越小。
(2) 参数估计 利用贝叶斯参数估计方法对模型中的参数进行估计。在贝叶斯估计中,待估计的参数θ被看作符合某种先验分布p(θ)的随机变量。获取先验分布后,通过试验获得样本,将参数的先验分布p(θ)调整为后验分布p(θ|x1, …, xn)。利用MCMC(Markov chain Monte Carlo)算法建立一条马尔科夫链对待估参数进行抽样模拟,当Markov链达到平稳分布时即为所求的后验分布,获得到待估参数的随机样本,基于这些样本对模型中的待估参数做统计推断[9-10]。
1.3 统计分析使用Epi Data 3.1软件建立数据库并进行数据录入,采用SAS 9.3和Open BUGS软件进行统计分析。
2 结果 2.1 患者的一般情况描述(表 1)| 表 1 患者基本信息和临床特征 |
1 559名患者的平均年龄为(55.4±9.2) 岁,其中有医疗保险的患者占总人数的73.1%,男性患者927人,女性患者632人,直肠癌患者为846人,结肠癌患者为695人,吸烟率和饮酒率分别为31.6%和23.9%。
2.2 单指标评价同一个评价指标的使用率在不同医生间存在较大的变异。使用率变异较大的指标有:按照TNM系统对结直肠癌患者分期(indicator 1);术前检查生化指标、肾功能、胸部X线(indicator 3);术中探查肝、腹膜、卵巢和子宫,或记录不能探查的原因(indicator 5);中低位直肠癌手术需进行全直肠系膜切除(indicator 7);病理报告中记录至少检出12个淋巴结或检出不足12个的原因(indicator 9)。其他指标使用率变异很小。术前检查生化指标、肾功能、胸部X线使用率的变异最大,其使用率的中位数为37.5%,变异范围为3.9%-97.8%;中低位直肠癌手术需进行全直肠系膜切除使用率的变异次之,其使用率的中位数为47.7%,变异范围为0.0%~83.4%;病理报告中记录检出淋巴结数和阳性淋巴结数使用率的变异最小,其使用率的中位数为99.0%,变异范围为95.9%~100.0%。
2.3 应用潜变量模型进行综合评价(表 2)| 表 2 θ后验样本的统计描述和区间估计 |
xita[1]-xita[14]为14名医生的潜变量,代表医生的治疗质量,的均值越大,说明医生的治疗质量越好。由表可以看出,第12位医生的综合质量得分最高,xita[12]=0.405 7,即该医生的治疗质量最好;第1位医生的综合质量得分次之,xita[1]=0.387 5;第3位医生的综合质量得分最低,xita[3]=-0.596 7。根据潜变量模型计算的综合质量得分,14名医生的排名顺序依次为12、1、14、8、9、2、4、13、6、11、7、5、10、3。
3 讨论治疗质量的评价是改善治疗质量的有效途径之一,治疗质量本身是一个不可直接测量的变量,将可测量的多维评价指标进行量化获得指标使用率,可以从不同角度评价治疗质量;利用综合评价方法整合多个评价指标获得综合质量得分,可以全面地对治疗质量进行综合评价。现有综合评价方法主要有:全或无法、质量得分界值法、专家赋权重法、患者平均法、指标平均法等。这些方法的共同优点是计算简单,使用方便;不足之处:全或无法根据指标的使用情况给患者赋予质量得分,若患者使用全部的适合指标,则被赋予1分,反之为0分,过于严格;评分界值的设定没有公认的标准;权重由专家主观评分获得,缺乏客观性;有些方法认为指标使用率和医生治疗质量之间呈直线关系等。潜变量模型假设指标使用率相对于医生治疗质量水平呈S型曲线,指标使用率的区间为0到1,这样的模型假设更接近实际。治疗质量较差时,指标使用率很低,曲线趋势平缓;随着治疗质量的提高,指标的使用率也逐渐增加,呈上升趋势;当指标使用率达到一定值时,曲线又趋于平缓。潜变量模型参数估计的方法有很多,MCMC贝叶斯参数估计方法的优点是充分利用待估参数的先验信息和样本信息获得后验分布,根据后验样本的置信区间进行统计推断。
本研究基于已建立的结直肠癌治疗质量评价指标,利用潜变量模型获得医生综合质量得分,其排序体现医生治疗质量的相对优劣。医院可以利用综合得分进行医生的绩效考核,治疗质量较优的医生分享临床治疗经验,治疗质量较差的医生应提高评价指标的使用率。单指标评价量化了医生治疗质量的某一方面,在综合评价的基础上单指标使用率反映医生在治疗过程中指标使用的具体情况,使用率较低的指标可为医生治疗质量的改进明确具体目标。综合质量得分较高的医生,多数指标的使用率均较高,但仍有一些指标使用率很低。本研究综合质量得分最高的医生,术前检查生化指标、肾功能、胸部X线(indicator 3) 的使用率不足20%,需要增加该指标的使用率。综上,治疗质量合理有效的评价,不但可以为医院管理服务,也可以满足患者和社会的需求,加深医护人员对治疗质量的理解,提高医生实施治疗质量评价指标的自觉性,最终达到改善治疗质量的目的。
| [1] | Chung KP, Chang YJ, Lai MS, et al. Is quality of colorectal cancer care good enough? Core measures development and its application for comparing hospitals in Taiwan[J]. BMC Health Serv Res, 2010, 10(1): 1–11. DOI:10.1186/1472-6963-10-1 |
| [2] | Elferink MA, Wouters MW, Krijnen P, et al. Disparities in quality of care for colon cancer between hospitals in the Netherlands[J]. Eur J Surg Oncol, 2010, 36(Suppl 1): S64–73. |
| [3] | van Dishoeck AM, Lingsma HF, Mackenbach JP, et al. Random variation and rankability of hospitals using outcome indicators[J]. BMJ Qual Saf, 2011, 20(10): 869–874. DOI:10.1136/bmjqs.2010.048058 |
| [4] | Rollow W, Lied TR, McGann P, et al. Assessment of the Medicare quality improvement organization program[J]. Ann Intern Med, 2006, 145(5): 342–353. DOI:10.7326/0003-4819-145-5-200609050-00134 |
| [5] | Williams SC, Koss RG, Morton DJ, et al. Performance of top-ranked heart care hospitals on evidence-based process measures[J]. Circulation, 2006, 114(6): 558–564. DOI:10.1161/CIRCULATIONAHA.105.600973 |
| [6] | 张慧敏, 包含, 付蓉, 等. 医院结直肠癌治疗质量评价指标体系的建立[J]. 中国医院统计, 2015(1): 1–4. |
| [7] | 郭庆科, 房洁. 经典测验理论与项目反应理论的对比研究[J]. 山东师大学报(自然科学版), 2000, 15(03): 25–27. |
| [8] | 李晓铭. 项目反应理论的形成与基本理论假设[J]. 心理发展与教育, 1989, 5(01): 25–31. |
| [9] | 王权. "马尔可夫链蒙特卡洛"(MCMC)方法在估计IRT模型参数中的应用[J]. 考试研究, 2006, 2(04): 47–65. |
| [10] | 涂冬波, 漆书青, 蔡艳, 等. IRT模型参数估计的新方法-MCMC算法[J]. 心理科学, 2008, 31(01): 177–180. DOI:10.3969/j.issn.1671-6981.2008.01.041 |
2017, Vol. 33


