中国卫生资源  2019, Vol. 22 Issue (3): 200-203  DOI: 10.13688/j.cnki.chr.2019.19087

引用本文  

冯旅帆, 胡敏, 陈文. 基于决策树模型的县级公立医院病例组合研究[J]. 中国卫生资源, 2019, 22(3): 200-203. DOI: 10.13688/j.cnki.chr.2019.19087
FENG L F, HU M, CHEN W. Case mix study for county-level public hospital based on decision tree model[J]. Chinese Health Resources, 2019, 22(3): 200-203. DOI: 10.13688/j.cnki.chr.2019.19087

作者简介

冯旅帆, 硕士, 主要从事卫生经济学研究, E-mail:fenglvfan@foxmail.com

通信作者

陈文, E-mail:wenchen@fudan.edu.cn

文章历史

收稿日期:2019-04-06
基于决策树模型的县级公立医院病例组合研究
冯旅帆 , 胡敏 , 陈文     
复旦大学药物经济学研究与评估中心, 复旦大学公共卫生学院, 上海 200032
摘要目的 建立县级公立医院的病例组合模型,为县级公立医院利用病例组合进行医院服务产出指标调整提供工具。方法 应用决策树分类与回归树(classification and regression trees,CART)算法,以住院费用为轴心变量和住院费用影响因素为节点变量,建立病例组合模型,并以方差减少量(reduction in variance,RIV)、变异系数(coefficientof variation,CV)和受试者工作特征曲线(receiver operating characteristic curve,ROC)进行模型检验。结果 建立433个组合。RIV值10.00%,CV平均值0.88,ROC曲线下面积基本都大于0.70,说明病例组合模型较为合理,组间差异稍弱于以往。结论 可通过纳入更多住院费用影响因素和规范临床诊疗行为进一步改善病例组合。经病例组合指数调整后的医疗服务产出指标更具有可比性。
关键词病例组合    决策树    医疗服务    评价    县级公立医院    
Case mix study for county-level public hospital based on decision tree model
FENG Lyu-fan , HU Min , CHEN Wen     
Center for Pharmacoeconomic Research and Evaluation, School of Public Health, Fudan University, Shanghai 200032, China
Abstract: Objective To establish a case mix model in county-level public hospitals for adjusting hospital service output indicators in county-level public hospitals. Methods Case mix model was established with costs as axis variable and influencing factors of costs as node variable using classification and regression tree algorithm. The reduction in variance value(RIV), coefficients of variance(CV)and receiver operating characteristic curve(ROC)were used to test the model. Results Four hundred and thirty-three case mix groups were formed. The RIV value was 10.00%, mean of CV was 0.88, and the area under the ROC curve was more than 0.70, indicating good performance of the classification model and the variance between groups was slightly smaller than before. Conclusion The case mix model can be further improved by incorporating more variables affecting costs and standardizing clinical diagnosis and treatment behavior. The indexes of medical service output adjusted by case mix index are more comparable.
Keywords: case mix    decision tree    medical service    evaluation    county-level public hospital    

病例组合是医疗管理领域重要的工具,其通过对相似社会经济与临床特征的病例进行归类分组,从而解决医院间“可比性”的问题[1]。病例组合指数(case mix index,CMI)是进一步将病例组合的信息简化为一无量纲数值,来反映医院收治病例的病情复杂程度[2]。基于病例组合和病例组合指数来提高医疗服务产出评价指标可比性的方法已经在国内外被广泛应用[3-4]。病例组合的测定需要高质量的病案首页数据,因而以往研究主要集中于发达地区。而县级公立医院由于信息系统薄弱,病案人员缺乏和临床记录不规范等问题[5],导致县级公立医院的病案首页数据质量低下。因此县级公立医院的病例组合研究还十分鲜见,县级公立医院医疗服务产出评价指标的可比性还有待提高。

自2012年始,国家开始推进县级公立医院综合改革[6],如今县级公立医院的病案首页数据得到了一定的改善[7],因此将病例组合应用于县级医院医疗服务产出比较值得探索。本文运用决策树工具基于某省县级公立医院的病案首页数据进行病例组合研究,为完善县级地区病例组合研究提供参考,并为县级公立医院利用病例组合进行医疗服务产出指标调整提供工具。

1 资料与方法 1.1 数据来源

资料来自某省18家县级公立医院提供的2015年病案首页资料,共290 010份住院病例。删去缺项、漏项及不符合逻辑的病例,筛选住院天数0~60 d[8],住院费用在1%~99%分位数之间的病例[9],得到有效病例276 380份,占全部病例的95.30%。

1.2 研究方法 1.2.1 研究变量及赋值

以住院费用为决策树的轴心变量,由于住院费用不服从正态分布(P < 0.05),以Box-Cox方法对住院费用正态化[10]。通过多重线性回归分析,以年龄、性别、有无手术、有无伴随疾病、治疗结果和疾病类别为自变量,以正态化的住院费用为应变量,筛选决策树的节点变量。

1.2.2 病例组合测定方法

① 根据国际疾病分类(International Classification of Diseases,ICD)三位编码类目结合解剖位置、病因学、临床特征和样本量等因素划分为84个疾病子集[9]。②将84个子集中数据以80%和20%的比例随机分为训练集和检验集两部分,训练集样本量为221 106份病例,检验集样本量为55 274份病例。③采用分类与回归树(classification and regression trees,CART)算法,以正态后的住院费用为轴心变量,以多重线性回归分析筛选的住院费用相关变量为节点变量。其中以最小平方误差为节点分割算法;节点例数少于100例时停止分割,分割后的叶节点最少为50例;树的最大高度为4;采用代价复杂性剪枝法进行剪枝[9]。④使用方差减少量(reduction in variance,RIV)和受试者工作特征曲线(receiver operating characteristic curve,ROC)评价组间差异性;使用变异系数(coefficient of variation,CV)评价组内一致性[11]

1.2.3 CMI

采用医院相对费率的方法计算CMI值[2]

1.3 统计学分析

采用R 3.5.1软件进行数据处理和分析。数据结果使用频数、百分比、中位数和四分位数描述。检验水准α=0.05。

2 结果 2.1 决策树节点变量筛选

变量分布及赋值见表 1,住院费用多重线性回归结果见表 2,模型R2为0.14(P < 0.05)。年龄、性别、手术、伴随疾病和出院情况都是住院费用的显著影响因素。因此根据住院费用的影响因素分析结果以及既往文献中节点变量的选择[9],选择年龄、性别、手术、伴随疾病和出院情况5个变量作为节点变量。

表 1 县级公立医院病案首页基本特征及赋值

表 2 住院费用多重线性回归分析
2.2 病例组合模型

本研究中病例组合共433个组合,见表 3。由于住院费用呈偏态分布,因而以中位数和上下四分位数对组合费用进行描述。

表 3 县级公立医院部分病例组合分类结果
2.3 病例组合模型分析结果评价 2.3.1 RIV

RIV值越大,说明组间差异性越大。检验集的RIV值为10.00%。以往多数文献中RIV值都在15%以上[9, 12],提示本文分组效果略低于以往。

2.3.2 ROC曲线

以“肺炎,病原体未特指(J18)”为例,以“未成年+无手术”的组合为基准,分别对其进行比较,结果可见表 4。曲线下面积基本都大于0.70,且差异具有统计学意义,曲线下面积在0.70~0.90时说明有一定准确性,因此子集下组合分组效果较为理想。

表 4 肺炎,病原体未特指(J18)的ROC曲线检验
2.3.3 CV检验

集中各组合住院费用的平均变异系数为0.88,其中CV值< 1的组合数为359个,占组合总数的83.10%,说明本文病例组合模型组内差异较小[8]

2.4 CMI及对住院次均费用调整

表 5中CMI值可以看出,医院1到医院8的CMI值大于1,说明其收治病例的病情严重程度高于平均水平。从CMI调整后的住院次均费用可以看出,医院3的住院次均费用是在所有医院中最高,医院15最低,多数医院的住院次均费用排名在调整后都发生了变化。

表 5 县级公立医院CMI及经其调整后的住院次均费用
3 讨论 3.1 病例组合分组效果可进一步提高,需要加强病案管理和规范诊疗行为

本研究中RIV值为10.52%,略低于以往文献报道数据。其可能的原因一是分类节点纳入较少,导致分组不彻底。以往文献中纳入的护理等级、医院感染和次要手术等影响住院费用的变量[9],由于某些医院病案首页数据中存在严重缺失或漏项的情况,在本研究中未纳入。二是可能由于医师诊疗行为不规范,如不合理检查和用药等习惯[13],导致同病情疾病的住院费用偏离度较大。因此,改善县级公立医院的病例组合模型,需要加强县级公立医院的病案管理;其次规范医生的诊疗行为,减少不合理检查和用药情况发生。

3.2 县级公立医院收治病例病情复杂程度较为相似,医疗服务能力接近

病例组合指数反映了医院整体资源消耗情况,进而反映医院收治病例的病情相对复杂程度。在本文18家县级公立医院中,病例组合指数最大值为1.044,最小值为0.900,极差仅为0.144。该结果说明县级公立医院收治病例的病情复杂程度较为相似,侧面反映各地区县级公立医院的医疗服务能力接近。

3.3 经病例组合指数调整后的医疗服务产出评价指标更具有可比性

病例组合指数可以校正收治病例病情不同对医疗服务产出评价指标的影响,进而更好衡量医院的真实产出。本研究以住院次均费用为例,排除住院病例病情严重差异对住院次均费用的影响,使次均费用评价指标更具有可比性。多数医院的次均费用排名经调整后发生了微小变动。病例组合指数还可用于如出院人次、平均住院日和死亡率等受病情差异影响的医疗服务产出评价指标。

·作者声明本文无实际或潜在的利益冲突

参考文献
[1]
简伟研, 郭岩. 以病例组合(Case-Mix)为基础进行医疗绩效评价[J]. 中国医院管理, 2008, 28(8): 15-17. DOI:10.3969/j.issn.1001-5329.2008.08.008
[2]
张音, 徐勇勇. 医院统计与医疗产出的病例组合方法(三):病例组合指数[J]. 中国医院统计, 1998, 5(4): 235-237.
[3]
王兴鹏. 医院全质量管理:理论与实践[M]. 上海: 上海交通大学出版社, 2016.
[4]
JIAN W Y, CHAN K K, TANG S N, et al. A case study of the counterpart technical support policy to improve rural health services in Beijing[J]. BMC Health Serv Res, 2012, 12(1): 482. DOI:10.1186/1472-6963-12-482
[5]
张存仁, 刘爱芳. 基层医院病案管理存在的主要问题及对策[J]. 中国医院统计, 2004, 11(2): 182. DOI:10.3969/j.issn.1006-5253.2004.02.055
[6]
国务院办公厅.国务院办公厅印发关于县级公立医院综合改革试点意见的通知[EB/OL]. (2012-06-07)[2019-03-01]. http://www.gov.cn/zwgk/2012-06/14/content_2161153.htm.
[7]
杨旭丽, 伍姗姗, 刘杰. 江西省病案管理发展情况分析[J]. 中国病案, 2017, 18(7): 8-10. DOI:10.3969/j.issn.1672-2566.2017.07.004
[8]
邓小虹. 北京DRGS系统的研究与应用[M]. 北京: 北京大学医学出版社, 2015.
[9]
靳淑雁.深圳市住院病人的病例组合研究[D].成都: 四川大学, 2007. http://cdmd.cnki.com.cn/article/cdmd-10610-2007220143.htm
[10]
SAKIA R M. The box-cox transformation technique:a review[J]. J Roy Stat Soc Ser D Stat, 1992, 41(2): 169-178.
[11]
杜剑亮, 刘骏峰, 陈倩. 常用DRGs模型的评价方法[J]. 中国病案, 2014, 15(8): 36-37. DOI:10.3969/j.issn.1672-2566.2014.08.018
[12]
张玉海.医院门诊病人病例组合方法的研究[D].西安: 第四军医大学, 2001. http://cdmd.cnki.com.cn/Article/CDMD-90026-2001004875.htm
[13]
杨小兵, 田怀谷, 崔颖, 等. 西部贫困地区县级医疗机构不合理用药分析[J]. 医学与社会, 2006, 19(3): 60-63. DOI:10.3870/j.issn.1006-5563.2006.03.023