2. 上海交通大学医学院附属瑞金医院, 上海 200025;
3. 复旦大学计算机科学技术学院, 上海 200041;
4. 复旦大学软件学院, 上海 200082
随着我国医疗保险(以下简称“医保”)覆盖面的扩大和保障水平的提高,违规骗保、过度诊疗、资源浪费等问题愈演愈烈,致使基金增长速度过快。与此同时,根据国家进一步促进社会办医持续健康规范发展的要求,医保将面临越来越多的社会办医纳保的局面,更加大了医保基金的风险和监管压力。
近20年来,国内外有大量学者[1-5]将数据挖掘、机器学习等应用于医保费用监管、住院费用分析以及骗保行为甄别等。现在国内主流的医保控费模式主要有3种,基于规则集的智能控费模式、药品福利管理(pharmacy benefit management, PBM)第三方控费和疾病诊断相关分组(drug-related group, DRG)组合控费,3种方式各有优势,但也存在着规则不完备、第三方盈利点不透明、付费服务项目不够精细的问题。现聚焦专科护理院(卫生机构类别代码A710)进行研究。目前上海市有超过40家专科护理院,但对相关住院费用的合理性判别以及监管始终缺少有效的手段。存在传统建模、机器建模、审核监管等各方面问题。
现拟构建住院费用合理性判别模型,设计可良性循环的住院费用监管信息系统,探索一套完整的住院费用监管辅助工具,为人工智能技术在医保控费监管中的实际应用打下基础,为医保控费管理者提供费用合理性判别的可行路径与可用工具。
1 研究思路 1.1 针对传统建模的问题对于传统建模专家难以给出标准的问题,采取机器学习的方式对专家的经验进行挖掘归纳,结合信息系统的构建,形成相关监管标准的动态完善;针对传统建模可持续性的问题,将机器学习模型结合可循环的信息管理系统,不断更新数据标签,达到可持续地完善模型、系统的目的。
1.2 针对机器建模的问题针对机器建模人力成本高的问题,采用基于梯度下降算法逻辑的抽样,采用主动学习算法甄别较难分类的高价值标注数据,进行重点标记,从而通过较少成本提升算法的效果;针对机器建模可解释性差的问题,采用机器学习中可解释性较强的决策树模型,有效反馈特征重要程度、机器决策路径关键信息。
1.3 针对审核监管的问题针对现有审核监管标准中“一刀切”的问题,将患者基本信息与费用信息悉数囊括,综合考虑有效数据特征,以数据驱动的方式结合专家经验与机器效率,更准确地判断相关住院费用数据的合理性。
主要研究思路:(1)确认数据来源,经过前期的准备工作,清洗出研究所需相关数据。(2)从全市邀请从医5年及以上的临床医生,参与大型的线上专家咨询。对抽样的病案数据进行第一轮合理性判断,并利用病案特征构建初步模型。所有具备相关资质的医生会基于自身经验,在阅读完整病案信息的情况下判断费用量与费用结构的合理性。每条数据会由3位专家进行判断,判别一致的数据用于建模,以保证标签与模型的准确性。(3)将原始数据投入第一轮构建的模型中,得出机器的判断,并将机器的判断给医生们进行第二轮验证,验证模型的可靠性。第二轮验证过程中,每条数据会由6位专家进行判断。由于数据正负类别比例较高,采取少数服从多数原则确定验证结果。同时将其中多种分类器判断不一的数据以第一轮的原则进行主动学习的反馈,给医生重新标记投入模型。(4)系统设计该模型,已构成模型判别-医院解释-医保评判-数据反馈的完整系统,形成良性反馈,用以后续提高模型的准确性。
2 资料与方法 2.1 资料来源详见《中国卫生资源》2021年第5期《反向传播的多层前馈神经网络和多元回归对合理住院费用预测效能的比较》[6]。该文聚焦脑梗死后遗症;本文聚焦护理院病案首页数据量最高的5种疾病,包括脑梗死后遗症、冠状动脉粥样硬化性心脏病、高血压3级、肺部感染和脑梗死。
2.2 特征降维 2.2.1 专家咨询邀请从医5年及以上的临床医生,对研究可行性进行咨询。同时,专家对病案首页所含特征进行重要程度排序,以此聚焦关键特征。排序顺序由综合得分决定,综合得分=(Σ频数×权值)/本题填写人次。
2.2.2 主成分分析(principal component analysis, PCA)降维借助PCA算法,衡量特征上所带的信息量,在减少特征数量的同时,又保留大部分有效信息,逐渐创造出能够代表原特征矩阵大部分信息、特征更少的新特征矩阵。在降维中,PCA使用的信息量衡量指标,就是样本方差,又称可解释性方差,方差越大,特征所带的信息量越多。
该方法中,以维度降低后需要保留的特征数量作为横轴,以新特征矩阵所捕捉的可解释方差贡献率为纵轴,对累计可解释方差贡献率曲线进行可视化参考,初步确定病案首页中需要纳入研究的具体特征和特征数量。
2.3 数据预处理详见《中国卫生资源》2021年第5期《反向传播的多层前馈神经网络和多元回归对合理住院费用预测效能的比较》[6]一文。
2.4 建模方法 2.4.1 抽样与标记详见《中国卫生资源》2021年第5期《反向传播的多层前馈神经网络和多元回归对合理住院费用预测效能的比较》[6]。
2.4.2 决策树模型的建立采用C 5.0决策树算法进行建模,该算法采用节点二分法,追求信息增益最大化。当选择某个特征作为节点时,就希望这个特征的信息熵趋近于0(即概率趋近于1),此时不确定性最小。模型标签由“费用量合理性”和“费用构成合理性”两方面决定,两者同时合理时,标签视作合理,其余情况视作不合理。
2.4.3 主动学习反馈主动学习是指通过一定的算法找到未进行类别标注的样本数据中最有标记价值的数据,交由专家进行人工标注后,将标注数据及其类别标签纳入训练集中迭代优化分类模型,改进模型的处理效果。主动学习的模型为A=(C,Q,S,L,U),其中,C为机器学习模型,Q为查询函数,S为专家组,L为标记样本集,U为未标记样本集。
研究中,C为经第一轮标记结果构建的决策树模型;Q为经第一轮标记的数据分别训练5个算法不同的分类器,如果某条样本被5个分类器按2∶3的比例给出了不同的预测,则将这个样本视为有重标价值;S为参与标记的医生群体;L为经第一轮标记过的数据集;U为未经第一轮标记过的数据集。
2.5 系统设计基于上述研究的方法学进行系统设计,供医保决策者使用。模型对费用数据合理性给出判断,医保对聚类后的不合理数据进行二次判断,医院对二次判断仍不合理数据进行解释,专家对解释进行核查。若解释可接受,则对数据标签进行更新,并重新投入模型中,以达到不断完善数据及模型的目的。
系统设计见图 1。
![]() |
注:“医保”为“医疗保险”。 图 1 系统设计 |
对华东某市专科护理院进行实证研究,共抽样18 697个病案首页数据进行专家合理性判断,有效回收15 488个,有效回收率82.8%。在医生判别结果中,费用量不合理4 330个,费用构成不合理3 727个。量、构成不合理取交集3 542个、取并集4 515个。考虑疾病组合后,每种分类数据量过少,因而对于护理院采取按主疾病分类建模的方式进行研究。护理院病案首页数据量最高的5种主疾病的模型准确率、假阳性率、特征重要程度排序情况见表 1。其中:脑梗死后遗症2 352个病例,不合理609个,合理1 743个;冠状动脉粥样硬化性心脏病831个病例,不合理203个,合理628个;高血压3级532个病例,不合理81个,合理451个;肺部感染449个病例,不合理151个,合理298个;脑梗死434个病例,不合理119个,合理315个。
表 1 模型效果 |
![]() |
确认模型的关键效能指标,重点聚焦准确率和假阳性率2个指标。其中,准确率是指在机器学习划分的测试集中,专家与机器的判别一致率;假阳性是指某条病案被机器判断为不合理,而医生判断为合理。
通过将前期专家咨询过程中对病案首页特征重要程度的排序,与机器学习模型反馈的特征重要程度的排序进行对比,获得有用的病案首页完善方向。以主疾病为脑梗死后遗症的情况为例,应用决策树对住院费用影响因素重要性进行分析。结果显示: 康复费、并发症数量、住院天数等是影响费用数据合理与否的重要因素。其中,特征重要程度的数值越高,表明该特征相对模型越重要[7]。脑梗死后遗症模型拟合共纳入特征重要程度高于0.03的9个特征为康复费、并发症数量、住院天数、年龄、治疗费、一般治疗操作费、西药费、中药费、诊断费,而专家咨询为并发症数量、入院病情、年龄、住院次数、出院情况、住院天数、西药费、康复费、中医治疗费。
交叉比对两者差异,并对现有病案首页数据库进行观察可知:“入院病情”数据可做完善,在现有数据库中大多一致;“住院次数”“出院情况”数据,特征重要程度在2种方式排序下有出入,研究尚未发现原因。
3.2 系统构建 3.2.1 医保控制台系统包括:(1)数据接入模块。接入医保系统获得实时费用数据或由标准化格式的Excel文件上传导入。(2)仪表盘(可视化)展示模块。实时展示每天合理性判断的统计结果,判断费用总数、不合理比例、不合理费用的地理分布、不合理费用结构的可视化展示等。(3)合理性反馈模块。对于模型判断为不合理的一批费用记录,可视化展示其费用结构及费用量,也可详细查看每条费用数据,医保方可做出初审判断。若初审其确实为不合理,则会将费用记录发送至医院反馈系统,否则将送回模型进行强化训练,提高其识别准确率。(4)不合理费用处理模块。对于最终核实为不合理的费用记录将在该模块进行展示,便于医保方进行下一步处理。(5)流程跟踪模块。可以查看所有处理的不合理案例,并可以查看每个案例目前处于的状态(医保初审/医院反馈/专家评审/判定完成)、涉及的一批费用记录及其可视化展示,若判定完成还将显示最终结果。
3.2.2 后台-合理性判断系统包括:(1)数据库。存储接入的费用记录及所有判定案例的各方反馈、最终结果等数据。(2)判断模型。结合无监督学习与监督学习。通过大量专家标记、运用机器学习技术生成的合理性判断模型,并可通过反馈不断优化。(3)聚类模型。对不合理费用记录自动进行分类。(4)模型训练器。自动化脚本编写实现的模型训练器可以对收到的反馈实时作出反应,不断优化模型准确率。
3.2.3 医院-医保-后台反馈系统包括:(1)合理性反馈模块。院方会收到涉及本院判定为不合理费用记录的可视化展示及详细数据展示,院方可以对判定的不合理费用作出解释,解释将被呈递给专家评审系统。(2)流程跟踪模块。院方可以跟踪到涉及本院的不合理案例及其后续处理结果。
3.2.4 专家评审系统(1)分发模块。将需要判定的不合理案例随机分发给多位专家,并联系这些专家请求作出判断。(2)合理性反馈模块。功能包括:提供不合理案例中费用记录的可视化展示、详细数据以及院方作出的解释;专家据此评判是否认可院方的解释,是否真正的不合理,并给出反馈。
4 讨论 4.1 模型完善与推广基于医保需求,研究的模型完善方向着重于模型准确率的提高与假阳性率的降低。分别绘制“数据量-模型准确率、假阳性率趋势图”和“特征量-模型准确率、假阳性率趋势图”。每个数据点建模10次,剔除两端极值取平均,消除随机性造成的误差;同时,在特征量趋势图中,将特征逐一投入,结合医学规律与模型敏感程度不断调整顺序。最终通过趋势图确定数据量与特征量两方面的完善方向。
按现有正负类别比例6∶1,假使每年全市病案数据量为300万个,仍需借助系统人工审核7万个左右假阳病例。本研究虽然能够更精准地甄别费用数据的合理性,但也需要较大的审核人力进行假阳病例的筛查,因此模型仍有完善空间。
理论上,对于分类模型,Cherkassky[8]将Vapnik的经典结论进行了归纳,证明了如果想要构建强大的机器学习模型,同时需要较大的数据量和特征量。
模型完善方向:(1)细化病案首页信息特征,适量增加特征数量;(2)不断收集病案首页数据,增加模型数据量;(3)通过模型判别-医院解释-医保评判-数据反馈的完整系统,形成良性反馈;(4)通过比对专家咨询与机器学习模型反馈的特征重要程度排序结果,获得有用的病案首页完善方向。
经实证研究,该方法学可有效监管判别各级医疗机构住院费用的合理性,也为行政部门制定适合各疾病的按DRG预付费方式、降低医疗费用提供参考,有助于医保服务质量与管理效率,遏制医保基金的不合理消耗,使得医保、医疗机构、患者各方效益最大化。
4.2 门诊费用监管方法对于门诊费用监管,由于所涉及的医保结算、费用明细等数据量更为庞大复杂,后续考虑建立以医生诊疗行为为核心的大数据监管模型。具体思路为:首先,基于医疗机构的医保结算数据、费用明细,在全面分析医生诊疗行为的基础上,聚焦康复、理疗、中医治疗等存在的问题,提取相关预警指标;其次,通过专家咨询聚焦康复、理疗、中医治疗等,从医生开具诊疗项目的数量、频次及项目间的关联等维度,提出建立预警指标的专家意见;再次,保留主动学习[9]的思路,结合无监督学习[10]方法,通过数据分析和专家意见确定医生的预警指标,建立大数据预警模型,按照医生诊疗行为的不同特征,将医生划分为不同的簇,并对模型结果的准确性进行验证;最后,根据模型结果确定疑点医生簇和疑点医生范围,利用层次分析法[11]对疑点医生进行打分,建立红、橙、黄三级预警机制。
· 作者声明本文无实际或潜在的利益冲突
[1] |
BIAFORE S. Predictive solutions bring more power to decision makers[J]. Health Manag Technol, 1999, 20(10): 12-14. |
[2] |
JOTHI N, RASHID N A. Data mining in healthcare: a review[J]. Procedia Comput Sci, 2015, 72: 306-313. |
[3] |
RUDMAN W J, EBERHARDT J S, PIERCE W, et al. Healthcare fraud and abuse[J]. Perspect Health Inform Manag, 2009, 6(2): 111-112. |
[4] |
高臻耀, 张敬谊, 林志杰, 等. 一个医保基金风险防控平台中的数据挖掘技术[J]. 计算机应用与软件, 2011, 28(8): 120-122. DOI:10.3969/j.issn.1000-386X.2011.08.035 |
[5] |
蓝英. 多种统计模型在糖尿病患者住院费用影响因素研究中的运用[J]. 经济师, 2019(6): 243-244. DOI:10.3969/j.issn.1004-4914.2019.06.128 |
[6] |
许思特, 张天天, 盛韬, 等. 反向传播的多层前馈神经网络和多元回归对合理住院费用预测效能的比较[J]. 中国卫生资源, 2021, 24(5): 525-528, 537. DOI:10.3969/j.issn.1007-953X.2021.05.010 |
[7] |
PEDREGOSA F, VAROQUAUX G, GRAMFORT A, et al. Scikit-learn: machine learning in Python[J]. J Mach Learn Res, 2011, 12: 2825-2830. |
[8] |
CHERKASSKY V. The nature of statistical learning theory[J]. IEEE Trans Neural Networ, 1997, 8(6): 1564. DOI:10.1109/TNN.1997.641482 |
[9] |
FELDER R M, BRENT R. Active learning: an introduction[J]. ASQ Higher Edu Brief, 2009, 2(4): 1-5. |
[10] |
庄池杰, 张斌, 胡军, 等. 基于无监督学习的电力用户异常用电模式检测[J]. 中国电机工程学报, 2016, 36(2): 379-387. |
[11] |
王湘杰, 应悦, 王志康, 等. 基于AHP法的医疗器械供应商评价系统[J]. 中国医疗设备, 2016, 31(3): 144-145, 148. |