2. 复旦大学计算机科学技术学院, 上海 200041;
3. 上海市卫生健康委员会信访办, 上海 200125;
4. 上海市健康促进中心, 上海 200040
医疗服务质量是衡量医疗机构水平的重要指标,也是践行“以患者为中心”服务理念的重要任务[1]。评价是持续提高医疗服务质量的重要手段,其目的在于发现医疗服务过程中的薄弱环节。实现医疗服务质量客观评价的关键在于真实、可靠、全面的数据支撑。目前,国内外常用的评价方法是通过量表形式收集患者体验评价数据,如Picker患者体验量表(Picker Patient Experience Questionnaire,PPE-15)、HCAHPS(Hospital Consumer Assessment of Healthcare Providers and Systems)患者体验调查问卷、法国住院患者体验调查问卷(French in-patient experience questionnaire,FIPEQ)、中国医院住院患者体验和满意监测量表等[2-5]。尽管这些方法具有结构规范可重复、调查结果可计量的优势,但也存在局限性,如耗时耗力、选择偏倚、信息偏倚、数据不全面等,特别是不能完全客观代表患者声音。
本研究拟从患者体验视角出发,提出一种基于投诉数据的医疗机构服务质量评价方法。“以患者为中心”的服务理念是尊重患者的就医体验和体验结果。患者体验视角是一种发展性评价视角,更注重患者个人经历的客观回顾性反思,符合“以患者为中心”服务理念尊重患者就医体验与体验结果的要求[6-7]。投诉是目前患者表达就医体验与体验结果的主要方式,它直接反映患者对医疗机构服务是否满意及不满意的具体方面[8]。研究[9]表明,投诉数据是加强绩效管理、评估和纠正公共部门服务模式的关键工具。在我国,患者投诉主要有2种途径:12345市民服务热线和政府信访。前者是一个“7×24 h”全天候的政府公共服务平台,后者是市民参与的重要渠道。与传统问卷调查相比,这2类医疗投诉数据来源更真实、问题覆盖更广泛、问题内容更聚焦、患者体验更真实、数据体量更庞大,可以成为医疗机构服务质量评价数据的良好来源。
患者投诉数据主要以非结构化文本形式储存。随着计算机科学的发展,应用卷积神经网络(convolutional neurl network,CNN)等新技术可以实现对非结构化文本数据的自动化分析和分类,为利用患者投诉文本进行服务质量评价提供了技术支持[10-12]。因此,本研究融合患者体验视角和以12345市民服务热线及政府信访为主的患者投诉数据,应用机器学习技术,尝试构建一种将患者投诉数据转化为医疗机构服务质量评价依据的模型和方法。
1 资料与方法 1.1 理论方法 1.1.1 系统论系统论主张从整体角度去研究要素之间、要素与系统以及系统与系统之间的普遍联系。本研究采用系统论来揭示医疗机构主要服务流程,深入挖掘各流程环节的要素、连接及要素特征,为医疗机构服务质量评价方法的构建提供理论支撑。
1.1.2 结构-过程-结果该理论框架主要用于确定医疗机构服务质量评价的主要维度。其中,“结构”是指医疗机构中各类资源的静态配置关系和效率,如床位数、设备、服务项目、范围及服务量等;“过程”指医疗机构动态运行的质量和效率,如临床治疗的路径、各项检查活动等;“结果”是对医疗机构运行结果的评价,包括患者满意度、转归、再住院率、死亡率等。
1.2 数据模拟实验按照提出方法、模拟验证、完善方法的思路,运用CNN技术从投诉内容文本中提取医疗机构服务质量评价特征[13]。CNN是一种以人工神经网络为架构的深度学习技术,可以自动提取输入向量的局部特征,已被广泛应用于图像分类、语音识别等[14]。本研究收集了华东地区某市2016—2021年共20余万条热线和信访投诉数据,其中80%作为训练集,20%作为测试集。从测试集中随机抽取7 855条投诉文本进行验证,以人工分类结果为金标准,以检验训练结果的准确度。
1.3 技术路线本研究旨在提出一种客观反映患者对医疗机构服务质量评价的方法。因此,需要解决以下3个关键问题:(1)如何将非量化、非结构化的投诉信息转化为标准、统一的医疗机构服务质量评价特征?(2)如何处理不同投诉数据来源、不同评价特征之间的评判标准差异?(3)如何实现非结构化投诉信息自动、快速的评价特征提取?前2个问题属于方法论问题,而第3个问题涉及技术挑战。技术路线如图 1所示,具体解决方案见后。
![]() |
注:CNN为卷积神经网络(convolutional neurl network)。 图 1 技术路线 |
为了从患者体验视角评价和改善医疗服务质量,本研究提议从系统角度识别医疗服务质量的本质要求。通过了解实际医疗服务和患者体验,将“现实”与“目标”进行比较,从而识别“问题”。如果将治疗过程视为一个系统,医疗服务由各种要素和特征组成。只有当这些要素和特征完整时,医疗服务“目标”才能基本实现;如果存在要素或特征缺失,可能导致医疗服务功能受损或无法满足患者期望,从而产生“问题”。因此,首要任务是探讨如何从患者体验视角识别整个医疗服务过程中的要素及其特征,并建立相应的评价模型。
具体做法:(1)基于患者体验视角,结合医疗机构现场体验及相关管理者咨询,根据患者来院就诊时间和空间的变动顺序,将就诊流程划分为患者来院、预约挂号、排队等待、门急诊、检查化验、门诊治疗、药房取药、入院治疗、缴费/退费、离院/出院、公共卫生服务11个环节。实际过程可能有所不同。(2)基于系统论,识别各环节要素及其特征。(3)基于患者体验视角和“结构-过程-结果”理论,确定6个评价维度:便利是否可及、费用是否合理、服务是否可及、就诊体验是否良好、医疗是否安全、诊疗是否有效,以分别体现医疗服务的有形性、可负担、可获得性、反应性、可靠性和有效性。(4)将要素及其特征缺失可能造成的问题与6个评价维度一一对应,形成13个评价特征,最终形成基于患者体验视角的医疗机构服务质量评价理论模型(表 1)。投诉文本的本质是对评价特征的反映,也可称问题类型。通过这种方法,可以从患者角度对医疗机构服务质量进行客观、全面的评价。这种基于患者投诉数据的评价方法有助于揭示患者关注的问题,并为医疗机构提供改进服务质量的依据。
表 1 基于患者体验视角的医疗机构服务质量评价理论模型 |
![]() |
考虑到不同评价特征缺失情况对医疗机构服务质量和患者体验的影响程度不同,以及不同投诉数据来源(信访和热线)在就医过程中对患者感性映像反映程度的差异,本研究认为提取到投诉数据中的评价特征后,将其与数据来源进行连接,就可得到一家医疗机构医疗服务质量的评价分数。为实现医疗机构、评价特征及年份间的横纵向可比性,减少定性分析的不确定性和模糊性,量化权重至关重要。
2.2.1 对评价特征的赋分第一,权重赋分。研究假设整个诊疗系统中的所有子系统、子系统中的所有要素以及要素的所有特征同等重要。按照各评价特征在模型中出现的次数,确定相应权重,并按满分100分进行标准化赋分。权重赋分结果作为评价特征的理论满分值,见表 2。第二,实际得分。综合考虑诊疗人次,以体现客户投诉杠杆比一般规律为依据,以本年度或者近年平均总诊疗患者中每万诊疗人次里该评价特征的出现次数作为扣分数,然后用该评价特征的权重赋分减去扣分数,得到该医疗机构在该评价特征上的实际得分Sn,见式1。由于每个评价特征有明确的权重赋分(即理论满分值),若某项投诉过多以致扣分数超过理论满分值,Sn取0分,即Sn得分最低为0分。第三,总评分。将13个评价特征的得分相加,得到该医疗机构某一投诉来源的医疗服务质量评分S,见式2。评分越高,医疗机构该评价特征的表现越好。
$ S_n=\text { 第 } n \text { 个评价特征赋分 }-\frac{\text { 第 } n \text { 个评价特征投诉量 } \times 1 \;000}{\text { 本年度或近年平均总诊疗人次 }} $ | (1) |
$ S=S_1+S_2+\cdots+S_n $ | (2) |
表 2 评价特征赋分 |
![]() |
评价方式主要包括2种投诉途径:信访和12345市民服务热线。在考虑评价方式权重时,专家认为信访投诉可能反映了患者更多的负面感情以及个体情感的不稳定性,因此应在热线投诉的基础上加入信访投诉。为避免信访投诉对热线分析结果的影响过大,信访投诉权重不应设置过高。按照热线和信访投诉的不同赋分组合进行数据模拟验证,邀请卫生管理部门投诉主管部门负责人、骨干及高校高级职称专家共计7人,对照模拟结果、收集赋分建议,以确保既符合现实中热线和信访投诉的量级差异,又体现评分结果的量化差异性。研究最终设置热线权重为0.9、信访权重为0.1。
2.2.3 医疗机构服务质量评分结果计算如式3所示,S总代表某医疗机构医疗服务质量综合评分,S热线表示该医疗机构来源于热线投诉的服务质量评分,S信访为该医疗机构来源于信访投诉的服务质量评分。通过加权计算方法,综合考虑热线投诉和信访投诉的评分,得出医疗机构的服务质量综合评分。S总评分越高,医疗机构在各方面的表现越好,服务质量水平越高。
$ S_{\text {总 }}=0.9 \times S_{\text {热线 }}+0.1 \times S_{\text {信访 }} $ | (3) |
在方法学层面,关键问题1的解决方案与关键问题2的解决方案共同构成本研究所提出的基于患者投诉数据的医疗机构服务质量评价方法。
2.3 针对关键问题3:研发基于投诉文本的医疗机构服务质量评价特征自动化提取技术针对热线和信访数据量大、内容口语化、格式多样以及医疗专业名词众多的特点,以人力方式逐条处理数据既耗时又耗力,且难以实现。如果不能迅速且准确地将模糊语言归纳为规范的评价特征,投诉数据的利用效率将无法支撑评价应用。因此,本研究采用CNN技术,对投诉文本中的医疗机构服务质量评价特征进行自动化提取;若没有从投诉文本中提取到任一评价特征,则标注为“非医院责任”。为验证所提取特征的准确性,研究随机抽取了7 855条文本,并进行人工标注,以此为金标准。经计算,基于CNN技术的评价特征提取结果准确度达到了89.95%。对于出现频率较高的问题类型,如药品短缺、院内设施、费用合理等方面,准确度甚至超过了90.00%。由此可认为,本研究提出的对投诉内容进行语义分析并自动提取评价特征的方法具有较好的重测信度(图 2)。
![]() |
图 2 机器学习分类性能评价结果 |
利用患者投诉数据进行医疗机构服务质量评价的前提是有一个以患者体验为导向的医疗机构服务质量评价特征体系,有一个综合考量评价特征和投诉方式的量化评分方法,有一个从非结构化投诉文本中提取评价特征信息的自动化技术。本研究提出的一整套基于患者投诉数据的医疗机构服务质量评价方法,已应用于华东区某市医疗机构服务质量评价(详见《基于患者投诉数据的医疗机构服务质量评价实证研究》)一文。结果显示,运用新方法得到的评分结果与该市每年举办的大规模公立医疗机构满意度调查及全国三级公立医院绩效考核结果较为贴合,模拟结果获卫生管理部门较高认同。可见,本研究提出的方法具有实践性和可操作性,能够为管理部门测评医疗机构服务质量、捕捉潜在风险提供新思路和新工具。
4 讨论本研究主要探讨了一种基于患者体验视角的医疗机构服务质量评价方法,该方法利用12345市民服务热线和信访投诉数据,适用于我国任何地域范围内的医疗机构服务质量评价。目前,已运用该方法在华东区某市进行了实证评价,结果与目前常用的患者满意度及绩效考核评价结果较为贴合,获卫生管理部门较高认同。
该方法具有以下优点:第一,这套方法关注患者在就医过程中的体验和感受,突破了传统基于患者满意度的评价方法,能够追溯诊疗过程中的细节,并实现不同医疗机构的横向比较以及同一医疗机构在不同时间段的动态比较。第二,12345市民服务热线和信访数据作为公共卫生服务数据,相较于传统的问卷、电话、邮件调查等数据收集方式[13],更节省成本,且不再受调查团队人力、患者年龄和患病状态的影响,保证了数据的客观性和质量。第三,在海量数据不断产生、人工智能深入应用的背景下,数据赋能政府治理已成为当前各国数字政府建设的主线。这套方法为政府提供了一个高效、统一的医疗服务测评工具,有助于发现具有规律性、普遍性和苗头性的医疗服务问题,为医疗机构或管理部门完善管理制度、形成解决问题的长效机制提供依据[15]。
然而,该方法也存在一定局限性:(1)本研究未考虑医疗机构服务类别和就诊患者特征的差异,可能导致评价结果出现信息偏倚和选择偏倚。在评价具体某一医疗机构服务质量时,这一问题可能较为明显,而在对某一地域范围进行医疗服务质量整体评价时,其影响相对较小。(2)本研究采用的CNN方法在提取评价特征信息时存在忽略上下文的问题。由于患者投诉通常带有个人负面情感,且有一定的内容长度,导致评价特征提取和评价结果出现一些偏差。针对该问题,课题组将进行后续研究以改进方法。
·作者声明本文无实际或潜在的利益冲突
[1] |
王静, 曹红梅, 孔璇. 多措并举提升医疗服务水平[J]. 江苏卫生事业管理, 2019, 30(5): 601-602, 609. |
[2] |
张子夏, 胡银环. 国内外患者体验测量工具比较分析与启示[J]. 中国医院, 2015, 19(2): 31-32. |
[3] |
姜荣勤, 胡丹, 陈家应. 部分国家患者体验测量工具的比较与启示[J]. 卫生软科学, 2020, 34(11): 39-44. |
[4] |
GARRATT A, SOLHEIM E, DANIELSEN K. National and cross-national surveys of patient experiences: a structured review[M]. Oslo: Nasjonalt kunnskapssenter for helsetjenesten, 2008.
|
[5] |
GOLDSTEIN E, FARQUHAR M, CROFTON C, et al. Measuring hospital care from the patients' perspective: an over view of the CAHPS Hospital Survey Development Process[J]. Health Serv Res, 2010, 40(6 Pt 2): 1977-1995. |
[6] |
BOER D D, DELNOIJ D, RADEMAKERS J. The discriminative power of patient experience surveys[J]. BMC Health Serv Res, 2011, 11(1): 332. DOI:10.1186/1472-6963-11-332 |
[7] |
田常俊. 基于患者体验的医疗服务质量评价研究[D]. 武汉: 华中科技大学, 2014.
|
[8] |
胡广宇. 医疗服务的患者体验与舆情评价研究[D]. 北京: 北京协和医学院, 2018.
|
[9] |
O'BRIEN D, SAMPSON R J, WINSHIP C. Ecometrics in the age of big data: measuring and assessing "broken windows" using large-scale administrative records[J]. Sociol Methodol, 2015, 45(1): 101-147. DOI:10.1177/0081175015576601 |
[10] |
黑富郁. 基于异构数据和神经网络的舆情分类技术研究[D]. 北京: 北方工业大学, 2019.
|
[11] |
PENG X, LI Y, SI Y, et al. A social sensing approach for everyday urban problem-hand ling with the 12345-complaint hotline data[J]. Comput, Environ Urban Syst, 2022, 94: 101790. DOI:10.1016/j.compenvurbsys.2022.101790 |
[12] |
JU J, LIU L, FENG Y. Citizen-centered big data analysis-driven governance intelligence framework for smart cities[J]. Telecommun Policy, 2018, 42(10): 881-896. DOI:10.1016/j.telpol.2018.01.003 |
[13] |
ZHANG Y, WALLACE B. A sensitivity analysis of(and practitioners' guide to) convolutional neural networks for sentence classification[J]. Computer Science, 2015. DOI:10.48550/arxiv.1908.06263 |
[14] |
KRIZHEVSKY A, SUTSKEVER I, HINTON G. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90. DOI:10.1145/3065386 |
[15] |
吴国玖, 金世斌, 甘继勇. 政务热线: 提升城市政府治理能力的有力杠杆: 以南京市"12345"政府公共服务平台为例[J]. 现代城市研究, 2014(7): 98-102. |