中华流行病学杂志  2023, Vol. 44 Issue (9): 1467-1472   PDF    
http://dx.doi.org/10.3760/cma.j.cn112338-20230222-00097
中华医学会主办。
0

文章信息

王潇兰, 张雨格, 郑旭彬, 车贝贝, 孙嘉轩, 徐飚.
Wang Xiaolan, Zhang Yuge, Zheng Xubin, Che Beibei, Sun Jiaxuan, Xu Biao
中国基本医疗保险数据在肿瘤研究中的利用情况
Utilization of basic medical insurance data in cancer-related researches in China
中华流行病学杂志, 2023, 44(9): 1467-1472
Chinese Journal of Epidemiology, 2023, 44(9): 1467-1472
http://dx.doi.org/10.3760/cma.j.cn112338-20230222-00097

文章历史

收稿日期: 2023-02-22
中国基本医疗保险数据在肿瘤研究中的利用情况
王潇兰1 , 张雨格1 , 郑旭彬2 , 车贝贝1 , 孙嘉轩1 , 徐飚1     
1. 复旦大学公共卫生学院流行病学教研室/国家卫生健康委员会卫生技术评估重点实验室, 上海 200032;
2. 同济大学附属上海市肺科医院结核病临床研究中心, 上海市结核病(肺)重点实验室, 上海 200433
摘要: 目的 掌握中国研究人员利用基本医疗保险数据发表的肿瘤防治领域期刊论文的现状及分布特征,为今后在肿瘤防治中充分、规范和有效地挖掘及使用医疗保险数据库提供依据。方法 检索PubMed、Web of Science、万方数据知识服务平台、中国知网4个数据库建库至2021年利用中国基本医疗保险数据发表的论文,从发文数量、肿瘤类别、主要研究内容和作者机构等维度进行描述性分析。结果 共纳入65篇文献。2016年后,发文量快速增长。研究数量最多的肿瘤是肺癌,最高频的研究内容是肿瘤医疗费用。福建省、北京市、安徽省的基本医疗保险数据库中的肿瘤相关数据被利用较多。新型农村合作医疗保险数据区域限制性强,而城镇基本医疗保险数据共享性高。北京大学、复旦大学利用基本医疗保险数据较多。结论 中国基本医疗保险肿瘤相关数据利用率较低、可及性较差、共享性不足、区域限制性明显,亟须规范数据使用,提高数据可及性及共享水平,促进健康医疗保险大数据的融合与利用。
关键词: 基本医疗保险    健康医疗大数据    肿瘤    
Utilization of basic medical insurance data in cancer-related researches in China
Wang Xiaolan1 , Zhang Yuge1 , Zheng Xubin2 , Che Beibei1 , Sun Jiaxuan1 , Xu Biao1     
1. Key Laboratory for Health Technology Assessment, National Commission of Health/Department of Epidemiology, School of Public Health, Fudan University, Shanghai 200032, China;
2. Clinical Research Center of Tuberculosis, Shanghai Key Laboratory of Tuberculosis, Shanghai Pulmonary Hospital, Tongji University, Shanghai 200433, China
Abstract: Objective To explore the utilization of cancer-related data from basic medical insurance databases in China, and promote the application of medical insurance data in cancer prevention and treatment. Methods Database PubMed, Web of Science, Wanfang, and CNKI were used to select related research papers using data from basic medical insurance system in China published by December 2021. Descriptive analysis was conducted in terms of the number of publications, types of cancer, primary research contents and author affiliations. Results A total of 65 papers were included in the study. The number of publications increased rapidly after 2016. The most studied cancer type was lung cancer, and healthcare costs were the most common research contents. Fujian, Beijing, and Anhui have made a better use of cancer-related medical insurance databases compared to other provincial regions. The accessibility of the New Rural Cooperative Medical Scheme data was limited due to the high regional barriers, while the accessibility of the urban basic medical insurance data was relatively high. The researchers from Peking University and Fudan University had higher utilization of basic medical insurance data compared with those from other institutions. Conclusions The utilization of cancer-related data from basic medical insurance databases in China is limited because of poor accessibility, insufficient data sharing, and regional restrictions. Thus, it is urgent to improve data accessibility and promote the integration and utilization of regional medical insurance data.
Key words: Basic medical insurance    Healthcare big data    Cancer    

中国的医疗保险由城镇职工基本医疗保险(1998年推出)、城镇居民基本医疗保险(2007年推出)和新型农村合作医疗保险(新农合,2003年推出)组成[1],覆盖了95%以上的人口[2]。医疗保险由国家及地方社保部门和卫生部门共同管理和运营[3]。为支持基本医疗保险制度的管理和运行,我国积极推进医疗保险信息系统的建设,进而衍生出中国的基本医疗保险数据库。

随着我国人口老龄化加速,慢性病尤其是肿瘤的发生和死亡已成为人群健康的主要威胁,而医疗保险数据库可被广泛用于掌握患者医疗费用和经济负担,提供卫生体系建设和重点疾病筹资的证据,促进人群的卫生保健及健康。

近年,日本[4]、韩国[5]等亚洲国家均重视其医疗保险数据的利用,对其医疗保险数据利用情况进行了较为系统的分析,然而中国缺乏对医疗保险数据在肿瘤研究领域利用情况的系统探索。因此,本研究旨在了解中国基本医疗保险数据[中国医疗保险研究会数据库(China Health Insurance Research Association claims database,CHIRA)、城镇基本医疗保险数据库(Urban Basic Medical Insurance claims databases,UBMI)、新农合数据库(New Rural Cooperative Medical Scheme claims database,NCMS)]中肿瘤数据的利用情况,描述文献的发文趋势和分布特征,为今后在肿瘤防治中充分、规范和有效地挖掘及使用医疗保险数据库提供依据。

对象与方法

1. 数据来源:检索PubMed、Web of Science、中国知网及万方数据知识服务平台中使用中国基本医疗保险数据作为数据源的出版物。检索时间限定为建库至2021年12月1日。进行检索时,文献标题、摘要或关键词中需包含以下任一术语:“健康保险”“医疗保险”“索赔”“医保”“新农合”“农村合作医疗”“基本医疗保险”“NCMS”“UBMI”“CHIRA”“中国医疗保险研究会”“抽样数据库”。在进行正式检索分析前,研究人员利用“医疗保险”“健康保险”“索赔”关键词进行初步检索,识别基于基本医疗保险制度的主要数据库,制定纳入分析的数据库清单,包括CHIRA、UBMI、NCMS。

2. 文献纳入排除标准:纳入标准:①主题为医疗健康相关;②研究的疾病包括恶性肿瘤;③文献所使用的数据部分或全部来源于CHIRA、UBMI或是NCMS;④文献被发表在同行评议期刊上;⑤文献语言为中文或者英文。排除标准:①文献类型为会议、专利、报纸、学位论文、综述、研究计划、新闻、未发表;②重复发表的文献;③无法获取全文或无法获取数据的文献。

3. 文献筛选、资料提取及质量评价:由2名研究人员独立阅读全部文献并按纳入排除标准进行筛选,筛选时对每篇排除的文献注明排除原因,对存疑的文献保留并进行标注。待各自的文献筛选完成后共同对结果进行核对,存疑及判断结果不一致的文献在讨论后由第三人进行判断。文献纳入后,提取以下信息:主要数据来源(同时基于UBMI和NCMS发表的文献记为UBMI & NCMS)、数据代表地区、研究的目标疾病、研究主要内容、发表年份、作者机构。此外,还提取了英文文献发表期刊的影响因子(科睿唯安《期刊引证报告》2020年数据)、期刊分区(科睿唯安《期刊引证报告》2020年数据)、总被引次数(科睿唯安Web of Science引文数据库及中国知网的文献被引数据)、中文文献发表期刊是否为北大核心收录(《中文核心期刊要目总览》2020版),对纳入的文献进行质量评价。

4. 统计学分析:利用NoteExpress文献管理软件及Office 2021软件构建Excel数据库后采用R 4.2.2软件进行分析及绘图。对连续性变量进行Shapiro-Wilk正态性检验,非正态分布的变量使用MQ1Q3)描述,并使用Kruskal-Wallis进行检验;对分类变量使用频数及百分比进行描述,使用χ2检验或Fisher-Freeman-Halton精确性检验。双侧检验,检验水准α=0.05。

结果

1. 文献筛选:共检索到6 203篇文献,按纳入排除标准筛选后获得利用中国基本医疗保险数据发表的文献共426篇,其中肿瘤相关65篇(15.26%)(图 1)。

图 1 纳入文献筛选流程

2. 纳入分析数据库概况:NCMS及UBMI(包括城镇居民及城镇职工基本医疗保险数据库)由不同地区基本医疗保险受益者的医疗服务报销数据组成。CHIRA于2007年启动,是中国医疗保险研究会根据全国范围的UBMI受益者全年医疗记录[2],通过两阶段的抽样设计而建立的行政数据库[6]。3类数据库均无标准化的申请流程介绍材料,数据不公开,需高校或医院研究者接受数据管理方研究项目委托后才能获取对应数据。见表 1

表 1 中国医疗保险研究会数据库(CHIRA)、城镇基本医疗保险数据库(UBMI)和新型农村合作医疗保险数据库(NCMS)介绍

3. 基于医疗保险数据库的发文量时间变化趋势:对纳入文献发表时间进行分析发现以NCMS、UBMI或CHIRA为数据源的肿瘤相关的首篇论文分别发表于2008年[10]、2011年[11]、2015年[12]。2004-2009年发文量为1篇,2010-2015年发文总量为16篇,2016-2021年达到48篇,总体呈增长趋势且自2016年后明显增多。见图 2

注:CHIRA:中国医疗保险研究会数据库;UBMI:城镇基本医疗保险数据库;NCMS:新型农村合作医疗保险数据库 图 2 2004-2021年基于医疗保险数据库的发文量变化趋势

4. 基于医疗保险数据库的文献研究类型及质量评估:纳入肿瘤领域的65篇文献中44篇为中文,21篇为英文。基于科睿唯安《期刊引证报告》2020年数据、科睿唯安Web of Science引文数据库和中国知网总被引次数数据,65篇文献所发表期刊影响因子水平及被引水平较为一致,期刊分区构成差异有统计学意义(P<0.001)。相比于其他3类数据源,基于UBMI发表的文献质量较高(其中英文文献发表在Q1和Q2分区期刊上共9篇,中文文献发表在北大核心期刊13篇)。基于CHIRA、NCMS以及UBMI & NCMS发表的文献主要为队列研究,而基于UBMI发表的文献研究类型以横断面研究为主。见表 2

表 2 基于医疗保险数据库的肿瘤相关文献研究类型及质量评估

5. 肿瘤类别及主要研究内容:以NCMS为数据源的文献中,未明确定义肿瘤类别的文献有13篇,UBMI有9篇,CHIRA有2篇,明确定义肿瘤类别的所有文献中,肺癌出现频次最高,而基于UBMI发表的文献中白血病最多,基于CHIRA发表的文献中肺癌最多,基于NCMS发表的文献中以食管癌和胃癌为主(表 3)。

表 3 基于医疗保险数据库发表文献的肿瘤类别分布(篇)

65篇肿瘤相关文献主要集中于医疗费用研究,包括门诊和住院费用,其次为卫生服务利用研究,再次为患病率研究(表 4)。

表 4 基于医疗保险数据库发表文献的研究内容分布(篇)

6. 数据库的区域利用情况及研究人员机构分布:安徽省及福建省的NCMS中肿瘤相关数据被利用较多;而UBMI中全国性的肿瘤数据利用最多,北京(国家癌症登记中心所在地)、天津(国家恶性肿瘤临床研究中心所在地)、上海(上海癌症登记中心所在地)3个直辖市的数据使用次之。见表 5

表 5 基于医疗保险数据库发表的肿瘤相关文献区域利用及作者来源机构

各地区高校及其附属医院对数据库的使用最多,其次为卫生行政机构及医疗保险管理机构如新农合医疗管理办公室、卫生健康委员会等,最后则是医药企业。NCMS省/市级数据多由当地机构使用,而UBMI由北京大学、复旦大学进行多区域数据联合分析的研究较多。CHIRA的数据存储于北京,主要使用机构为北京大学。

讨论

本研究共检索到利用中国基本医疗保险数据发表的文献426篇,其中近1/5聚焦肿瘤研究。2016年后,利用医疗保险数据的文献数量增长明显。而国务院于2016年发布了国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见[13]。此外,由于我国的主要疾病负担已从传染病转变为包括肿瘤、心血管疾病在内的慢性非传染性疾病[14],受疾病变迁的影响,研究人员对慢性非传染性疾病的研究所发表论文数量也相应增长。但与韩国国民医疗保险数据及医疗保险审查与评估服务数据利用情况(2014-2019年,利用数据库发表的文献数目分别为2 541和655篇)相比,中国基本医疗保险数据利用率仍然有限[5]。这可能是因为韩国的医疗保险数据有规范化的数据利用申请流程及维护管理专家委员会进行数据加密及清洗,与之相比,NCMS、UBMI、CHIRA缺乏规范化的使用流程,可及性低。进一步促进规范化医疗保险数据申请利用流程的落地及专业管理部门或委员会的设立将有助于开发我国珍贵的医疗保险数据资源,助力包括肿瘤在内的疾病防治工作。

从肿瘤类别分布看,基于NCMS发表的文献主要关注食管癌和胃癌,而基于UBMI与CHIRA发表的文献多侧重在肺癌,这与我国城乡人群肿瘤的流行病学分布特征一致。据2015年中国癌症报告显示,农村地区的胃癌及食管癌发病率高于城市,而肺癌在城市居民中发病较高[15]。因此,肿瘤研究的关注点随疾病负担的地区性差异而有所不同。而且当以肿瘤为研究对象时,因其发病率相对较低的特征,开展单肿瘤研究时病例选取有一定难度,故未明确定义肿瘤类型的研究也较多。为便于研究者进行肿瘤类别明确的相关研究可考虑增强区域数据共享程度、跨省市收集数据以提高采集效率。

利用基本医疗保险数据开展的研究,多关注流行特征或医疗费用方面的内容,探索了疾病的发病率和患病率、住院费用及门诊费用等,可能与医疗保险数据包含的变量指标(参保用户的登记信息、疾病诊断、就医医院级别、用药及相关费用数据)有关[16-17]。为拓展研究内容的宽度,可考虑弱化不同监测平台的数据壁垒,便于研究者结合医疗保险数据、电子病例系统数据、气象监测数据及肿瘤登记数据等多平台数据开展研究。

GDP水平前15位省份的NCMS及UBMI利用水平较高,如安徽省、福建省、浙江省、山东省、北京市等[18]。数据库的挖掘利用,一方面要求数据平台有良好的可及性,另一方面需要具备专业研究能力的研究者,而经济相对发达地区的研究人力资源更可能优于经济贫困地区且国家医疗保险改革试点地区对于本地区的数据利用也相对较充分。但肿瘤的发生和死亡有其特定的地域特性,贫困地区和发达地区的肿瘤流行特征可能不同,尤其是对那些在发达地区已呈现明显下降的与贫困和生活环境相关的恶性肿瘤。因此,面对医疗保险数据库的地区差异和利用缺口,需强化数据弥合,促进挖掘利用,掌握不同地区的疾病负担,采取针对性干预措施,提出成本效益最优的防治对策,助力健康中国建设,全面改善人群健康。

研究还发现,中国高校是医疗保险数据库的主要使用机构,但其同样受限于数据库的地域性,NCMS地区限制性较强,多为本地机构利用,与之相比,UBMI使用共享程度较高。例如,北京大学的研究人员对3类数据库均进行了探索利用,复旦大学的研究人员多次对UBMI进行挖掘利用。上述情况提示目前对医疗保险数据库的挖掘仍局限于科研水平较高的研究机构,这些来自高等院校的研究人员有丰富的数据挖掘经验,可担负起专业人才培养的责任,从而促进中国医疗保险数据库信息的充分利用。

综上所述,未来对于中国医疗保险数据库的挖掘利用,有必要建立规范化管理制度,增加其有限开放的程度。在增强数据的可及性的同时,加强研究人员培训,均衡提升不同地区研究者的研究能力。此外,应加强医疗保险数据共享平台建设,充分利用未被挖掘的海量丰富数据。在融合共享的情况下,基于全国的平台,有望短期收集足够的病例,开展肿瘤的纵向研究。在研究内容上,除流行特征及经济负担外,还可深入分析疾病诊疗程序、方法与疾病预后的关联,通过医疗保险数据分析掌握疾病诊疗中临床路径的实施情况及疗效意义。而从方法学角度,基于医疗保险数据的研究也可探索实现外部数据连接,如医疗保险数据匹配电子病历系统、癌症登记系统、死因监测数据、气象监测系统等开展跨平台跨领域研究,助力临床诊疗路径优化,改善肿瘤治疗结局,使基于大数据挖掘的真实世界研究发挥其最大的效益和效能。

利益冲突  所有作者声明无利益冲突

作者贡献声明  王潇兰:采集/分析/解释数据、论文撰写;张雨格:方案设计、采集/分析/解释数据、论文修改/审阅;郑旭彬:采集数据、研究指导、方案设计;车贝贝、孙嘉轩:实施研究、采集数据;徐飚:研究设计/指导、方案制定、获取研究经费、论文修改/审阅

参考文献
[1]
Meng QY, Fang H, Liu XY, et al. Consolidating the social health insurance schemes in China: towards an equitable and efficient health system[J]. Lancet, 2015, 386(10002): 1484-1492. DOI:10.1016/S0140-6736(15)00342-6
[2]
Zhang LX, Wang HB, Li QZ, et al. Big data and medical research in China[J]. BMJ, 2018, 360: j5910. DOI:10.1136/bmj.j5910
[3]
谢莉琴, 李亚子, 秦盼盼, 等. 我国基本医疗保险信息系统运行问题及对策探讨[J]. 中华医院管理杂志, 2018, 34(7): 556-559. DOI:10.3760/cma.j.issn.1000-6672.2018.07.008
Xie LQ, Li YZ, Qin PP, et al. Operation mechanism of China's basic medical insurance information system[J]. Chin J Hosp Admin, 2018, 34(7): 556-559. DOI:10.3760/cma.j.issn.1000-6672.2018.07.008
[4]
Fujinaga J, Fukuoka T. A review of research studies using data from the administrative claims databases in Japan[J]. Drugs Real World Outcomes, 2022, 9(4): 543-550. DOI:10.1007/s40801-022-00331-5
[5]
Kim HK, Song SO, Noh J, et al. Data configuration and publication trends for the Korean national health insurance and health insurance review & assessment database[J]. Diabetes Metab J, 2020, 44(5): 671-678. DOI:10.4093/dmj.2020.0207
[6]
Zhang LX, Zhao MH, Zuo L, et al. China kidney disease network (CK-NET) 2015 annual data report[J]. Kidney Int Suppl (2011), 2019, 9(1): e1-81. DOI:10.1016/j.kisu.2018.11.001
[7]
Li YZ, Lu CJ, Liu Y. Medical insurance information systems in China: mixed methods study[J]. JMIR Med Inform, 2020, 8(9): e18780. DOI:10.2196/18780
[8]
Wang H, Chai K, Du MH, et al. Prevalence and incidence of heart failure among urban patients in China a national population-based analysis[J]. Circ Heart Fail, 2021, 14(10): e008406. DOI:10.1161/circheartfailure.121.008406
[9]
Yao AQ, Shen XR, Chai J, et al. Characteristics and implications of insurance-reimbursed inpatient care for gastric and oesophageal cancers in Anhui, China[J]. Int Health, 2021, 13(5): 446-455. DOI:10.1093/inthealth/ihaa092
[10]
詹小海, 潘宝骏, 田俊. 福州市参合农民疾病负担及医疗费用分析[J]. 河南预防医学杂志, 2008, 19(4): 255-257. DOI:10.3969/j.issn.1006-8414.2008.04.008
Zhan XH, Pan BJ, Tian J. Analysis to disease burden and medical expenses of rural residents in Fuzhou who participate the RCMs[J]. Henan J Prev Med, 2008, 19(4): 255-257. DOI:10.3969/j.issn.1006-8414.2008.04.008
[11]
柯慧, 李长平, 崔壮, 等. 参加医疗保险卵巢癌患者住院费用及影响因素[J]. 中国公共卫生, 2011, 27(3): 343-344. DOI:10.11847/zgggws2011-27-03-43
Ke H, Li CP, Cui Z, et al. Hospitalization expense of ovarian cancer patients with medical insurance and its influencing factors[J]. Chin J Public Health, 2011, 27(3): 343-344. DOI:10.11847/zgggws2011-27-03-43
[12]
Du F, Chirovsky D, Xiong XJ, et al. Inpatient treatment patterns and health care expenditures for hepatocellular carcinoma among the population with urban basic health insurance in China[J]. Value Health Reg Issues, 2015, 6: 132-140. DOI:10.1016/j.vhri.2015.03.009
[13]
国务院办公厅. 国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见[EB/OL]. (2016-06-21)[2022-09-27]. http://www.gov.cn/zhengce/content/2016-06/24/content_5085091.htm.
[14]
Zhou MG, Wang HD, Zeng XY, et al. Mortality, morbidity, and risk factors in China and its provinces, 1990-2017: a systematic analysis for the Global Burden of Disease Study 2017[J]. Lancet, 2019, 394(10204): 1145-1158. DOI:10.1016/S0140-6736(19)30427-1
[15]
Chen WQ, Zheng RS, Baade PD, et al. Cancer statistics in China, 2015[J]. CA Cancer J Clin, 2016, 66(2): 115-132. DOI:10.3322/caac.21338
[16]
Zhuo L, Cheng YC, Pan YT, et al. Prostate cancer with bone metastasis in Beijing: an observational study of prevalence, hospital visits and treatment costs using data from an administrative claims database[J]. BMJ Open, 2019, 9(6): e028214. DOI:10.1136/bmjopen-2018-028214
[17]
Gu XL, Guo TJ, Si YQ, et al. Association between ambient air pollution and daily hospital admissions for depression in 75 Chinese cities[J]. Am J Psychiatry, 2020, 177(8): 735-743. DOI:10.1176/appi.ajp.2020.19070748
[18]
中华人民共和国中央人民政府. 31个省(区、市)2022年地区生产总值均已出炉各省份GDP传递了啥信号[EB/OL]. (2023-02-06)[2023-03-23]. `http://www.gov.cn/xinwen/2023-02/06/content_5740185.htm.