2. 云南省疾病预防控制中心, 疫情监测/突发公共卫生事件处置中心, 云南 昆明 650001
2019年12月暴发的新型冠状病毒肺炎(以下简称“新冠肺炎”)是对我国生产经济、疫情防控体系等的挑战。2020年9月14日召开的云南省新冠肺炎疫情防控工作电视电话会议要求,云南8个边境州(市)、25个边境县(市)立即进入抗疫“战时”状态。云南边境居住人口较多、出入境管控难度大,新冠肺炎的境外输入风险持续升高。
由于新发传染病疫情具有情境不确定的特征[1],日常防控单靠人为判断分析很容易发生病例误诊或漏诊的情况。在疫情暴发初期,若没有科学数据来支持决策,则可能延误最佳防控时机或造成过度防控。边境地区新发传染病防控预警涉及多部门信息联动、多源头数据开放共享以及疫情特征要素数据的收集,是政府部门进行疫情防控决策的关键依据,也是边境地区新发传染病疫情防控预警亟待解决的问题。
现以云南边境地区新冠肺炎疫情防控为例,基于大数据分析构建涉及多源头、多区域的新发传染病防控预警数据平台(以下简称“数据平台”),协助疫情防控决策,减少常态化防控预警工作的人力、物力投入,提升边境地区的传染病防控、诊治、预警能力,促进边境地区公安、出入境卫生检疫、移民管理、卫生健康等部门形成长期联防联控机制,使边境地区各级医疗卫生机构和相关部门的数据实现互联互通以完善新发传染病联防联控体系,以期为推进边境地区疫情防控信息化建设、节约疫情防控成本提供参考。
1 云南边境地区新冠肺炎防控预警存在的问题 1.1 人员流动大,难以开展有效的健康管理截至2020年7月,在新冠肺炎疫情防控过程中,云南边境地区累计管控入境人员8万多人。人员入境信息由各级疾病预防控制(以下简称“疾控”)机构人工填报,然后逐级上报、汇总,信息未实现联网共享,难免存在重复录入、录入错误等问题。同时,由于边境入境人员多、流动性大,缺少信息化手段的支撑,难以开展有效的健康管理和追踪,防范境外输入病例的压力巨大。
1.2 信息化建设滞后,难以有效利用多源头数据目前,云南边境出入境人员的核酸检测数据分别存储在疾控机构、医疗机构和第三方检测机构的数据库中,出入境人员基本信息、健康信息等数据又分别存储在公安、出入境管理、移民管理、卫生健康等部门。由于没有有效的汇总使用机制,边境新冠肺炎疫情防控相关数据“孤岛化”问题严重,数据没有统一的开发规范和标准,相关部门间缺乏数据共享机制,数据利用率低,无法实现数据互联互通。
1.3 传染病诊疗能力弱,远程诊疗系统不完善云南边境地区县级及以下医疗机构诊疗能力相对较弱,传染病,特别是新冠肺炎和新发传染病诊断治疗能力有限,在信息化程度低、数据未实现上下互联的情况下,难以通过远程诊疗快速确认新发传染病、迅速采取有效的治疗措施。
1.4 缺乏针对未知新发传染病的监测系统[2]经过多年实践,目前我国已建立法定传染病监测系统,而未明确病原的病例却无法及时报告,难以尽早发现可能的新发传染病流行[3]。
2 基于大数据分析构建数据平台的必要性随着大数据、物联网、云计算等信息技术的发展,大数据分析技术、新发传染病预测模型(如时间序列和动力学微分方程等)已十分成熟。因此,数据平台的建设有以下几方面必要性。
2.1 收集多源头数据,实现区域数据共享大数据分析可对边境地区学校、医院、边境口岸、疾控中心、公安等重点区域和部门的信息化建设进行统一规划部署,统一数据来源,实现区域数据共享,解决疫情防控信息孤岛和部门间数据差异问题。
2.2 进一步完善传染病信息上报通道,实现多源头新发传染病监测单源头上报制度容易导致延报,对新发传染病的监控难度较大。谷歌(Google)网络搜索流行性感冒分析技术的准确性已得到验证,建立多源头预警系统可以实时将监测数据上报到卫生防控部门,减少人为因素的影响。
2.3 实现防控预警数据标准化、可拓展、可再利用、互联互通,进一步促进新发传染病防控的联防联动推进边境地区区域医疗底层数据结构标准化,用关联分析技术分析数据间的关联,找出其中存在的规律,有助于卫生防控部门尽早掌握新发传染病的传播方式、传播地点等数据,进行科学防控。
3 数据平台模型构建 3.1 数据平台总体构架数据平台架设在省级卫生健康部门,通过县、市、省三级平台实现数据交换,采用Hadoop分布式文件系统(Hadoop distributed file system, HDFS)、物联网、关联分析、边缘计算等技术解决政府各部门间的数据开放和共享问题,可提高系统响应速度和应用处理效率,分析新发传染病的空间聚集密度,统计新发传染病的传染期,预测疾病传播速度等。
结合目前大数据产品的架构,研究提出了数据平台的总体架构。数据平台的总体架构自下而上依次为基础设施层、数据源层、数据采集层、数据存储层、数据分析层、数据管理层、数据应用层、数据标准体系和制度安全保障体系[4],见图 1。
![]() |
注:HDFS为Hadoop分布式文件系统(Hadoop distributed file system)[5],HBASE为Hadoop数据库(Hadoop database),ETL为数据仓库技术(extract,transform,load),XML为可扩展标记语言(extensible markup language),IaaS为基础设施即服务(infrastructure as a service)。 图 1 新发传染病防控预警数据平台的总体架构 |
数据平台整合多源头数据,主要包括临床诊疗数据、重点防控区域人员敏感特征数据(如高热等)、人员流动数据、互联网搜索数据等,实现部门数据开放共享,并建立新发传染病主题数据库。
3.2.1 构建省级身份主索引,建立新发传染病主题数据库统一管理进入平台的人员信息,建立人员身份的唯一主索引和唯一编码。在此基础上关联、整合临床诊疗数据(含既往病史、现病史、诊断、主诉等基本病例信息)、出入境时间、旅行史等多部门数据,形成包含人员流行病史的病例基本信息,导入新发传染病主题数据库。
3.2.2 根据新发传染病特征,分类存储和调用数据王天雷等[6]将新发传染病分为易感期、疾病期、结局期,课题组在收集数据时采用了该新发传染病发生发展时期模型,收集空间、时间、人口等方面的数据。新发传染病发生发展时期数据平台的数据来源见图 2。
![]() |
图 2 新发传染病发生发展时期新发传染病防控预警数据平台的数据来源 |
(1)易感期主题数据库。易感期人员数据统一存储于易感期主题数据库,同时对结局期的已感染人群采取主动筛查和人工干预等方式,以缩短未感染者的易感期,及时发现潜伏期患者。
(2)疾病期主题数据库。根据疾病不可识别期和可识别期的特征,建立疾病期主题数据库。在疾病不可识别期采用主动模糊筛查策略,若某区域的网络搜索、临床诊疗等特征数据高于往年,则进行初期预警排查,并分析区域的异常数据,提升发现异常数据的准确率,校正数据模型。在疾病可识别期(含已知的法定传染病和已知的新发传染病)采取人员防控和预警相结合的方式,收集确诊患者的诊疗数据以及疾病的空间、时间聚集数据,实时掌握准确的疫情数据。
(3)结局期主题数据库。结局期往往指疾病被治愈、患者死亡等,该阶段应重点对已确诊感染的患者及其周围处于易感期的患者进行主动筛查,将治愈病例纳入科研管理系统并触发随访系统,针对患者二次入院和疾病后期数据进行跟踪回访。
由于数据平台的数据具有海量存储、高速增长以及数据来源多元的特点,对平台内的多源头数据采取分类提取和存储的方式,一方面可以形成新发传染病防控的数据闭环,另一方面可以提高数据挖掘的效率。
4 数据平台应用程序功能模块设计 4.1 构建区域医疗服务平台医疗机构是新发传染病疫情防控的哨点和重点区域、临床诊疗数据提取的主要机构,临床诊疗数据的准确性和完整性在一定程度上决定了疫情防控部署的方向。临床诊疗数据的准确性取决于边境地区医疗机构医院信息系统(hospital information system, HIS)的覆盖率和数据整合程度。现根据边境地区医疗机构信息化建设情况,提出2种保证临床诊疗数据准确性的方案:①没有能力建设HIS的部分二级医院、乡镇卫生院、社区卫生服务中心、村卫生室等机构,可统一建设区域医疗服务平台,将临床医疗信息系统统一部署到各基层医疗卫生机构,以解决基层信息化建设投入不足的问题,统一临床诊疗数据的标准,为优质医疗资源下沉奠定信息化基础,解决基层机构因自行部署系统困难造成的数据孤岛及数据利用率低等问题;②已自建临床医疗信息系统的医疗机构,可对各系统中的数据进行清洗、提取、集成。
4.1.1 区域医疗服务平台架构设计区域医疗服务平台采用多中心、多区域的建设模式。目前通用的建设方式为“一中心多点”信息化建设模式,即多区域采用同一套系统,通过光纤进行数据传输。其优点是多区域可实现医疗数据互通共享,缺点是远距离传输可能造成数据延迟。针对数据延迟、边境地区覆盖面积广等问题,构建边境地区多区域医疗服务云系统时可采取边缘计算方式,边缘计算作为万物互联时代的关键技术[7],可有效解决数据延迟以及数据集中存储问题。基于边缘计算设计的区域医疗服务平台物理架构见图 3。
![]() |
注:HIS为医院信息系统(hospital information system),PACS为影像归档和通信系统(picture archiving and communication systems),EMR为电子病历(electronic medical record)。 图 3 基于边缘计算设计的区域医疗服务平台物理架构 |
区域医疗服务平台可实现多区域临床诊疗信息互联互通。医疗服务云系统除包括目前较为成熟的HIS、影像归档和通信系统(picture archiving and communication systems, PACS)、实验室信息管理系统(laboratory information management system, LIS)外,还根据边境地区人员流动性大等特点,结合物联网增加了预检分诊系统、防疫物资配送管理系统、诊后随访系统等。见图 4。
![]() |
注:HIS为医院信息系统(hospital information system),PACS为影像归档和通信系统(picture archiving and communication systems),LIS为实验室信息管理系统(laboratory information management system)。 图 4 新发传染病防控预警数据平台数据互联互通情况 |
预检分诊系统会提示医生对重点区域输入人员、密切接触者等高危人员开展有针对性的流行病学调查,避免发生盲报等情况。诊后随访系统除了对高危人员进行电话、微信随访外,还会对其二次就诊情况进行数据脱敏处理,防止人为因素等造成疾病二次暴发。防疫物资配送管理系统可实时上报各级医疗卫生机构防疫物资的最新库存量等物流信息,便于政府部门根据物资情况进行调配。
4.2 建立“互联网+医疗”区域传染病远程医疗平台边境地区医疗资源短缺,无法快速有效地对新发传染病进行确诊和治疗。通过连接远程设备将数据平台内的患者临床诊疗数据上传,可对不明症状病例进行互联网远程诊疗,由上级医疗机构的专家提供远程医疗服务,提高新发传染病的初筛准确率。在疾病暴发期,可通过远程医疗平台完成远程问诊、在线配药等诊疗流程,缓解疾病暴发造成的医疗资源“挤兑”现象。同时,数据平台还可在边境地区开展家庭医生签约、双向转诊等服务,促进医疗资源下沉。
4.3 建立新发传染病监控预警系统目前,我国不明原因肺炎预警系统的监测灵敏度取决于人为判断和逐层上报的速度。不明原因疾病预警系统建设尚处于空白阶段,新发传染病防控存在盲点。
4.3.1 未知新发传染病预警功能设计根据新发传染病聚集性发病的特点,数据平台可从时间、空间维度对出现相同症状且具有聚集特征的病例进行不同程度的预警。一旦出现同一病例重复就诊,相同症状多人就诊,家庭或集体、聚集发病等情况,数据平台可分析疾病的时间分布(发病时间等)、地区分布(患者工作单位、住址、流动轨迹等)、人群分布(患者性别、职业等)等数据,可以周为单位对家庭、社区、公共场所(餐厅、影院)、重点区域(学校、医院、工作地点)进行特征值监测。
研究根据《云南省卫生应急简明手册》中突发公共卫生事件的划分标准,适当调低了发生聚集性事件的预警阈值(表 1),以保证数据平台预警新发传染病的灵敏度。
表 1 发生聚集性事件的预警阈值 |
![]() |
对于已知的法定和非法定传染病采用单病例预警模式,即只要数据平台中的临床诊疗数据有确诊病例,均进行单病例预警,由疾控部门开展传染病调查。
4.4 新发传染病科研管理系统数据平台中海量的临床诊疗数据可与科研单位共享。通过手工或人工智能录入的方式,将边境地区历年传染病发病率、传染病分布区域、慢性病跟踪管理情况、传染病集中暴发时间、历年各种传染病暴发阈值等特征数据,添加至数据平台的特征数据库中,推动开展新发传染病诊断研究、用药情况分析以及预警模型校验等研究。
5 讨论与结论新冠肺炎疫情防控暴露了边境地区信息化建设方面的不足,也带来了新的启示。数据平台建设是一项长期工作,任重而道远。尽早建立统一的数据标准、提高数据可扩展性可促进边境医疗水平的提升。
5.1 政府主导平台建设,有助于政府部门信息共享、业务协同目前,云南省没有统一的数据平台,部门数据孤立存在。随着大数据时代的来临,后期数据治理将耗费大量资源。由政府主导建设数据平台,可加强政府参与,自上而下地规划信息系统有助于扩大应用范围,规范数据标准,降低数据治理难度,促进政府部门间信息共享普遍化、业务协同常态化。
5.2 建立出入境人员健康档案建立出入境人员健康档案,重点对由有不明原因发热、咳嗽等临床症状的输入人员引起和具有聚集性发病特征的病例进行监测,经由数据平台实时预警上报。
5.3 建立有效的数据监管机制,保护个人信息安全由于数据平台存有海量数据存储,保障信息安全十分重要。在安全保障方面,涉及数据平台全生命周期的软、硬件基础设施和数据存储均有实时安全保障和维护。在制度方面:建立实时监管机制,防止数据泄露;建立个人信息安全机制,对平台内人员信息数据进行分级管理,保证在使用信息的同时不泄露个人隐私。
综上所述,随着数据增长、数据分析技术日益成熟、城市化步伐加快,未来,多部门协同项目也会日益增多,打破部门、机构间的数据壁垒,建立数据共享互联互通机制是大势所趋。
·作者声明本文无实际或潜在的利益冲突
[1] |
王绍光. 深度不确定条件下的决策: 以新冠肺炎疫情为例[J]. 东方学刊, 2020(2): 1-7. |
[2] |
陶鹏, 童星. 新发传染病应急响应体系建设初探[J]. 学术研究, 2020(4): 8-13. DOI:10.3969/j.issn.1000-7326.2020.04.003 |
[3] |
黄平. 应对新发和再发传染病的挑战: 新发和再发传染病防治热点研讨会论文集[C]. 广州: 广东省预防医学会医学病毒学专业委员会, 2009: 5-10.
|
[4] |
杨崧. 智能医疗系统与大数据平台建设研究分析[J]. 数字化用户, 2019, 25(8): 179. DOI:10.3969/j.issn.1009-0843.2019.08.169 |
[5] |
王海星, 杨志清, 郭燕青, 等. 基于大数据的传染病监测预警方法及应用[J]. 预防医学论坛, 2020, 26(10): 796-798. |
[6] |
王天雷, 何一宁, 刘丽丽, 等. 新发病例: 新发生还是新发现[J]. 中华疾病控制杂志, 2020, 24(3): 249-252, 257. |
[7] |
林博, 张惠民. 基于边缘计算平台的分析与研究[J]. 电脑与信息技术, 2019, 27(4): 21-24, 47. DOI:10.3969/j.issn.1005-1228.2019.04.007 |