中国公共卫生  2019, Vol. 35 Issue (4): 516-520   PDF    
人工智能技术在学校传染病聚集性疫情智能早期筛查与预警中的应用
吴军1, 陶沁1, 陈静1, 沈晓融1, 蒋琦1, 韩腊英2    
1. 贵州省疾病预防控制中心,贵阳 550004;
2. 贵州省清镇市疾病预防控制中心
摘要:为实现对学校传染病聚集性疫情早发现和早处置,贵州省疾病预防控制中心通过建立省级大数据计算中心,基于人工智能技术,通过机器自主学习历史上所有的传染病个案数据,掌握各医疗机构的医生填写患者详细信息的不同习惯方式,将填写的各种不同格式的单位信息进行规范化处理,通过自动感知技术对学校聚集性疫情进行智能筛查与风险预警,利用动态数据可视化技术,对处置过程进行实时监管,防止疫情蔓延,保护学生健康。
关键词聚集性     传染病     人工智能     早期筛查    
Preliminary application of intelligence technology in early screening and warning of infectious disease clustering in schools in Guizhou province
WU Jun, TAO Qin, CHEN Jing, et al     
Guizhou Provincial Center for Disease Control and Prevention, Guiyang, Guizhou Province 550004, China
Abstract: An artificial intelligence technology-based provincial-level large-scale data computing center has been established in Guizhou Provincial Center for Disease Control and Prevention for early detection and management of infectious disease clustering in schools. Standardized processing on all infectious disease incidence records previously reported in the province by medical personnel in medical institutions at various levels was performed by the computing system through machine self-learning. Artificial intelligence-based early screening and warning of infectious disease clustering in schools were realized with automatic perception technology. Real time supervision and regulation on disease epidemic management were carried out with dynamic data visualization technology. All the artificial intelligence technologies have been preliminarily applied and played an important role in infectious diseases control and prevention since 2016 in the province.
Key words: clustering     infectious disease     artificial intelligence     early screening    

传染病风险监测与早期预警是传染病预防与控制的重要工作内容之一,是防止疫情蔓延的重要方法,也是《中华人民共和国传染病防治法》规定的各级疾病预防控制机构的主要职责[1]。将传染病疫情预警信号尽可能前移,可尽早识别控制疫情蔓延势头,降低传染病带来的危害,最大程度保障人民群众身体健康。在国务院《关于印发新一代人工智能发展规划的通知》中提到促进人工智能在公共安全领域的深度应用,推动构建公共安全智能化监测预警与控制体系[2]。如何构建更加智能的公共卫生安全信息化平台一直是贵州省疾控信息化研究的重点。人工智能技术在公共卫生安全方面的应用是很有意义的尝试与实践,应用型信息化平台也将为全省居民提供强有力的健康保障。

1 传染病风险监测与早期预警现状和挑战 1.1 学校传染病聚集性疫情形式依然严峻

传染病聚集性疫情是指在一定的范围和时间内成簇发病,病例间具有流行病学关联的疫情。学校作为人群密集场所,学生日常生活相互间密切接触以及集中食宿,具有很高的传染病聚集发病风险[3]。2017年8月湖南省桃江县第四中学和桃江县职业中专学校先后发生2起学校肺结核聚集性疫情,引发了全社会广泛关注。聚集性病例的延迟发现很可能会造成疫情在人群中的扩散蔓延,一旦暴发流行不仅严重影响学生的身心健康,更会导致社会恐慌,该起学校聚集性肺结核疫情的发生,不仅凸显了传染病早期监测预警的重要性,同时也暴露了疾控机构在传染病聚集性疫情监测预警工作中存在着薄弱环节,也是疾控机构疫情监测部门今后工作中亟待解决的重要问题之一。为此,国家卫生计生委和教育部也对学校传染病聚集性疫情的早期发现与处置提出了更严格的要求[4]

1.2 学校传染病聚集性疫情早期筛查预警面临的困难

从2004年起,中国疾控中心建立了“传染病报告信息管理系统”,全国范围内实现了法定传染病个案信息的实时、在线报告,极大缩短了传染病报告的时间,为实现传染病聚集性疫情的早期筛查预警提供了必要条件[5]。但是,要做好学校传染病聚集性疫情早期筛查预警,还面临如下3个主要问题。

1.2.1 数据合规性问题

主要体现在“传染病报告信息管理系统”中填报的患者所在工作单位(学校)的详细地址信息,是任意文本方式填写,没有统一的标准编码,而详细地址中需要填写的“自然村(组、街道、门牌)、工作单位名称”这些新增变量、变动频繁,就算有统一编码也很难及时维护,因此具体填写的信息各式各样,中文、数字、符号等各种字符形式混杂,很难统计[67],致使学校聚集性病例的筛查分析变得较为复杂。

1.2.2 传染病属地化管理带来的跨区域问题

“传染病报告信息管理系统”是按照病人现住址以县级行政区域进行管理,而同一个学校的学生极有可能分属不同的县区,并且现住址和学校所在县区也不一致,在城市化建设高速发展的当下,这种情况十分普遍,因此,学校所在的县区疫情管理人员获得的信息很可能是不完整的,无法对学生这个特殊群体中的传染病疫情情况做出准确的判断。

1.2.3 信息孤岛问题

教育部门掌握的学校信息,和公共卫生部门没有对接[8],且在实际工作中对没有合法手续的学校(如农村的私立幼儿园、城乡接合部的农民工子弟学校等)无法全面掌握,因此,需要建立完整的、标准化的、可维护的学校信息。

2 开展传染病聚集性疫情预警大数据应用(图1
图 1 总体框架图

从2016年起贵州省探索利用大数据及人工智能等技术手段,针对学校聚集性疫情早期筛查、早期预警以及处置监管开展研究,基于传染病报告卡历史数据对工作单位详细信息进行规范化处理,并基于实时交换的传染病个案卡数据开展聚集性病例自动筛查与预警,提供智能化疫情处置管理信息化平台并在实际工作中予以应用[59]

2.1 建设贵州省疾控中心传染病数据中心

贵州省自2004年以来,通过“传染病报告信息管理系统”上报的传染病报告卡已超过370万张,数据项超过7亿条,每年新增报告卡超过30万张,收集到的数据量很大。按照中国疾病预防控制数据管理规定,在满足数据安全保护的条件下,将传染病历史数据迁移到省疾控中心,建立了贵州省传染病数据中心,并通过数据交换平台实现最新传染病个案数据实时交换,在不改变现有传染病报告方式前提下,保证数据的及时性,为下一步工作打下了基础。

2.2 生成学校信息基础数据库

当前人工智能成为新焦点,人工智能的迅速发展也正深刻改变着公共卫生监测和监管的方式方法。通过机器自主学习省内历史上传染病个案数据,重新组织传染病个案数据中的工作单位信息,以产生相对准确的学校名称及所属辖区的规范化信息,并随着数据的更新变化自行完善,构建标准化学校信息基础数据库。

2.3 智能筛查及预警信息发送

通过机器学习全省每个传染病报告医生对辖区学校信息的不同填写习惯和方式,与学校信息基础数据库比对,自动感知传染病个案数据,转为规范工作单位信息,实现基于现住址到村组和到家庭,工作单位到学校和班级的聚集性疫情自动筛查,努力提高筛查预警的准确性和时效性,再充分利用当前流行的移动应用技术,实现预警信息随时随地接收,及时处置,迅速反馈。

2.4 聚集性预警处置监管

基于地理信息系统,利用大数据技术,实现动态数据可视化,并与移动应用技术、网络安全技术整合,按照行政区划级别,对管辖范围内的各类传染病信息、聚集性疫情信息随时查看,实现领导层和管理层从宏观上及时掌握全省传染病疫情分布和处置情况。

3 关键技术设计 3.1 数据自动接入(图2
图 2 与中国疾病预防控制中心数据交换架构图

数据采集是开展传染病聚集性疫情预警大数据应用的基础和重点。之前,贵州省传染病信息报告的方式是由诊断医院在规定时限内,将传染病病例个案信息通过“中国疾病预防控制信息系统”(俗称“大疫情网”)上报[10],上报的传染病个案信息并没有回传到贵州省数据中心。为此,必须建立数据交换平台,首先实现国家大疫情网与贵州省数据库之间的数据实时回传,再逐步与报告传染病的医疗机构HIS系统实现传染病数据实时交换。

3.2 机器自主学习(图3
图 3 传染病报告卡规范化学习模型图

机器学习指模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。以对“贵阳市第一中学高三(一班)”机器学习为例:基于本省历史15年的传染病报告卡数据,首先根据工作单位文本相似度进行分组,工作单位填写为“一中”的1 000张卡,报告地属于贵阳市的100张卡,填写“贵阳一中”的300张,填写“高三(一班)”的20张,填写“贵阳市第一中学”的600张,通过决策合并为“贵阳市第一中学高三(一班)”,并将原始卡片的填写关键词与标准化的学校名称进行对照存入,新交换的传染病报告卡通过匹配关键词找到标化的学校名称,新报告卡继续作为机器学习样本,最终逐步形成全省比较规范的工作单位基础数据库,支撑后续智能筛查与预警。

3.3 智能筛查与预警

省疾控中心组织业务专家,将聚集性疫情分析和判断的技能传授给计算机,让计算机学会如何辨别学校聚集性疫情事件,以判定事件级别。把预警的相关阈值,包括区域、病种、时间范围、病例数、事件级别、预警用户等信息事先设置,采用时间序列模型、时空聚集性分析模型等进行组合预警[11],计算机模拟人给出判断,并将判断筛选结果信号及时推送给学校属地疫情管理人员。

3.4 预警处置和监管

系统发出聚集性预警信号后,信息通过响应中心发送给预警属地疾控中心和上级疾控中心,属地疫情管理人员对预警信息开展处置工作,核实相关信息,判定预警级别(散发、聚集性、突发、暴发),对聚集性疫情按照工作流程开展现场流行病学调查和传染病防控工作,并随时将结果反馈,系统对整个流程的时间点进行记录,自动监管事件是否开展了响应工作,以及响应和处置反馈的及时性。

4 应用实践 4.1 促进传染病聚集性疫情筛查工作开展,提高早发现能力(图4
图 4 贵州省聚集性疫情动态数据可视化显示页面

国家出于数据安全及隐私保护考虑,从2016年对传染病报告信息管理系统中的个案信息做了脱敏处理,省、市2级难于对县级开展聚集性病例筛查的工作情况进行监管。系统自2018年5月起,在全省各级101个疾控机构开始应用,6 — 11月6个月内,全省共发出传染病聚集性预警5 936起,经核实为聚集性疫情的1 814起,而2017年全年全省共报告聚集性疫情1 400余起。系统的应用,改变了之前县级疫情管理人员每天导出数据后,再进行人工筛查的方式,对聚集性病例筛查工作带来了2个好处:(1)减轻工作量,提高及时性和准确性;(2)防止少部分县区因人力有限或者工作责任心不够,聚集性筛查工作开展不好的现象发生。

4.2 加强对聚集性疫情处置工作全程监管,落实早控制措施(图5
图 5 贵州省聚集性疫情预警响应中心页面

系统全面部署使用后,实现了聚集性疫情处置信息反馈、过程监管信息化,强化对工作时效性的监督,健全了传染病“聚集性病例监测-早期预警 – 早期响应 – 处置过程监督 – 情况反馈”工作和监督机制,有效解决原来人工筛查模式下,因各种原因造成漏筛、不及时、不易监督等问题,目前全省传染病聚集性疫情自动预警,24 h之内及时响应率和处置率保持在95 %以上,实现了传染病疫情“早发现、早报告、早处置”,降低疫情蔓延风险。

4.3 为提高传染报告的数据质量提供帮助

通过对聚集性预警准确性分析,可发现目前传染病报告存在的数据质量问题,对卫生行政部门每年传染病报告督导检查工作提供切实的数据支撑,促进医疗机构改进或完善HIS系统,满足传染病报告要求的及时性、准确性、完整性。随着系统应用的深化发展,助力完善传染病报告质量控制体系,管理和技术结合起来,形成“报告 – >学习 – >筛查与质控 – >报告”数据质控闭环,进一步加强全省传染病报告的规范性,提高传染病保告的数据质量,从而提升聚集性预警以及传染病流行趋势分析的准确性。

5 小 结

基于人工智能技术探索学校聚集性疫情智能早期筛查与预警有着重要的实际意义,成果应用后得到贵州省各级疾控机构用户和卫生行政部门认可和支持,通过信息技术与疾控业务的结合,产生更多创新和深入的应用。在国家大力推动实施大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善的背景下,依托全民健康保障信息平台,整合医疗卫生和公共卫生的数据资源,开展跨部门跨学科的数据融合分析,实现更多大数据在公共卫生领域的应用,更好应对各种突发公共卫生事件,提升疾控机构传染病防控能力,为公共卫生,为人民大众健康服务。

参考文献
[1] 全国人民代表大会常务委员会. 中华人民共和国传染病防治法[Z]. 中华人民共和国主席令(第17号), 2004-8-28.
[2] 国务院. 国务院关于印发新一代人工智能发展规划的通知[Z]. 国发[2017] 35号, 2017-7-20.
[3] 马军. 中国学校卫生/儿少卫生发展[J]. 中国学校卫生, 2015, 36(1): 6–9.
[4] 国家卫生计生委, 教育部. 关于印发学校结核病防控工作规范(2017版)的通知[Z]. 国卫办疾控发[2017] 22号, 2017-6-26.
[5] 马家奇. 公共卫生大数据应用[J]. 中国卫生信息管理, 2014, 11(2): 174–181.
[6] 郑志伟, 龚晓春, 阳庆玲, 等. 文本分析在公共卫生领域中应用[J]. 中国公共卫生, 2018, 34(8): 1187–1191.
[7] 孟润堂, 罗艺, 宇传华, 等. 健康大数据在公共卫生领域中的应用与挑战[J]. 中国全科医学, 2015, 18(35): 4388–4392. DOI:10.3969/j.issn.1007-9572.2015.35.029
[8] 陈冰冰, 李保军. 海曙区学校传染病聚集性疫情监测分析[J]. 预防医学, 2018, 30(8): 812–815.
[9] 黄文龙, 陈长华, 洪荣涛, 等. 传染病与突发事件智能分析报告系统的研究与实现[J]. 中国公共卫生管理, 2015, 31(2): 146–150.
[10] 崔树峰, 石晶, 师伟. 网格化管理的区域流行病学调查系统设计[J]. 中国卫生信息管理杂志, 2014(6): 1–5.
[11] 杨维中主编. 传染病预警理论与实践[M]. 北京: 人民卫生出版社, 2012, 56-126, 302-312.