2. 青海省疾病预防控制中心
近年来,由经济全球化带来的环境恶化、人口骤增、流动性加剧等问题加剧了传染病的发生和流行〔1, 2〕,几乎每年均至少有一种新发传染病被发现〔3, 4〕。诊断传染病目前主要依据实验室检查结果,而在传染病突发现场条件有限,工作人员仅能根据患者症状、体征并结合经验和知识水平进行判断,难免会发生漏诊、误诊。为了提高传染病疫情现场判别的准确性、时效性及科学性,提高中国传染病防控能力,本研究构建了传染病辅助判别系统,现将结果报告如下。
1 材料与方法 1.1 数据来源数据主要来自于中国传染性疾病监测数据库、全球传染病流行病学网络、相关专著〔5〕和文献〔6, 7〕。
1.2 模型构建研究采用Bayes分类算法〔8〕,基本原理:设有j种疾病组成的“疾病集”:D=(D1,D2,D3,……,Dj),每种疾病均可能有k种”症状“X={X1,X2,……,Xk,},各种“症状”相互独立,某一患者的“症状”表现集就是k种“症状”的不同取值。各种“症状”的具体表现所组成的“症状”表现集X出现的概率分别记为:P (X|D1),P (X|D2),……,P (X|Dj),则根据Bayes条件概率公式,导出各种疾病的后验概率为:
其中,qj表示是各种疾病的当地发病率(如北京地区),P (Dj|X)表示在“症状”表现集X的情况下,出现各种疾病的可能性或概率。根据P (Dj|X)的大小判断该患者所患疾病,各P (Dj|X)之和等于1。如果j个条件概率中P (Dm|X)最大,则意味着对该“症状”表现集,患疾病Dm的可能性最大。
1.3 模型验证建立一个独立的测试集,数据来源于文献〔9,10,11,12,13〕中报道的疫情资料,包括一起幼儿园手足口病疫情调查〔13〕、某中小学流行性腮腺炎暴发的流行病学调查与控制〔10〕、一起细菌性痢疾暴发疫情调查〔12〕、某校甲肝暴发疫情的流行病学调查〔9〕和一起麻疹疫情调查报告〔11〕共5起疫情,用报道的案例资料对模型进行验证,评价模型准确性。
2 结 果 2.1 判别数据库的建立传染病判别数据库是辅助判别的基础,本研究构建了343种传染病各种症状、体征出现的概率,主要包括有发热、黄疸、腹泻、腹痛、呕吐、咳嗽、胸痛、咽痛和临床常规检验数据(如血常规、尿常规等),此外还包括各种暴露情况(如摄食、输血、性暴露等),共计184条记录。
2.2 模型验证结果(表 1)| 表 1 辅助判别模型在独立测试集上的诊断结果 |
收集了5起传染病疫情作为独立测试集来验证模型的准确性,其判别正确的传染病均排在第1位,其平均诊断精度约为60%。
2.3 甲型H1N1流感应用在甲型H1N1流感暴发的初期,本研究缺少甲型H1N1流感症状、体征的基础数据,但是该判别系统对疫情的初期防控仍然起到了一定的作用,主要表现为:在疫情的突发现场,在系统中输入患者的症状(发热、咽痛、咳嗽和头痛),该系统给出了89.2%的流行性感冒概率结果,这为初期的预防控制提供了辅助支持。随着甲型H1N1流感的持续发展及其确诊病例的增加,在判别数据库中添加了甲型H1N1流感症状、体征的数据,在系统中输入患者的症状(发热、咽痛、咳嗽、头痛和腹泻),系统则给出了92.7%的甲型 H1N1流感概率,在无实验室支持的条件下,提高了疫情判别的准确性。
3 讨 论从20世纪50年代开始,人们便着手进行!医疗诊断专家系统∀的研究工作〔14〕,其中具有代表性的是1976年美国斯坦福大学Sho rtlife等研制成功的用于鉴别细菌感染及治疗的医学专家系统MYC IN。目前最著名的便是GIDEON的辅助诊断系统〔6, 7〕,该系统是一款商业软件,限制了其广泛应用;同时该系统中的症状、体征与中国人的症状、体征并不完全相同,因此,在国内的应用受到限制。在国内,李晓毅等人〔8〕应用贝叶斯模型来进行传染病辅助判别,给出了一些理论上的探讨,但由于缺少传染病的判别数据库,尚未深入到实际应用阶段。本研究构建的传染病判别系统不仅具有相对完善的判别数据库,几乎包括了目前国内外的所有传染病数据,而且在国内首次被应用到了传染病疫情的实际防控中,事实证明其既可以用在辅助判别系统,也可以用作知识库,以及查询各种传染病的症状、体症,从而弥补工作人员的知识不足,提高疫情判别的准确性。
| 〔1〕 | 聂青和,白雪帆,冯志华,等.新发传染病现状与教学思考[J]. 中国实用内科杂志,2005,25(3):284-286. |
| 〔2〕 | 金连梅,杨维中.我国传染病预警工作研究现况分析[J].中国公共卫生,2008,24(7):845-846. |
| 〔3〕 | 相洪琴.新发传染病的威胁与控制策略[J].国外医学情报. 2006,27(12):12-14. |
| 〔4〕 | 洪涛,王健伟.我国传染病防治现状与挑战[J].中国实用内科杂志,2003,23(12):705-707. |
| 〔5〕 | 马亦林.传染病学[M].上海:上海科学技术出版社,2005. |
| 〔6〕 | Edberg SC.Global infectious diseases and epidemiology network (GIDEON):a world wide web based program for diagnosis and informatics in infectious diseases[J].Clinical Infectious Diseases, 2005,40(1):123-126. |
| 〔7〕 | Berger SA.G IDEON:a comprehensive web based resource for geographic medicine[J].International Journal of Health Geographics, 2005,4(1):10. |
| 〔8〕 | 李晓毅,徐兆棣.突发传染病的贝叶斯逐步分类判别[J].中国卫生统计,2009,26(3):323-327. |
| 〔9〕 | 侯兴佑,党继光.某校甲肝暴发疫情的流行病学调查[J].中国医药导报,2006,3(22):124. |
| 〔10〕 | 周江东,陆大钧.某中小学流行性腮腺炎暴发的流行病学调查与控制[J].宜春学院学报,2008,30(4):80-81. |
| 〔11〕 | 陆全银,李梦河.一起麻疹疫情暴发的调查报告[J].职业与健康,2008,24(22):2382. |
| 〔12〕 | 刘惠军.一起细菌性痢疾暴发疫情调查[J].首都公共卫生, 2007,1(5):218-219. |
| 〔13〕 | 祝绯飞.一起幼儿园手足口病疫情调查[J].浙江预防医学, 2008,20(6):27-28. |
| 〔14〕 | Tu JV.Advantages and disadvan tages of using artifical neural networks versus logistic regression for predicting medical outcomes[J].J Clin Epidemiol, 1996,49(11):1225-1231. |
2010, Vol. 26

, 宋宏彬1