中国公共卫生  2010, Vol. 26 Issue (12): 1491-1492   PDF    
传染病辅助判别系统建立及应用效果评价
王立贵1, 董世存2, 郝荣章1, 褚宸一1, 王勇1, 刘雪林1, 邱少富1, 宋宏彬1    
1. 中国人民解放军疾病预防控制所传染病控制中心, 北京100071;
2. 青海省疾病预防控制中心
摘要: 目的 通过建立传染病辅助判别系统,避免传统的经验判断与个人的主观因素影响而带来的决策失误,提高传染病疫情现场判别的准确性、时效性及科学性。方法 收集343种传染病症状、体征数据,运用贝叶斯算法建立分类模型。结果 应用该系统对多起传染病疫情进行分析,判别排在第1位的传染病均与实际相符,其平均的诊断精度约为60%,在甲型H1N1流感疫情的实际应用中精度为92.7%。结论 该系统降低了疫情处置工作中的漏诊、误诊率,增加了传染病疫情诊断的准确性。
关键词: 传染病     诊断     模型    
Auxiliary diagnosis system of infectious diseases and its application
WANG Li-gui, DONG Shi-cun, HAO Rong-zhang,et al    
Institute of Disease Control and Prevention of People's Liberation Army, Beijing 100071, China
Abstract: Objective To establish an auxiliary diagnosis system of infectious disease and to improve the accuracy, time liness in the diagnosis of infectious disease.Methods The data on 343 kinds of infectious disease symptoms,signs were collected and Baye sian classification model was constructed.Results The correct identification of infectious diseases was ranked first, with about 60% of the averaged iagnostic accuracy,and the accuracy was 92.7% in the practical application of H1N1 in fluenza outbreak.Conclusion The system enables a more rational and accurate diagnosis of infectious disease through reducing misdiagnosis and improving the accuracy of diagnosis of infectious disease.
Key words: infectious disease     diagnosis     model    

近年来,由经济全球化带来的环境恶化、人口骤增、流动性加剧等问题加剧了传染病的发生和流行1, 2,几乎每年均至少有一种新发传染病被发现3, 4。诊断传染病目前主要依据实验室检查结果,而在传染病突发现场条件有限,工作人员仅能根据患者症状、体征并结合经验和知识水平进行判断,难免会发生漏诊、误诊。为了提高传染病疫情现场判别的准确性、时效性及科学性,提高中国传染病防控能力,本研究构建了传染病辅助判别系统,现将结果报告如下。

1 材料与方法 1.1 数据来源

数据主要来自于中国传染性疾病监测数据库、全球传染病流行病学网络、相关专著5和文献6, 7

1.2 模型构建

研究采用Bayes分类算法8,基本原理:设有j种疾病组成的“疾病集”:D=(D1,D2,D3,……,Dj),每种疾病均可能有k种”症状“X={X1,X2,……,Xk,},各种“症状”相互独立,某一患者的“症状”表现集就是k种“症状”的不同取值。各种“症状”的具体表现所组成的“症状”表现集X出现的概率分别记为:P (X|D1),P (X|D2),……,P (X|Dj),则根据Bayes条件概率公式,导出各种疾病的后验概率为:

其中,qj表示是各种疾病的当地发病率(如北京地区),P (Dj|X)表示在“症状”表现集X的情况下,出现各种疾病的可能性或概率。根据P (Dj|X)的大小判断该患者所患疾病,各P (Dj|X)之和等于1。如果j个条件概率中P (Dm|X)最大,则意味着对该“症状”表现集,患疾病Dm的可能性最大。

1.3 模型验证

建立一个独立的测试集,数据来源于文献9,10,11,12,13中报道的疫情资料,包括一起幼儿园手足口病疫情调查13、某中小学流行性腮腺炎暴发的流行病学调查与控制10、一起细菌性痢疾暴发疫情调查12、某校甲肝暴发疫情的流行病学调查9和一起麻疹疫情调查报告11共5起疫情,用报道的案例资料对模型进行验证,评价模型准确性。

2 结 果 2.1 判别数据库的建立

传染病判别数据库是辅助判别的基础,本研究构建了343种传染病各种症状、体征出现的概率,主要包括有发热、黄疸、腹泻、腹痛、呕吐、咳嗽、胸痛、咽痛和临床常规检验数据(如血常规、尿常规等),此外还包括各种暴露情况(如摄食、输血、性暴露等),共计184条记录。

2.2 模型验证结果(表 1)
表 1 辅助判别模型在独立测试集上的诊断结果

收集了5起传染病疫情作为独立测试集来验证模型的准确性,其判别正确的传染病均排在第1位,其平均诊断精度约为60%。

2.3 甲型H1N1流感应用

在甲型H1N1流感暴发的初期,本研究缺少甲型H1N1流感症状、体征的基础数据,但是该判别系统对疫情的初期防控仍然起到了一定的作用,主要表现为:在疫情的突发现场,在系统中输入患者的症状(发热、咽痛、咳嗽和头痛),该系统给出了89.2%的流行性感冒概率结果,这为初期的预防控制提供了辅助支持。随着甲型H1N1流感的持续发展及其确诊病例的增加,在判别数据库中添加了甲型H1N1流感症状、体征的数据,在系统中输入患者的症状(发热、咽痛、咳嗽、头痛和腹泻),系统则给出了92.7%的甲型 H1N1流感概率,在无实验室支持的条件下,提高了疫情判别的准确性。

3 讨 论

从20世纪50年代开始,人们便着手进行!医疗诊断专家系统∀的研究工作14,其中具有代表性的是1976年美国斯坦福大学Sho rtlife等研制成功的用于鉴别细菌感染及治疗的医学专家系统MYC IN。目前最著名的便是GIDEON的辅助诊断系统6, 7,该系统是一款商业软件,限制了其广泛应用;同时该系统中的症状、体征与中国人的症状、体征并不完全相同,因此,在国内的应用受到限制。在国内,李晓毅等人8应用贝叶斯模型来进行传染病辅助判别,给出了一些理论上的探讨,但由于缺少传染病的判别数据库,尚未深入到实际应用阶段。本研究构建的传染病判别系统不仅具有相对完善的判别数据库,几乎包括了目前国内外的所有传染病数据,而且在国内首次被应用到了传染病疫情的实际防控中,事实证明其既可以用在辅助判别系统,也可以用作知识库,以及查询各种传染病的症状、体症,从而弥补工作人员的知识不足,提高疫情判别的准确性。

参考文献
〔1〕 聂青和,白雪帆,冯志华,等.新发传染病现状与教学思考[J]. 中国实用内科杂志,2005,25(3):284-286.
〔2〕 金连梅,杨维中.我国传染病预警工作研究现况分析[J].中国公共卫生,2008,24(7):845-846.
〔3〕 相洪琴.新发传染病的威胁与控制策略[J].国外医学情报. 2006,27(12):12-14.
〔4〕 洪涛,王健伟.我国传染病防治现状与挑战[J].中国实用内科杂志,2003,23(12):705-707.
〔5〕 马亦林.传染病学[M].上海:上海科学技术出版社,2005.
〔6〕 Edberg SC.Global infectious diseases and epidemiology network (GIDEON):a world wide web based program for diagnosis and informatics in infectious diseases[J].Clinical Infectious Diseases, 2005,40(1):123-126.
〔7〕 Berger SA.G IDEON:a comprehensive web based resource for geographic medicine[J].International Journal of Health Geographics, 2005,4(1):10.
〔8〕 李晓毅,徐兆棣.突发传染病的贝叶斯逐步分类判别[J].中国卫生统计,2009,26(3):323-327.
〔9〕 侯兴佑,党继光.某校甲肝暴发疫情的流行病学调查[J].中国医药导报,2006,3(22):124.
〔10〕 周江东,陆大钧.某中小学流行性腮腺炎暴发的流行病学调查与控制[J].宜春学院学报,2008,30(4):80-81.
〔11〕 陆全银,李梦河.一起麻疹疫情暴发的调查报告[J].职业与健康,2008,24(22):2382.
〔12〕 刘惠军.一起细菌性痢疾暴发疫情调查[J].首都公共卫生, 2007,1(5):218-219.
〔13〕 祝绯飞.一起幼儿园手足口病疫情调查[J].浙江预防医学, 2008,20(6):27-28.
〔14〕 Tu JV.Advantages and disadvan tages of using artifical neural networks versus logistic regression for predicting medical outcomes[J].J Clin Epidemiol, 1996,49(11):1225-1231.