中国媒介生物学及控制杂志  2018, Vol. 29 Issue (5): 439-441

扩展功能

文章信息

葛军旗, 李镜辉, 马永康, 龚正达
GE Jun-qi, LI Jing-hui, MA Yong-kang, GONG Zheng-da
基于信息熵的动物鼠疫流行强度定量化初探
The preliminary quantitative description of epidemic intensity in enzootic plague based on information entropy theory
中国媒介生物学及控制杂志, 2018, 29(5): 439-441
Chin J Vector Biol & Control, 2018, 29(5): 439-441
10.11853/j.issn.1003.8280.2018.05.004

文章历史

收稿日期: 2018-06-11
网络出版时间: 2018-08-03 17:13
基于信息熵的动物鼠疫流行强度定量化初探
葛军旗1, 李镜辉2, 马永康3, 龚正达3,4     
1 北京市朝阳区疾病预防控制中心, 北京 100021;
2 中国疾病预防控制中心传染病预防控制所, 北京 102206;
3 云南省地方病防治所, 云南 大理 671000;
4 云南省寄生虫病防治所, 云南 普洱 665000
摘要: 目的 探索使用信息熵公式测量动物鼠疫流行强度的可行性。方法 基于信息熵公式构建动物鼠疫的流行强度公式Ia,尝试用该公式计算8个疫点(乡镇数≥8)模拟数据的流行强度,并对1982-2005年云南省盈江、陇川两个县疫情数据的流行强度进行Spearman相关分析。结果 模拟数据的流行强度结果显示,8个疫点集中于1个乡镇时,动物鼠疫的流行强度最小(Ia=0.288),8个乡镇均有疫情时,动物鼠疫的流行强度最大(Ia=2.079),在疫点相同的情况下,疫情涉及的乡镇数越多,流行强度越大;疫情数据的流行强度显示,盈江和陇川县动物鼠疫流行强度最大的年份分别出现在1995年(Ia=2.107)和1990年(Ia=1.642);盈江县动物鼠疫流行强度最大的年份出现在1995年(Ia=2.107),而不是发生疫点数最多的1993年(Ia=1.885)。对2个县Ia做Spearman相关分析,相关系数为0.301(P=0.150),显示2个县动物鼠疫流行情况不存在统计学上的关联。结论 流行强度公式能够区分鼠疫疫情的复杂性和层次结构,使动物鼠疫流行强度在同一疫源地的不同时段、或同一时段不同疫源地之间产生可比性。
关键词: 信息熵     鼠疫     流行强度    
The preliminary quantitative description of epidemic intensity in enzootic plague based on information entropy theory
GE Jun-qi1, LI Jing-hui2, MA Yong-kang3, GONG Zheng-da3,4     
1 Chaoyang District Center for Disease Control and Prevention, Beijing 100021, China;
2 National Institute for ommunicable Disease Control and Prevention, Chinese Center for Disease Control and Prevention;
3 Yunnan Institute of Endemic Diseases Control and Prevention;
4 Yunnan Institute of Parasitic Diseases Control and Prevention
Supported by the Municipal Natural Science Foundation of Beijing of China (No. 7173262)
Abstract: Objective To explore the feasibility using information entropy formula to measure the epidemic intensity of enzootic plague. Methods The epidemic intensity formula named Ia for enzootic plague based on the information entropy formula was proposed, and used to calculate the epidemic intensity of hypothetical data in 8 epidemic foci (the number of township ≥ 8). The spearman correlation coefficient of the epidemic intensity between Yingjiang and Longchuan counties during 1982-2005 was calculated. Results The epidemic intensity of the hypothetical data showed that the epidemic intensity was the smallest (0.288) when 8 foci were concentrated in 1 townships, while the largest (2.079) when 8 townships each had 1 epidemic focus; with the same foci, the more townships involved in the epidemic, the greater the prevalence intensity. The largest epidemic intensity of Yingjiang (2.107) and Longchuan (1.642) were discovered in 1995 and 1990 respectively; the biggest epidemic intensity of Yingjiang appeared in 1995 (Ia=2.107), rather than in 1993 (Ia=1.885) with the most epidemic foci. The correlation coefficient of epidemic intensity in two counties was 0.301 (P=0.150), which showed that there was no statistical correlation. Conclusion The formula verified by simulated and actual data is proved to be able to describe the features of complexity and hierarchical structure of plague epidemic, and make possible the comparisons of epidemic intensity temporally and spatially.
Key words: Information entropy     Plague     Epidemic intensity    

任何学科逐步成熟的重要标志,就是它的一些重要概念从定性走向定量化[1]。在鼠疫防控工作中,动物鼠疫流行强度的大小通常根据动物鼠疫发生的疫点数、流行面积或检菌量等来主观评估划分[2-4],一直缺乏客观的定量化描述,导致鼠疫防控工作中积累的大量珍贵疫情资料未得到充分挖掘利用,无法与宿主动物监测资料、媒介蚤类监测资料和重要环境因素等进行深入的统计学分析。

信息熵概念最早由Shannon[5]提出,可以测度系统状态的复杂程度,在诸多学科领域都得到广泛应用[6],近年来在鼠疫宿主多样性、媒介蚤多样性及其与鼠疫流行关系研究方面也有应用[7-9],为鼠疫疫源地复杂生态系统研究提供了新途径。本研究尝试使用信息熵,根据疫点数来测量家鼠型动物鼠疫的流行强度。

1 材料与方法 1.1 数据来源

在家鼠型鼠疫疫源地,动物鼠疫疫点被定义为具备动物鼠疫诊断标准之一的自然村或街道,构建用于家鼠型动物鼠疫流行强度计算的模拟数据,参数包括疫情年份、疫情发生乡镇和疫点数3个要素,设某年某县发生了8个疫点、乡(镇)数≥8,共构建出22种疫点分布状态。云南省盈江和陇川县1982-2005年的动物鼠疫疫情数据来源于云南省地方病防治所。

1.2 研究方法

为了区别于信息熵H,用Ia表示鼠疫的流行强度,它被定义为一定时空范围内疫点数量及分布特征的度量。

式中,Ia为监测县某年的动物鼠疫流行强度;ni为监测县该年每个乡镇的动物鼠疫疫点数;N为监测县该年的动物鼠疫总疫点数。

由于鼠疫具有传播速度快的特点,假设首发疫点周围一定范围内的疫点具有同质性。公式中把这个空间范围定义为乡(镇),因为乡(镇)具有以下特点:①地域跨度小、景观异质性相对较低;②乡(镇)间面积相差不大(个别间会有较大的差异),便于比较;③疫情资料易于收集。时间范围则以1年为单位。统计某监测县某年发生动物鼠疫疫情的乡镇数,每个乡(镇)的疫点数ni,该县该年份的总疫点数N,代入上式,就可以得出该年该监测县动物鼠疫的流行强度Ia。为区分无疫情和仅1个乡(镇)有疫情的情况,在定义无疫情时,Ia=0;仅1个乡(镇)有疫情时,Ia=Ia-2s,为该监测县动物鼠疫的平均流行强度,s为标准差。

2 结果 2.1 模拟数据的流行强度计算

8个疫点在某县有(乡镇数≥8)22种疫点分布状态,分别计算其流行强度Ia表 1)。从Ia计算结果可以看出,疫点数相同时,一个县范围内发生动物鼠疫疫情的乡(镇)数越多,动物鼠疫的流行强度越大;乡(镇)数相同时,疫点在各乡(镇)中分布越均衡,动物鼠疫的流行强度越大。反之,发生动物鼠疫疫情的乡(镇)数越少,或动物鼠疫疫情越相对集中于某些乡(镇),动物鼠疫的流行强度越小。

表 1 云南省盈江和陇川县8个疫点不同分布状态下的动物鼠疫流行强度 Table 1 The epidemic intensity Ia of enzootic plague in 8 foci of different distribution status
2.2 疫情数据的流行强度计算

用云南省盈江和陇川县1982-2005年家鼠型动物鼠疫疫情数据分别计算动物鼠疫流行强度Ia表 2),验证Ia在实际工作中的效果及作用。从计算结果可以看出,盈江和陇川县动物鼠疫流行强度最大的年份分别出现在1995年(2.107)和1990年(1.642);盈江县动物鼠疫流行强度最大的年份出现在1995年(Ia=2.107),而不是发生疫点数最多的1993年(1.885)。对2个县Ia做Spearman相关分析,相关系数为0.301(P=0.150),显示2个县动物鼠疫流行情况不存在统计学上的关联。

表 2 1982-2005年云南省盈江和陇川县家鼠型动物鼠疫的流行强度 Table 2 The epidemic intensity Ia of rodent-borne plague in Yingjiang and Longchuan counties during 1982-2005
3 讨论

疫点数和流行面积都是基于空间广度动物鼠疫流行状态的简单数学描述。疫点数虽不及流行面积精确,但比流行面积更易获得,通常作为判断动物鼠疫流行强度的指标之一。然而,以疫点数评估动物鼠疫流行强度存在缺陷,其忽视了动物鼠疫流行的层次结构。在动物鼠疫流行中,存在一点暴发与多点暴发的区别。以家鼠型鼠疫为例,若仅有一个首发疫点[10],其他疫点在首发疫点周围排列,提示极有可能是一次流行,即一点暴发;而倘若有2个或以上的首发疫点,其他疫点在各自首发疫点周围排列,则可能是多点暴发。即使疫点数或流行面积相同,这两种情形的流行强度也是不等同的,后者的流行强度明显大于前者。

也有以鼠疫菌检出量来划分动物鼠疫流行强度的报道[3]。但鼠疫菌检出量受鼠疫静息期特性和流行期采样量影响[10-11]:静息期时,鼠疫菌检出率极低;流行期时,鼠疫菌检出率迅速增高,此时检测鼠类数量越多,鼠疫菌检出量越大[10]。因此,以鼠疫菌检出量作为判断动物鼠疫流行强度的指标并不合适。

鼠疫疫情控制时需要划定疫点和疫区,因而在长期的鼠疫防控工作中积累了大量的疫点和疫区资料。基于这些资料,应用信息熵测量动物鼠疫流行强度是传染病流行强度定量化描述的有益尝试。对于每个鼠疫自然疫源地的每一时刻均能计算1个流行强度,从而使同一疫源地的不同时间阶段、同类型的多个疫源地之间产生可比性,符合鼠疫疫情统计分析发展的需要,有助于深入探讨鼠疫的流行规律。

动物鼠疫流行强度Ia具有时间属性、地域性和层次性,权衡了鼠疫的流行特点,初步证明能够较好地度量动物鼠疫流行强度。但是,流行强度Ia只是流行状态的信息度量,它并不代表动物间鼠疫流行的实际情况,能否真正适用于动物鼠疫流行强度的描述尚需开展更深、更广泛的研究。

参考文献
[1]
王彬. 熵与信息[M]. 西安: 西北工业大学出版社, 1994: 123.
[2]
米景川, 李仲来, 吕卫东, 等. 内蒙古北部荒漠草原沙鼠鼠疫流行强度的预报模型[J]. 中国地方病防治杂志, 1997, 12(2): 109-112.
[3]
李仲来, 李书宝, 周方孝. 黄鼠鼠疫流行范围和强度与鼠蚤关系的研究[J]. 中国地方病防治杂志, 1998, 13(3): 135-136, 191.
[4]
杨春光, 赵文红, 董兴齐. 云南省家鼠鼠疫流行特征与强度分析[J]. 中国媒介生物学及控制杂志, 2007, 18(3): 226-229. DOI:10.3969/j.issn.1003-4692.2007.03.016
[5]
Shannon CE. The mathematical theory of communication. 1963[J]. MD Comput, 1997, 14(4): 306-317. DOI:10.1002/j.1538-7305.1948.tb00917.x
[6]
张登兵, 刘思峰. 熵与系统有序性研究综述[J]. 数学的实践与认识, 2008, 38(24): 200-206.
[7]
李栋, 龚正达. 云南省小型兽类区系与多样性的研究概况[J]. 中国媒介生物学及控制杂志, 2011, 22(1): 89-93, 97.
[8]
王启果, 曹汉礼, 孟卫卫, 等. 准噶尔盆地鼠疫自然疫源地鼠体蚤类群落及其在动物鼠疫流行病学中的作用[J]. 中国媒介生物学及控制杂志, 2013, 24(1): 11-16.
[9]
汤丽, 张长国, 邵宗体, 等. 云南省玉龙鼠疫疫源地蚤类群落结构与物种多样性[J]. 中国媒介生物学及控制杂志, 2017, 28(3): 201-204. DOI:10.11853/j.issn.1003.8280.2017.03.002
[10]
李贵昌, 马永康, 李镜辉, 等. 1999-2004年云南省家鼠型鼠疫鼠间疫点发现方式调查[J]. 中国媒介生物学及控制杂志, 2005, 16(6): 453-455. DOI:10.3969/j.issn.1003-4692.2005.06.016
[11]
高少坤, 史献明, 杜国义. 河北省鼠疫自然疫源地动物鼠疫流行静息期探讨[J]. 中国媒介生物学及控制杂志, 2018, 29(2): 191-193. DOI:10.11853/j.issn.1003.8280.2018.02.020