﻿ 比例和率：概念内涵及其识别路线
 中华流行病学杂志  2022, Vol. 43 Issue (1): 105-111 PDF
http://dx.doi.org/10.3760/cma.j.cn112338-20210412-00307

0

#### 文章信息

Li Yaxin, Mu Yutong, Huang Zhuoying, Zhou Xiaoyu, Guo Yang, Sun Xiaodong, Zheng Yingjie

Proportion and rate: connotation and understanding route

Chinese Journal of Epidemiology, 2022, 43(1): 105-111
http://dx.doi.org/10.3760/cma.j.cn112338-20210412-00307

### 文章历史

1. 复旦大学公共卫生学院流行病学教研室/国家卫生健康委员会卫生技术评估重点实验室（复旦大学）/复旦大学公共卫生学院公共卫生安全教育部重点实验室，上海 200032;
2. 上海市疾病预防控制中心，上海 200032;
3. 北京大学深圳医院，深圳 518036

Proportion and rate: connotation and understanding route
Li Yaxin1 , Mu Yutong1 , Huang Zhuoying2 , Zhou Xiaoyu1 , Guo Yang3 , Sun Xiaodong2 , Zheng Yingjie1
1. Department of Epidemiology/Key Laboratory for Health Technology Assessment, National Health Commission/Key Laboratory of Public Health Safety, Ministry of Education, School of Public Health, Fudan University, Shanghai 200032, China;
2. Shanghai Municipal Center for Disease Control and Prevention, Shanghai 200032, China;
3. Peking University Shenzhen Hospital, Shenzhen 518036, China
Abstract: Proportion and rate have multiple and overlapping meanings, which blur their concepts. Based on the existence of the states and the occurrence of the events and their measuring process, we first put forward the concept of "cumulative number of states in point time". Considering the general meaning of "rate" in mathematics and the units of the elements in indexes, this paper puts forward the concept of "the change of cumulative number of states in point time", which is equal to the commonly acknowledged concept "number of incident event within observation period" or "absolute rate", and further constructs relative rate and proportion. Proportions can be classified into three types: time-point (or rate-type) constitutional proportion, time-period incidence proportion and their synthesis, time-period constitutional proportion. The essential difference between relative rate and time-period proportions is whether the observation period is regarded as a one-unit-length fixed period which would be further moved to the description of the indexes. Furthermore, the sources populations of relative rate and proportions are exclusively those at the beginning of the observation period. Thus, we established a unified identification route about ratios, proportions, and rates, the basic indicators of categorical data in populations. These are applicable to both fixed and dynamic populations. The paper aims to clarify the connotation of the indexes and the feasible understanding route and provide some reference for the population researchers.
Key words: Event    Proportion    Rate    Time-point    Time-period

(1)

“率”的含义在人群研究中的使用，可追溯至1693年英国天文学家埃德蒙·哈雷博士的第一张寿命表[11]或1825年英国保险统计师本杰明·贡培兹提出的“Intensity of Mortality”[12-13]。由于y可以是频数、频率、体重等表示任何含义的量，x可以是时间相关或无关的量，因此率的指标无统一的表达式[13]。在人群事件发生的描述上，虽然威廉·法尔于1838年就以“死亡概率（probability of dying）”和“死亡率（rate of mortality）”明确地区分了风险和率的精确含义[14-15]，然而历经多个学者的阐述与澄清[1, 15-17]，这两个概念的争议、误解和误用仍在延续[16]

1。彩色球问题：从一袋混有红色、蓝色和绿色球的袋子中随机抽取若干个，红色球出现的概率是多少? 这一问题中，球的色彩（涂色）是历史上已经发生的事件，目前球的颜色性质持续不变。彩色球问题的实质在于了解历史已发生的事件在当前所处的状态特征，仅涉及测量过程（图 1）。

 注：a：事件的发生过程；b：事件的测量过程 图 1 事件的发生和状态的存在及其测量过程

2。抛硬币问题：抛硬币若干次，出现正面的概率是多少? 这一问题中，硬币未抛出前，硬币出现正面（或反面）的事件尚未发生；抛硬币过程结束后，目测其是否正面。显然，这个问题涉及了从可能发生（或易感性）且尚未发生到真实发生及发生后的测量，其目的在于了解尚未发生的某一事件在未来发生的可能性，涉及发生和测量两个过程（图 1）。

 图 2 封闭人群在观察期（Δt）内事件发生数和状态累积数

(2)

(3)

1。同一时点的局部与整体：描述某时点的局部与整体之比。由上述可知，进行时点（如t0）观察时，局部（分子，s0）与整体（分母，n0）的同时点性和同单位（均为“例”），故这种比例（ ）无量纲，取值在[0, 1]，有时又被称为百分比（实际上应为百分比例）。从相关教材来看[1, 3-4]，描述这类比例时，即提出“构成”的含义，如“时点患病比例”。因此，本文将同一时点状态的局部与整体之比，定义为时点构成比例（time-point constitutional proportion，P0），即：

(4)

(5)

(6)
 注：n0代表总体人群；s0代表总体人群中具有某一状态的个体数；Δs0i和Δn0i分别代表第i次增加的人群调查数和具有某一状态的个体数 图 3 时点构成比例与率型构成比例的关系

2。时期的局部与时期起点的整体：事件发生的时期性及观察期起点人群的易感性，奠定了指标——时期事件发生比例（incidence proportion，IP）的基础，即：在关闭队列中，观察期起点易感人群（x0），经过一个固定的观察期（Δt）至观察终点，期间状态累积变化量（ ）与x0之商。即：

(7)

x0是观察期起点（t0）的易感人群数，为时点概念，其单位为例；故IP是时期概念的分子（Δst）与时点概念的分母（x0）之商。公式7又可表示为：

(8)

(9)

(10)

3。时期的局部与时期的整体：时期状态数是观察期起点状态累积数、观察期终点及起点状态累积数之差的综合（公式3）。假定有一个合适的时期状态数的来源人群（nu），则可将时期状态数占其来源人群的比例命名为时期构成比例（time-period constitutional proportion，P1），见公式11。

(11)
(12)
(13)

(14)

 图 4 固定队列（有失访）第i个观察期（Δti内事件发生情况

1。时期IP：若对第i个观察期的易感人群部分（x0i），在观察期（Δti）内的每一个体进行观察，其中失访者（li）的观察时长常以Δti/2估计，则整个人群经历的观察人时，pti，可表示为：

(15)

(16)
(17)

2。时期事件发生率（incident rate，IR）：由公式16，当我们将∆ti保留于公式中时，x0i*ti 是第i个固定观察期事件发生中所贡献人群经历，或人时，以此为分母即可计算时期事件发生率，或可称为相对率（relative rate），即：第i个观察期起点有效易感人群数（x0i*），经过一定的观察期（∆ti）后，该人群事件累积发生数的变化量（∆si）。因此，整个观察期（∆t）内实际事件发生累积数的变化量为∆s = ∑∆si，而观察的总人时为∑xi0*ti二者之商（∆t的影响已体现在指标IR的分母——∆ti之中）即：

(18)

3。时期构成比例：以第i个观察期中全人群关闭队列为例，第i个观察期人群的构成比例原则上可仍按照上述“时期的局部与时期的整体”来计算。该指标反映了第i个观察期人群中任一个体具有某一状态的概率，或这概率的时间均值。由于时期构成比例涉及易感者和非易感者可能不同的人群动态变化特征，整个观察期状态比例的计算较为复杂，值得继续进行研究。

 注：变量的含义见文中；a “比”的概念清晰，不再赘述 图 5 人群频率基本分类及关系

(19)

 [1] 曾光. 现代流行病学方法与应用[M]. 北京: 北京医科大学、中国协和医科大学联合出版社, 1994. Zeng G. Modern epidemiology methods and applications[M]. Beijing: Beijing Medical University, Chinese Union Medical University Press, 1994. [2] 王若涛, 罗凤基, 严立. 对疾病分布指标的再认识[J]. 中国卫生统计, 1995, 12(4): 56-57. Wang RT, Luo FJ, Yan L. Rethinking diseases' distribution measuring indexes[J]. Chin J Health Statist, 1995, 12(4): 56-57. [3] 赵耐青, 陈锋. 卫生统计学[M]. 北京: 高等教育出版社, 2008. Zhao NQ, Chen F. Health statistics[M]. Beijing: Higher Education Press, 2008. [4] 金丕焕, 陈锋. 医用统计方法[M]. 3版. 上海: 复旦大学出版社, 2009. Jin PH, Chen F. Public health preventive medicine[M]. 3rd ed. Shanghai: Fudan University Press, 2009. [5] 沈红兵, 齐秀英. 流行病学[M]. 9版. 北京: 人民卫生出版社, 2018. Shen HB, Qi XY. Epidemiology[M]. 9th ed. Beijing: People's Medical Publishing House, 2018. [6] 钱宇平. 流行病学[M]. 北京: 人民卫生出版社, 1990. Qian YP. Epidemiology[M]. Beijing: People's Medical Publishing House, 1990. [7] 陆召军, 庄勋. 流行病学[M]. 南京: 东南大学出版社, 2008. Lu ZJ, Zhuang X. Epidemiology[M]. Nanjing: Southeast University Press, 2008. [8] 同济大学数学系. 高等数学[M]. 7版. 北京: 高等教育出版社, 2014. School of Mathematical Sciences, Tongji University. Advanced mathematics[M]. 7th ed. Beijing: Higher Education Press, 2014. [9] 孙伟民, 黄大贶. 医用高等数学[M]. 上海: 上海科学技术文献出版社, 1993. Sun WM, Huang DK. Medical advanced mathematics[M]. Shanghai: Shanghai Scientific & Technical Press, 1993. [10] Stewart J. Essential calculus[M]. 2nd ed. Belmont: Brooks/Cole, Cengage Learning, 2013. [11] Halley E. An estimate of the degrees of the mortality of mankind, drawn from curious tables of the births and funerals at the city of Breslaw, with an attempt to ascertain the price of annuities upon lives[J]. Philosophical Transactions, 1693, 17: 596-610. DOI:10.1098/rstl.1693.0007 [12] Eyler JM. Constructing vital statistics: Thomas Rowe Edmonds and William Farr, 1835-1845[J]. Soz Präventivmed, 2002, 47(1): 6-13. DOI:10.1007/BF01318400 [13] Gompertz B. On the nature of the function expressive of the law of human mortality, and on a new mode of determining the value of life contingencies[J]. Philos Trans Roy Soc London, 1825, 115: 513-583. DOI:10.1098/rstl.1825.0026 [14] Vandenbroucke JP. Continuing controversies over "risks and rates"—more than a century after William Farr's "On prognosis"[J]. Soz Präventivmed, 2003, 48(4): 216-218. DOI:10.1007/s00038-003-3073-8 [15] Farr W. On prognosis[J]. Br Med lmanack, 1838, 48(4): 199-216. DOI:10.1007/s00038-003-3004-8 [16] Elandt-Johnson RC. Definition of rates: some remarks on their use and misuse[J]. Am J Epidemiol, 1975, 102(4): 267-271. DOI:10.1093/oxfordjournals.aje.a112160 [17] Vandenbroucke JP. On the rediscovery of a distinction[J]. Am J Epidemiol, 1985, 121(5): 627-628. DOI:10.1093/aje/121.5.627 [18] 郑英杰, 刘海燕, 于波, 等. 观察与实验: 因果视角[J]. 中华流行病学杂志, 2021, 42(10): 1863-1870. Zheng YJ, Liu HY, Yu B, et al. Observation and experiment: a causal perspective[J]. Chin J Epidemiol, 2021, 42(10): 1863-1870. DOI:10.3760/cma.j.cn112338-20201224-01437 [19] Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research: principles and quantitative methods[M]. Belmont, California: Wiley, 1982. [20] Kaplan EL, Meier P. Nonparametric estimation from incomplete observations[J]. J Am Stat Assoc, 1958, 53(282): 457-481. DOI:10.1080/01621459.1958.10501452 [21] Miettinen OS. Theoretical epidemiology: principles of occurrence research in medicine[M]. New York: Wiley, 1985. [22] Vose D. Risk analysis: a quantitative guide[M]. 3rd ed. New Jersey: John Wiley & Sons, 2014. [23] Bass M. Approaches to the denominator problem in primary care research[J]. J Fam Pract, 1976, 3(2): 193-195. [24] Cherkin DC, Berg AO, Phillips WR. In search of a solution to the primary care denominator problem[J]. J Fam Pract, 1982, 14(2): 301-309. DOI:10.1016/0021-9681(82)90122-9 [25] Krogh-Jensen P. The denominator problem[J]. Scand J Prim Health Care, 1983, 1(2): 53. DOI:10.3109/02813438309034933 [26] Morrison CN, Rundle AG, Branas CC, et al. The unknown denominator problem in population studies of disease frequency[J]. Spat Spatiotemporal Epidemiol, 2020, 35: 100361. DOI:10.1016/j.sste.2020.100361 [27] Vandenbroucke JP, Pearce N. Incidence rates in dynamic populations[J]. Int J Epidemiol, 2012, 41(5): 1472-1479. DOI:10.1093/ije/dys142