文章信息
- 郭彧, 余灿清, 吕筠, 俞敏, 钱璞毅, 韩晓, 孙点剑一, 李立明.
- Guo Yu, Yu Canqing, Lyu Jun, Yu Min, Qian Puyi, Han Xiao, Sun Dianjianyi, Li Liming
- 大型自然人群队列示范研究进展与成果
- Progress and achievements of large natural population cohort demonstration study
- 中华流行病学杂志, 2023, 44(1): 1-6
- Chinese Journal of Epidemiology, 2023, 44(1): 1-6
- http://dx.doi.org/10.3760/cma.j.cn112338-20221020-00893
-
文章历史
收稿日期: 2022-10-20
2. 国家心血管疾病临床医学研究中心, 北京 102300;
3. 北京大学公共卫生学院流行病与卫生统计学系, 北京 100191;
4. 北京大学公众健康与重大疫情防控战略研究中心, 北京 100191;
5. 浙江省疾病预防控制中心, 杭州 310051;
6. 深圳华大生命科学研究院, 深圳 518083;
7. 国家基因库生物样本资源库, 深圳 518210
2. National Clinical Research Center of Cardiovascular Diseases, Beijing 102300, China;
3. Department of Epidemiology and Biostatistics, School of Public Health, Peking University, Beijing 100191, China;
4. Peking University Center for Public Health and Epidemic Preparedness & Response, Beijing 100191, China;
5. Zhejiang Provincial Center for Diseases Control and Prevention, Hangzhou 310051, China;
6. BGI-Shenzhen, Shenzhen 518083, China;
7. Biological Sample Resource Library, China National Gene Bank, Shenzhen 518210, China
人群队列研究是国际上公认的研究环境和遗传危险因素与疾病结局关联的流行病学研究方法之一,也是转化医学研究的基础性支撑平台。一些西方发达国家建设大型人群队列的经验表明,成功建立大型人群队列,将对国家整体医学研究起到巨大的推动作用,且这一作用将随着时间的推移而不断加强,从而持续产生改变卫生政策及临床实践的高水平研究证据。
中国慢性病前瞻性研究(China Kadoorie Biobank,CKB)是2002年原卫生部批准立项、先后分别由中国疾病预防控制中心(项目Ⅰ期)、中国医学科学院(项目Ⅱ期)、北京大学(项目Ⅲ期)和英国牛津大学临床试验研究中心合作开展的一项大型慢性病前瞻性国际合作研究。2004年6月至2008年8月,项目开展了基线调查,共完成512 891名成年人包括体格检查、血样采集、问卷调查等内容的现场工作。项目于2008年6-10月开展了19 786人的第一次重复调查,2013年8月至2014年9月开展了25 239人的第二次重复调查,建立了世界领先的、高质量的、内容极为丰富的大型人群健康基础数据库和生物样本库[1-3]。
近年来,精准医学逐渐成为引领国际生物医学行业发展的新趋势。2016年,在国家重点研发计划“精准医学研究”重点专项的支持下,中国医学科学院CKB项目办整合全国14家单位,组建了高水平、跨学科的专业人员队伍,在CKB项目多年丰富的工作经验基础上,开展了大型自然人群队列示范研究。研究在长期监测随访、病例复核、人群队列规范化研究、样本库和数据库管理等方面取得了显著进展。本文介绍该项目研究成果,并探讨了大型人群队列研究未来发展与挑战。
一、研究进展大型自然人群示范队列的主要研究目标包括建立标准化操作流程(SOP),制定人群队列的建设标准。在统一标准与信息化共享的基础上,建立代表性人群的大型健康队列,开展长期随访,构建代表人群的多维度、动态、定量生命组学数据库和知识库框架体系,并建立样本和数据共享的机制。
1. 开展大型人群队列建设和管理规范化研究:CKB项目组将10余年队列管理的丰富经验进行提炼和总结,同时借鉴国际上大型人群队列研究的经验与做法,查阅大量文献并与主要大型人群队列研究项目组进行实地交流,根据中国实际情况制订了符合中国国情和地域特点的大型人群队列规范化文件,包括组织撰写完成了长期随访、样本库建设与管理、数据库及数据共享平台建设与管理等技术规范,集结整理成册《大型人群队列研究技术规范》,由人民卫生出版社出版[4]。通过中华预防医学会和全国团体标准信息平台等发布现场调查、长期随访、生物样本库建设、数据处理、数据安全等团体标准[5-9]。这些规范化文件具有符合国情、可操作性强、可持续的特点,树立了大型人群队列研究领域的行业标杆,为不同地区、不同目标人群、不同经济水平、不同医疗卫生工作水平地区的推广应用提供了技术支撑。
2. 长期监测随访:CKB采用多系统、多种方法整合的终点事件跟踪和失访控制策略,即利用当前运行的各类监测系统或常规工作中形成的资料或数据库开展常规监测,通过社区随访、入户随访、电话随访等主动追踪开展定向监测,并链接医保系统;辅以医院机构漏报调查、定向监测系统漏报调查、入户漏报调查、未参保人员复核及终点事件调查、人群稳定性状况调查等。同时,随着国家病案首页电子数据的普遍化和规范化,自2018年起项目在部分具备条件的地区项目点推进住院病案首页数据获取工作,充分利用现有各级医院病案首页的电子信息资料,较好地补充了已有的监测系统及医保系统数据,解决项目队列中未参保人员医院就诊信息收集缺失、城镇化建设人群迁移增多造成的随访难及入户难等问题,提高终点事件数据收集质量,提高项目点随访监测工作质量。最终,项目成功收集了全部队列成员的全死因死亡、主要慢性病发病监测、全病种住院事件、迁移和失访等信息。截至2022年6月,项目对全部队列人群平均开展随访已达15年,累计观察770万人年,收集死亡事件7.4万人,医保结局事件37.1万人(累计279.5万人次),主动随访事件1.1万人(累计1.2万人次),发病监测事件10.0万人(累计14.7万人次)。
3. 失访控制:失访是影响队列研究质量的重要因素之一。随着人员流动、搬迁、城镇化、城市改造等原因,队列人群的失访控制也成为项目随访监测工作的重点之一。CKB项目通过不断完善失访清理流程,通过定期联系公安户籍管理部门,收集特定时期内登记在册的常住居民搬迁记录,或通过已有信息系统如医保、家庭健康档案等各类可获得的信息系统,与调查对象名单进行匹配,获得队列人群迁移、失访信息。经多层次多角度核实,截至2021年底最终确认失访对象4 242人,失访率为0.83%。
4. 病例复核:项目对收集到结局事件进行严格质量控制,病例复核工作已成为队列常规工作之一,是队列终点事件审核项目的重要组成部分。对恶性肿瘤、心脑血管疾病、慢性肾脏病及糖尿病等主要慢性病开展病例复核。项目收集终点事件原始医疗记录,由有资质的临床医生按照标准审核确认所报告终点事件的诊断准确性,并补充收集临床资料(如诊断检查结果和临床记录)以确定疾病亚型。项目开发“临床事件线上审核”系统,邀请来自全国14家三级医院临床专科医生以统一的标准化流程在线上对病例进行审定,以确保不同医院的病例诊断一致性与准确性。截至2022年6月,项目已开展5个批次病例复核,完成约17.0万份病例的复核工作(表 1),其中脑卒中约6.6万例、冠心病约5.8万例、恶性肿瘤约3.7万例、慢性肾脏病约0.9万例。
5. 第三次重复调查:按照CKB项目整体设计规划,每隔5年时间随机抽取约5%的研究对象,以与基线调查相同的方式进行重复调查,以系统了解队列人群生活方式以及健康状况等方面的动态变化情况,并对基线调查中所收集的数据进行必要的验证。项目在2020年8月至2021年12月开展了第三次重复调查,完成25 087人的调查工作,具体调查时间见表 2,第三次调查在内容上有所扩展。
(1)问卷调查:随着队列人群年龄的增长,调查内容增加了一些与老龄化密切相关的健康问题(如身体衰弱、孤独、听力、视力、漏尿问题等)。
(2)体格检查:借鉴国际上先进队列经验,增加了眼科检查(视力、眼压和视网膜成像)、肝扫描(测量脂肪肝及肝硬化的程度)以及腕带运动手环的客观测量等。
(3)生物样本采集:新增了唾液样本和粪便样本采集,大部分样本采集率高于90.0%,24 h样本分装率除两个地区外均高于95.0%(表 3)。
6. 大型人群队列生物样本库的完善:CKB队列生物样本库已安全运行十余年,第三次重复调查期间采集了多种生物样本。目前,CKB队列生物样本库共储存血液样本129.2万管,尿液样本15.0万管,DNA样本78.0万管,唾液样本2.5万管,粪便样本2.0万管。CKB项目人员积极学习生物安全法及人类遗传资源管理条例等法律法规精神,同时参与ISO9001:2015、ISO20387:2018培训并获得内审员证书。样本管理单位连续两次通过ISO9001:2015认证,并依据最新行业法律法规及相关标准指引,更新体系文件,进一步完善CKB队列生物样本库质量管理体系,保障队列生物样本库健康可持续性发展,实现样本库安全、规范化管理。
7. 完善队列多维、动态数据库:CKB队列数据库平台中包括我国512 891名成年人数据,近年来进一步整合更多的研究数据,包括指掌纹数据、病例复核等专题调查数据、遗传学数据和地区空气质量数据等,形成了多个数据库更新版本,基本上完成包含基线信息、随访结局、实验室检测和专题数据4个模块的数据资源平台的建立,存储数据总量达485 Tb。
8. 推动数据共享开放,完善数据资源共享平台和共享合作机制:CKB项目数据已经成为我国超大人群的生物医学资源平台,充分利用和发掘大型人群队列数据资源,必须通过有效的资源共享和科研合作机制,可集优秀科研团队之力协同攻关,避免不必要的重复投入和宝贵数据资源的利用不足,将有限资源的收益最大化。CKB在前期研究数据开放和科研合作的基础上,积极探索和总结共享合作工作,完善了数据资源共享平台和共享合作机制,开展了数据共享平台建设,包括开发和完善数据申请系统和项目研究追踪系统,以方便研究委员会定期管理项目申请、数据使用和追踪研究进展,协助完成项目数据的利用和共享,支持鼓励研究者利用队列数据申请新的国家科研项目。
二、阶段性研究成果自立项以来,项目在持续高水平开展队列自身建设的基础上,作为自然人群示范队列,制定了符合中国国情的大型人群队列规范化建设标准,推动项目数据开放和数据共享,持续生产高质量的本土化科学证据。
1. 制定我国大型人群队列研究技术规范、团体标准及标准化操作流程:作为示范队列,项目组织撰写了长期随访、样本库建设与管理、数据库及数据共享平台建设与管理等内容共计22项技术规范,并集结整理成《大型人群队列研究技术规范》,由人民卫生出版社出版[4];制作20项相应的SOP;发布了大型人群队列现场调查管理技术规范(T/CPMA 001-2019)、大型人群队列终点事件长期随访技术规范(T/CPMA 002-2019)、T/SZGIA 5-2019队列生物样本库建设管理规范、大型人群队列研究数据处理技术规范(T/CPMA 001-2018)、大型人群队列研究数据安全技术规范(T/CPMA 002-2018)5项团体标准[5-9]。文件发布后,项目成员大力推广项目成果,通过核心刊物发表、大型会议宣讲、学术交流、媒体宣传等方式,分享项目成果,扩大规范化文件的影响力,促进研究成果的推广和使用,提高我国队列研究的标准和质量。
同时,CKB项目作为示范队列,积极对国内其他人群队列的申报、规范化建设和管理、生物样本库建设、数据管理和共享等提供指导和帮助,包括对肺癌专病队列、脑血管疾病专病队列、华南区域自然人群慢性非传染性疾病前瞻性队列等多项队列研究的建设和随访工作进行指导。
2. 开展慢性病病因学研究,构建疾病中长期风险预测模型:项目持续利用CKB队列数据开展高质量的科学研究,其中健康行为生活方式与主要慢性病的关联研究提供了中国人本土化的研究证据。重点研究了中国人特有的暴露因素(如水果、辣食、饮茶等膳食习惯,以吸烟、饮酒、职业性体力活动为主的身体活动水平等生活方式,燃料使用等环境因素)[10-17],以及影响中国人常见的健康问题(如高血压、超重/肥胖、出血性脑卒中、消化系统恶性肿瘤、慢性阻塞性肺疾病等)[18-20]。以CKB为基础,项目还利用常规采集信息(性别、年龄、收缩压、舒张压、腰围、吸烟情况、降压治疗史、糖尿病史)构建了一套可在全国各地推广使用的心血管病十年风险预测模型[21]。这些可干预危险因素研究成果获得人民网、新华网等国内外多家媒体的广泛报道,为国内的相关研究提供更多的本土依据。
值得指出的是,既往在西方国家研究产生的证据不一定适用于中国人群,因此,本土化的高质量证据才能从源头保证健康知识的前沿性、科学性和权威性,不仅可以促进大众健康科普,也能推进实施“健康中国2030”战略,支持疾病防治指南和公共卫生政策的制定。
三、发展与挑战CKB队列通过近二十年时间建立了世界领先的大规模人群队列,随着项目开展,它必将成为更有价值的科学研究资源。队列积累越来越多罕见的表型和疾病,暴露测量越来越准确,全队列生物样本检测使得基于中国人群的多组学研究和系统流行病学研究成为可能,这些将给队列开展精准医学提供宝贵的基础资源。然而,其发展也面临诸多方面的挑战。随着队列成员的老龄化,实施现场调查工作难度越来越大,匹配疾病结局事件也面临巨大挑战,生物样本库运行和存储需要长期维持,而将其转化为多组学数据的检测更是投入巨大。随着国家对大型人群队列研究资源的认可和重视,CKB项目能抓住发展机遇,迎接挑战,建成我国生物医学研究的跨学科资源平台,通过合作和共享协同攻关,探索和验证中国人群的科研证据,支持国家重大慢性病防治决策和实践。
利益冲突 所有作者声明无利益冲突
作者贡献声明 郭彧:研究设计与实施、论文撰写、经费支持;余灿清、吕筠:研究设计与实施、论文修改;俞敏、钱璞毅:研究实施;韩晓、孙点剑一:研究实施、论文撰写;李立明:研究指导、经费支持
志谢 感谢所有参加中国慢性病前瞻性研究项目的队列成员和各项目地区的现场调查员;感谢项目管理委员会、国家项目办公室、英国牛津大学协作中心和中国慢性病前瞻性研究10个项目地区办公室的工作人员
[1] |
Chen ZM, Lee L, Chen JS, et al. Cohort profile: the kadoorie study of chronic disease in China (KSCDC)[J]. Int J Epidemiol, 2005, 34(6): 1243-1249. DOI:10.1093/ije/dyi174 |
[2] |
Chen ZM, Chen JS, Collins R, et al. China kadoorie biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up[J]. Int J Epidemiol, 2011, 40(6): 1652-1666. DOI:10.1093/ije/dyr120 |
[3] |
李立明, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究: 研究方法和调查对象的基线特征[J]. 中华流行病学杂志, 2012, 33(3): 249-255. Li LM, Lv J, Guo Y, et al. The China Kadoorie Biobank: related methodology and baseline characteristics of the participants[J]. Chin J Epidemiol, 2012, 33(3): 249-255. DOI:10.3760/cma.j.issn.0254-6450.2012.03.001 |
[4] |
郭彧, 李立明. 大型人群队列研究技术规范[M]. 北京: 人民卫生出版社, 2019. Guo Y, Li LM. Technical specification for large population-based cohort study[M]. Beijing: People's Medical Publishing House, 2019. |
[5] |
中华预防医学会. 大型人群队列研究数据安全技术规范(T/CPMA 002-2018)[J]. 中华流行病学杂志, 2019, 40(1): 12-16. Chinese Preventive Medicine Association. Technical specification of data security for large population-based cohort study (T/CPMA 002-2018)[J]. Chin J Epidemiol, 2019, 40(1): 12-16. DOI:10.3760/cma.j.issn.0254-6450.2019.01.004 |
[6] |
中华预防医学会. 大型人群队列研究数据处理技术规范(T/CPMA 001-2018)[J]. 中华流行病学杂志, 2019, 40(1): 7-11. Chinese Preventive Medicine Association. Technical specification of data processing for large population-based cohort study (T/CPMA 001-2018)[J]. Chin J Epidemiol, 2019, 40(1): 7-11. DOI:10.3760/cma.j.issn.0254-6450.2019.01.003 |
[7] |
中华预防医学会. 大型人群队列现场调查管理技术规范(T/CPMA 001-2019)[J]. 中华流行病学杂志, 2019, 40(7): 739-747. Chinese Preventive Medicine Association. Technical specification of management for field survey in large population-based cohort study (T/CPMA 001-2019)[J]. Chin J Epidemiol, 2019, 40(7): 739-747. DOI:10.3760/cma.j.issn.0254-6450.2019.07.001 |
[8] |
中华预防医学会. 大型人群队列终点事件长期随访技术规范(T/CPMA 002-2019)[J]. 中华流行病学杂志, 2019, 40(7): 748-752. Chinese Preventive Medicine Association. Technical specification of long-term follow-up for end point in large population-based cohort study (T/CPMA 002-2019)[J]. Chin J Epidemiol., 2019, 40(7): 748-752. DOI:10.3760/cma.j.issn.0254-6450.2019.07.002 |
[9] |
深圳生命科技产学研资联盟. T/SZGIA 5-2019队列生物样本库建设管理规范[S]. 2019. Shenzhen Life-Tech Industry Alliance. T/SZGIA 5-2019 Specifications for construction and management of cohort biobank[S]. 2019. |
[10] |
田小草, 汪韶洁, 李善鹏, 等. 青岛市成年人水果摄入与脑卒中发病关联的前瞻性研究[J]. 中华流行病学杂志, 2019, 40(5): 515-520. Tian XC, Wang SJ, Li SP, et al. Association between fruit consumption and stroke in adults in Qingdao: a prospective study[J]. Chin J Epidemiol, 2019, 40(5): 515-520. DOI:10.3760/cma.j.issn.0254-6450.2019.05.005 |
[11] |
刘琪, 吴曼, 温俏睿, 等. 中国10个地区成年人膳食模式与低肌肉重量、力量和质量的相关性分析[J]. 中华流行病学杂志, 2021, 42(5): 780-786. Liu Q, Wu M, Wen QR, et al. The correlation of dietary patterns with low muscle mass, strength and quality in adults from 10 regions of China[J]. Chin J Epidemiol, 2021, 42(5): 780-786. DOI:10.3760/cma.j.cn112338-20200618-00855 |
[12] |
刘琪, 李嘉琛, 杜怀东, 等. 中国10个地区30~79岁成年人被动吸烟行为特征分析[J]. 中华流行病学杂志, 2020, 41(10): 1668-1673. Liu Q, Li JC, Du HD, et al. Regional and demographic differences on passive smoking among non-smokers aged 30-79 years in 10 regions of China[J]. Chin J Epidemiol, 2020, 41(10): 1668-1673. DOI:10.3760/cma.j.cn112338-20191016-00737 |
[13] |
王昕, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究: 10个项目地区成年人群吸烟行为特征差异分析[J]. 中华流行病学杂志, 2015, 36(11): 1200-1204. Wang X, Lyu J, Guo Y, et al. Regional differences in adults' smoking pattern: findings from China Kadoorie Biobank study in 10 areas in China[J]. Chin J Epidemiol, 2015, 36(11): 1200-1204. DOI:10.3760/cma.j.issn.0254-6450.2015.11.004 |
[14] |
王浩, 杜怀东, 胡如英, 等. 浙江省成年人饮茶与脑卒中发生关联的前瞻性研究[J]. 中华流行病学杂志, 2018, 39(9): 1200-1205. Wang H, Du HD, Hu RY, et al. Association between tea drinking and stroke in adults in Zhejiang province: a prospective study[J]. Chin J Epidemiol, 2018, 39(9): 1200-1205. DOI:10.3760/cma.j.issn.0254-6450.2018.09.011 |
[15] |
李夏, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究: 10个项目地区成年人群饮茶行为特征差异分析[J]. 中华流行病学杂志, 2015, 36(11): 1195-1199. Li X, Lyu J, Guo Y, et al. Regional differences in adults' tea drinking pattern: findings from China Kadoorie Biobank study in 10 areas in China[J]. Chin J Epidemiol, 2015, 36(11): 1195-1199. DOI:10.3760/cma.j.issn.0254-6450.2015.11.003 |
[16] |
祝楠波, 周密, 余灿清, 等. 中国成年人健康生活方式状况分析[J]. 中华流行病学杂志, 2019, 40(2): 136-141. Zhu NB, Zhou M, Yu CQ, et al. Prevalence of 'healthy lifestyle' in Chinese adults[J]. Chin J Epidemiol, 2019, 40(2): 136-141. DOI:10.3760/cma.j.issn.0254-6450.2019.02.003 |
[17] |
李嘉琛, 吴曼, 余灿清, 等. 中国10个地区成年人生活燃料使用情况的流行病学特征分析[J]. 中华流行病学杂志, 2018, 39(11): 1426-1431. Li JC, Wu M, Yu CQ, et al. Epidemiological characteristics of household fuel use in 10 areas of China[J]. Chin J Epidemiol, 2018, 39(11): 1426-1431. DOI:10.3760/cma.j.issn.0254-6450.2018.11.002 |
[18] |
郭杰, 余灿清, 吕筠, 等. 中国10个地区人群高血压患病率、知晓率、治疗率和控制情况分析[J]. 中华流行病学杂志, 2016, 37(4): 469-474. Guo J, Yu CQ, Lyu J, et al. Status of prevalence, awareness, treatment and controll on hypertension among adults in 10 regions, China[J]. Chin J Epidemiol, 2016, 37(4): 469-474. DOI:10.3760/cma.j.issn.0254-6450.2016.04.006 |
[19] |
王醴湘, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究: 10个项目地区成年人超重/肥胖现况分析[J]. 中华流行病学杂志, 2015, 36(11): 1190-1194. Wang LX, Lyu J, Guo Y, et al. Regional specific differences in prevalence of overweight/obesity in China: findings from China Kadoorie Biobank study in 10 areas in China[J]. Chin J Epidemiol, 2015, 36(11): 1190-1194. DOI:10.3760/cma.j.issn.0254-6450.2015.11.002 |
[20] |
庞元捷, 余灿清, 郭彧, 等. 中国成年人行为生活方式与主要慢性病的关联——来自中国慢性病前瞻性研究的证据[J]. 中华流行病学杂志, 2021, 42(3): 369-375. Pang YJ, Yu CQ, Guo Y, et al. Associations of lifestyles with major chronic diseases in Chinese adults: evidence from the China Kadoorie Biobank[J]. Chin J Epidemiol, 2021, 42(3): 369-375. DOI:10.3760/cma.j.cn112338-20210111-00024 |
[21] |
Yang S, Han Y, Yu C, et al. Development of a model to predict 10-year risk of ischemic and hemorrhagic stroke and ischemic heart disease using the China Kadoorie Biobank[J]. Neurology, 2022, 98(23): e2307-2317. DOI:10.1212/WNL.0000000000200139 |