环境污染与胃癌相关人群研究的知识图谱分析
刘航, 李莉, 闫旭, 杨文静, 苏丽琴     
中国疾病预防控制中心环境与健康相关产品安全所
摘要: 目的 了解环境污染与胃癌相关人群研究的国内外现状,为今后胃癌精准防控研究提供科学依据。方法 以SCI和CNKI数据库中1989-2018年收录的胃癌与环境污染原创性人群研究文献为数据基础,使用BibExcel、VosViewer、R等分析工具,分析中英文文献的时间分布、地区分布、学科分布、机构合作、关键词共现等情况。结果 近30年中文发表的我国环境污染与胃癌相关的人群研究论文数量最多集中在1995-2003年之间,从2000年以后明显下降,近年来保持低数量产出态势,SCI论文数量总体呈上升趋势;SCI文献产出最多的国家是美国和中国;中文文献产出最多的是江西省;本领域50%以上的SCI文献集中在环境科学和生态学,公共、环境和职业健康两个学科;中文论文主要关注的热点包括土壤微量元素及污染物、水污染与胃癌两个方面;砷、硝酸盐、金属污染等是主要的研究问题;中英文文献研究的具体污染物不尽相同。结论 我国环境污染与胃癌相关人群研究需要进一步扩大国内外研究机构之间的跨学科合作与交流,除无机环境污染物之外,还应对有机污染物暴露进行充分考虑。
关键词: 胃癌    环境污染    知识图谱分析    文献计量学    人群研究    
Knowledge Map Analysis of Environmental Pollution and Gastric Cancer Related Population Research
LIU Hang, LI Li, YAN Xu, YANG Wenjing, SU Liqin
Abstract: Objectives To understand the current situation of research on environmental pollution and gastric cancer related population at home and abroad, and to provide scientific basis for future research on the precise prevention and control of gastric cancer in China. Methods Based on the data of the original population study on gastric cancer and environmental pollution cited by SCI and CNKI from 1989 to 2018, BibExcel, VosViewer, R and other analytical tools were used to analyze the temporal distribution, regional distribution, disciplinary distribution, institutional cooperation and keyword co-occurrence of Chinese and English literatures. Results In the past 30 years, the number of research papers in Chinese on environmental pollution and gastric cancer was relatively higher from 1995 to 2003, and declined significantly since 2000. In recent years, it maintained a low-number output trend. The number of SCI papers has generally increased. The countries with the largest output of SCI literature are the United States and China. Of literatures published in Chinese, most of the studies carried out in Jiangxi Province. More than 50% of SCI literatures in this field are concentrated in environmental sciences and ecology, and mainly focus on public, environment and occupational health. The hotspots that were focused by Chinese papers including soil trace elements and pollutants, water pollution and gastric cancer. Arsenic, nitrate and metal pollution are the main research issues. The specific pollutants of concern in Chinese and English articles are not in complete accord. Conclusions The interdisciplinary cooperation and communication between domestic and foreign research institutions should be strengthened for the future research on environmental pollution and gastric cancer in China. In addition to inorganic pollutions, the exposure of organic pollutants should also be fully considered.
Key words: gastric cancer    environmental pollution    knowledge map analysis    bibliometrics    population-based study    

胃癌是发病率和死亡率较高的恶性肿瘤之一。世界卫生组织/国际癌症中心团队发表的全球癌症统计数据估计全球2018年胃癌新发病例数103.4万,居第5位;死亡数78.3万,居第3位[1]。我国属于胃癌高发区域。2018年,我国胃癌新发病例45.6万人,居恶性肿瘤的第3位;胃癌死亡数39.0万,居第2位[2]。随着胃癌流行病学的深入调查,目前普遍认为胃癌的发生是多因素共同作用的过程[3]。除幽门螺杆菌等生物性致病因素之外,遗传、环境质量、生活行为方式、疾病史等是胃癌发生的主要影响因素[4]。据研究,环境因素在胃癌发生中的作用占到72%[5],其中,环境化学污染物暴露对人群胃癌流行的影响受到国内外广泛关注。知识图谱分析通过将文献计量学分析、共现分析、社会网络分析和信息可视化技术的理论与方法进行结合,分析知识单元(文献、作者、关键词等)的相似性和测度,可视化展示学科的核心结构、发展历史、前沿领域以及整体知识架构,把复杂的专业知识通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示知识领域的动态发展规律,使研究人员得以在世界知识版图中直观地了解自己研究领域的所在位置,了解新的知识领域。本研究基于文献计量学原理和方法开展环境污染与胃癌的知识图谱分析,以期为国内今后相关研究以及胃癌的精准防控提供支持。

1 资料与方法 1.1 数据来源

本研究数据包括中文数据和英文数据,限定文献发表时间为1989—2018年,仅关注环境污染与胃癌相关的原创性人群研究。中文数据库选择中国知识基础设施工程(CNKI)期刊全文数据库,外文数据库选择Clarivate Analytics公司的Web of Science(SCI)数据库。

1.2 检索策略

在CNKI数据库中使用“胃癌”作为主要检索词,在SCI数据库中选取“Web of Science核心合集”,使用胃癌相关关键词和环境污染(空气污染、水污染、土壤污染)及相关污染物关键词进行逻辑组配,相关污染物选择我国现行环境质量标准中化学污染物指标,以及标准之外关注度较高的新兴化学污染物指标作为具体检索词(表 1)。

表 1 中英文检索词列表
中文检索词 英文检索词
胃癌、环境空气、总悬浮颗粒物、颗粒物、二氧化硫、氮氧化物、二氧化氮、铅、苯并芘、一氧化碳、臭氧、甲醛、总挥发性有机物、饮用水、消毒副产物、三氯甲烷、卤乙酸、三卤甲烷、砷、镉、铬、氟化物、硝酸盐、亚硝酸盐、农药、亚氯酸盐、溴酸盐、游离氯、二氧化氯、土壤、汞、铜、镍、锌、多环芳烃、滴滴涕、六六六、氨基甲酸酯、多氯联苯、二噁英、邻苯二甲酸酯、持久性有机污染物 gastric cancer, ambient air, total suspended particle, particle matter, sulfur dioxide, nitrogen oxides, nitrogen dioxide, lead, benzo(a)pyrene, carbon monoxide, ozone, formaldehyde, total volatile organic compound, drinking water, disinfection by-products, chloroform, haloacetic acid, trihalomethanes, arsenic, cadmium, chromium, fluoride, nitrates, nitrite, pesticide, chloride, bromate, free chloride, chlorine dioxide, soil, mercury, copper, nickel, zinc, polycyclic aromatic hydrocarbon, dichlorodiphenyltrichloroethane, benzene hexachloride, nitrates, nitrite, carbamate, polychlorinated biphenyls, dioxin, phthalic acid ester, persistent organic pollutant

为避免关键词检索带来的数据冗余,设定主题精确匹配检索,并将检索结果中一些非相关学科关键词作为排除条件,去除一些非相关文献,初步检索到中文论文319篇,SCI论文503篇。在此基础上人工复核,进一步剔除非原创性和非人群研究,确定保留中文46篇、外文105篇文献供分析。

1.3 研究工具及分析方法

本研究将收集到的文献以全记录+参考文献的形式导出,使用数量统计、共现分析、社会网络分析等方法,运用BibExcel、VosViewer、R语言等分析工具,根据不同的分析指标,选择相应的工具进行数据分析。分析相关中英文文献的时间分布、地区分布、学科分布、机构合作、关键词共现等情况,并以各种可视化的知识图谱形式进行呈现。其中,机构合作网络图在BibExcel软件中生成;中外文关键词聚类分析在VosViewer软件中完成;对摘要文本的词频统计是在R语言编程环境下,使用jieba开源项目基于TF-IDF(词频-逆文本频率指数)和TextRank关键词抽取算法,配合jieba标准的分词词典(本研究所涉及的部分专业语词在词典中进行了手工补充)实现。

2 结果 2.1 中外文相关文献的时间分布

近30年来,中文发表的我国环境污染与胃癌相关的人群研究论文数量年度分布见图 1。可以看到,发表论文数量最多集中在1995—2003年之间,2000年达到最高,2000年以后明显下降,近年来保持低数量产出的态势,2009—2015年、1990—1993年、2001年未见论文发表(图 1);与中文文献相比,SCI文献的持续性更好,基本上每年都有相关研究文献发表,而且SCI论文数量总体呈上升趋势,2010年后论文数量明显增加(图 2)。

图 1 中文文献年度情况

图 2 SCI文献年度情况

2.2 中外文相关文献的地区分布与合作网络分析

中文文献以江西省产出最多,地区间的合作则是上海最活跃,不但有国内的合作,还有国际间的合作。其他的地区间合作少量出现在山东—天津、河北—日本之间。

SCI文献方面,产出最多的国家和地区是美国(21.0%,22/105),其次是中国(11.4%,12/105),美中发表的SCI文献明显高于其他国家和地区如意大利、瑞典、英国、德国等。几个欧洲国家之间合作较多,但传统的科研产出大国如美国和中国则以国内合作为主,国际间的研究合作不多。

2.3 机构合作网络分析

国内机构合作方面,出现较多的小合作群体,见图 3a。这些合作群体有的有明显的合作中心,如以福建医科大学为合作中心的大学—卫生防疫站—医院合作群体(①),以上海市肿瘤研究所和河南省洛阳石化总厂职工医院为共同中心的研究所—医院—大学合作群体(②),也有中心不明显的大学—医院—大学合作群体(③),研究所—防疫站—癌防办合作群体(④)。

注:a为中文机构合作网络;b为英文机构合作网络 图 3 中英文机构合作网络图

SCI文献方面,形成了四个合作群体(图 3b)。第一个最大的合作群体主要是欧洲几个研究机构和美国研究机构之间(①),第二个合作群体以台湾的学校和医院为主(②),第三个合作群体产生于河北医科大学和日本新潟大学之间(③),最后一个合作群体产生于西班牙卡洛斯三世健康研究所和流行病学和公共卫生研究所之间(④)。这些合作群体所包含的机构之间的合作频次都不高(两两机构之间合作论文数均不超过2篇)。

2.4 SCI相关文献的学科分布

由于中文文献数据库未进行严格的学科分类,仅对SCI文献进行学科分布分析。结果显示,105篇SCI文献分布于170个学科。占比较大的前4位学科顺次为:环境科学和生态学(27.7%,47/170)、公共、环境和职业健康(26.5%,45/170)、肿瘤学(12.4%,21/170)和毒理学(9.41%,16/170)。

2.5 文献共词分析

在VosViewer软件中对中外文关键词进行聚类分析,可以看到相关关键词被分了多个类别,中外文聚类图均有两个比较显著的类别:①是研究土壤微量元素以及地理环境和癌症死亡率的相关关系,被研究的微量元素有IIIB族元素、稀土、钒、铬、溴、锑、碘、锶、汞、钍、硼、铋、铈等;②是研究饮用水和胃肿瘤的相关关系,涉及到的研究方面有肿瘤高发区的流行病学研究、水中相关危险因素研究、水污染对胃肿瘤发病率和死亡率的影响研究等。

2.6 摘要文本分析

对中英文论文摘要的文本进行词频统计,将词频统计结果转化为词云图,词云图中字体大的、位置居于核心位置的词属于高频关键词。

中文论文摘要的词云图显示,出现频率较高的词包括“胃癌”、“死亡率/死亡/生存/发病率”、“元素/砷”、“土壤环境/土壤”、“饮水/饮用水/河水/水/水源/水质”、“污染”、“评价”等。

英文论文摘要的词云图显示,出现频率较高的词包括“Stomach cancer”、“exposure”、“mortality”、“risk”、“water”、“nitrate”、“drinking”、“soil”、“arsenic”、“metals”、“pollution”等。

2.7 中英文文献中标注的环境污染物比较

对中英文相关文献关注的环境因素进行筛选比较显示(表 2),中英文论文关注的环境污染物种类存在一定差异:关于空气与胃癌的研究,中文论文均未关注空气污染物,SCI论文标注了空气污染物种类;关于水与胃癌的研究,中英文论文均高度关注“砷”污染,但关注的水中污染物种类存在差异;关于土壤与胃癌的研究,中英文论文均高度关注“砷”污染,中文论文主要关注无机污染物,SCI论文还关注多氯联苯、农药等有机污染物。

表 2 中英文文献中标注的环境污染物比较
环境介质 中文论文 SCI论文
空气 - 颗粒物、二氧化硫、氮氧化物、二氧化氮、多环芳烃、臭氧
砷、氨氮、硝酸盐氮、亚硝酸盐氮、铅、汞、锑、铜、铁、氯、苯并芘、二甲基亚硝胺、二乙基亚硝胺和二丙基亚硝胺 砷、镉、铬、氟化物、硝酸盐、亚硝酸盐、农药
土壤 砷、溴、铬、锶、钒、锑、重稀土、硼、镥、铈、碘、铒、锶、铋、钍、铊 砷、镉、汞、铅、铬、锌、多环芳烃、滴滴涕、硝酸盐、多氯联苯、二噁英、持久性有机污染物、农药
  注:“-”表示未查到关于空气中污染物与胃癌原创性人群研究的中文论文

3 讨论

知识图谱是运用文献计量学与信息可视化相结合的方法,快速直观地了解国内外相关研究动态,有利于整体把握学科的研究热点与前沿、演化[6]。文献数量的变化可以直观地看到特定时间段内研究热度的变化,也可以衡量某学科在该时间段内发展态势[7]。通过对1989—2018年间国内外环境污染与胃癌相关的人群研究论文进行分析,本研究发现近30年中文发表的环境污染与胃癌相关的人群研究论文数量总体呈下降趋势,而SCI论文数量总体呈上升趋势。这一国内外差异可能归因于国内本领域发展趋向于与国际接轨,相当部分高水平的研究论文可能更倾向于发表至SCI期刊。SCI文献数量统计显示,中国作者发表的SCI文献数排名第二,仅次于美国,说明我国在环境污染与胃癌的人群研究方面已经开展了较多的工作。SCI发文量呈总体上升趋势,说明全球范围内研究人员对环境污染与人群胃癌的关注度持续增加。

通过中英文文献的地区分布与合作网络分析可以看到,SCI文献产出以美国和中国最多;中文文献方面,江西省产出最多。北京市、上海市等传统产出大区在本领域的中文文献较少,最可能的原因是该地区的研究人员倾向于发表SCI[8-9]。从机构合作图可以看到,尽管我国相关研究机构之间有过一些合作,但合作的频次尚不及欧美地区的研究机构。提示国内学者的科研合作意识尚有待加强,未来应进一步加强机构间、学者间的合作,以推进我国在本领域的发展。

对环境污染与胃癌的SCI论文的学科分布进行分析,可以看到本领域50%以上的SCI文献集中在环境科学和生态学、公共、环境和职业健康两个学科,其他学科的分布较少。提示研究者可以继续在环境科学、职业健康等方面开展更深入的研究,也可在毒理学、肿瘤学等方面进行开拓性研究。

关键词是一篇文献核心内容的浓缩和提炼,关键词共现网络能反映出该领域当前研究热点及过去产生过的热点[10]。摘要词云图是对文本中出现频率较高的词予以视觉化的展现,可以过滤掉大量的低频的文字信息。关键词聚类分析显示,中文论文主要关注的热点包括土壤微量元素及污染物、水污染与胃癌两个方面。中英文论文摘要的词云图进一步支持砷、硝酸盐、金属污染等是主要的研究问题。

对文献中关注的具体污染物进行分析可以看到,中英文文献研究的具体污染物有相同之处,也有不同之处。首先,中文论文关于空气污染物对胃癌的影响方面研究为空白,而SCI论文已对具体空气污染物对胃癌的影响开展了研究[11],该研究显示长期暴露于PM2.5与胃癌有关联,提示中国学者未来可考虑在空气污染与胃癌方面开展研究;其次,中英文文献均高度关注土壤砷污染和水砷污染与人群胃癌之间的关系[12-15],提示致癌物砷在胃癌研究中应作为重点影响因素考虑;最后,中文论文关注的水和土壤污染物的种类以无机污染物为主[16-17],而SCI论文除关注无机污染物之外,还关注多氯联苯、农药等有机污染物对胃癌的影响[18-19],可能原因是因为中国土壤无机物污染和水体富营养化问题较为凸出[20-21],也可能是受研究条件所限,对有机污染物的研究还不够。

综上所述,本研究反映了环境与污染、与胃癌的中英文论文发表的时间变化趋势、地区分布、学科分布、机构合作、关键词共现等情况,提示我国环境污染与胃癌人群研究需要进一步扩大国内外研究机构之间的跨学科合作与交流;除无机环境污染物之外,还应对有机污染物暴露进行充分考虑;除水环境和土壤环境之外,还应对空气污染对胃癌的影响进行研究。

参考文献
[1]
Bray F, Ferlay J, Soerjomataram I, et al. Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA:Cancer J Clin, 2018, 68(6): 394-424.
[2]
王宁, 刘硕, 杨雷, 等. 2018全球癌症统计报告解读[J]. 肿瘤综合治疗电子杂志, 2019, 5(1): 87-97. (In English: Wang N, Liu S, Yang L, et al. Interpretation on the report of Global Cancer Statistics 2018[J]. Journal of Multidisciplinary Cancer Management (Electronic Version), 2019, 5(1): 87-97.)
[3]
常敏, 张久聪, 周琴, 等. 胃癌流行病学研究进展[J]. 胃肠病学和肝病学杂志, 2017, 26(9): 966-969. (In English: Chang M, Zhang JC, Zhou Q, et al. Research progress of clinical epidemiology of gastric cancer[J]. Chin J Gastroenterol Hepatol, 2017, 26(9): 966-969.)
[4]
程时磊, 张发斌, 李斌. 中国人群胃癌发病影响因素meta分析[J]. 中国公共卫生, 2017, 33(12): 1775-1780. (In English: Cheng SL, Zhang FB, Li B. Risk factors for gastric cancer in Chinese population:a meta-analysis[J]. Chin J Public Health, 2017, 33(12): 1775-1780.)
[5]
Lichtenstein P, Holm NV, Verkasalo PK, et al. Environmental and heritable factors in the causation of cancer-analyses of cohorts of twins from Sweden, Denmark, and Finland[J]. N Engl J Med, 2000, 343(2): 78-85.
[6]
李柏, 金银哲, 朱小涛. 基于CiteSpace的国际体育场馆知识图谱分析及启示[J]. 沈阳体育学院学报, 2018, 37(6): 57-64. (In English: Li B, Jin YZ, Zhu XT. Analysis on knowledge mapping of world sports stadiums and gyms based on CiteSpace and its enlightenment[J]. J Shenyang Sport Univ, 2018, 37(6): 57-64.)
[7]
邱均平, 沈恝谌, 宋艳辉. 近十年国内外计量经济学研究进展与趋势——基于Citespace的可视化对比研究[J]. 现代情报, 2019, 39(2): 26-37. (In English: Qiu JP, Shen JC, Song YH. Research progress and trend of econometrics in recent ten years at home and abroad——a visual contrast research based on CiteSpace[J]. Mod Inf, 2019, 39(2): 26-37.)
[8]
Chen W, Zheng R, Zhang S, et al. Cancer incidence and mortality in China in 2013:an analysis based on urbanization level[J]. Chin J Cancer Res, 2017, 29(1): 1-10.
[9]
Li X, Miao M, Hui XJ, et al. Association between dietary nitrate and nitrite intake and site-specific cancer risk:evidence from observational studies[J]. Oncotarget, 2016, 7(35): 56915-56932.
[10]
邱均平, 温芳芳. 近五年来图书情报学研究热点与前沿的可视化分析——基于13种高影响力外文源刊的计量研究[J]. 中国图书馆学报, 2011, 37(2): 51-60. (In English: Qiu JP, Wen FF. Visualization analysis of the research front and hot domains of library and information science in the past five years:studies based on the quantitative analysis of 13 high-impact international journals[J]. J Libr Sci China, 2011, 37(2): 51-60.)
[11]
Nagel G, Stafoggia M, Pedersen M, et al. Air pollution and incidence of cancers of the stomach and the upper aerodigestive tract in the European Study of Cohorts for Air Pollution Effects (ESCAPE)[J]. Int J Cancer, 2018, 143(7): 1632-1643.
[12]
张秀兰, 赵树青, 梁索元. 赞皇县内外环境胃癌危险因素的检测[J]. 微量元素与健康研究, 2007, 24(2): 11-13.
[13]
曾昭华, 曾雪萍. 中国癌症与土壤环境中As元素的关系[J]. 江西科学, 2000, 18(1): 15-18. (In English: Zeng ZH, Zeng XP. The relations between the cancers and the soil arsenic(As) content in China[J]. Jiangxi Sci, 2000, 18(1): 15-18.)
[14]
Gunduz O, Bakar C, Simsek C, et al. The health risk associated with chronic diseases in villages with high arsenic levels in drinking water supplies[J]. Expo Health, 2017, 9(4): 261-273.
[15]
Núñez, Fernández-Navarro P, Martín-Méndez I, et al. Arsenic and chromium topsoil levels and cancer mortality in Spain[J]. Environ Sci Pollut Res, 2016, 23(17): 17664-17675.
[16]
张荣艳, 王爱苹, 唐风军. 我国水污染与居民健康的灰色关联度分析——基于我国肿瘤登记地区的数据[J]. 河南科学, 2016, 31(10): 1728-1734. (In English: Zhang RY, Wang AP, Tang FJ. Grey relational analysis on association between water pollution and resident health in China:based on data of China cancer registries[J]. Henan Sci, 2016, 31(10): 1728-1734.)
[17]
曾昭华, 曾雪萍. 中国癌症与土壤环境中溴元素的关系[J]. 四川地质学报, 2003, 23(3): 170-173. (In English: Zeng ZH, Zeng XP. On relationship between cancer and br content in soil[J]. Acta Geol Sichuan, 2003, 23(3): 170-173.)
[18]
Ruder AM, Hein MJ, Hopf NB, et al. Mortality among 24, 865 workers exposed to polychlorinated biphenyls (PCBs) in three electrical capacitor manufacturing plants:A ten-year update[J]. Int J Hyg Environ Health, 2014, 217(2-3): 176-187.
[19]
Huen K, Yousefi P, Bradman A, et al. Effects of age, sex, and persistent organic pollutants on DNA methylation in children[J]. Environ Mol Mutagen, 2014, 55(3): 209-222.
[20]
方建新, 王璞. 我国土壤污染现状分析及防治对策研究[J]. 资源节约与环保, 2019(8): 79.
[21]
马经安, 李红清. 浅谈国内外江河湖库水体富营养化状况[J]. 长江流域资源与环境, 2002, 11(6): 575-578. (In English: Ma JA, Li HQ. Preliminary discussion on eutrophication status of lakes, reservoirs and rivers in China and overseas[J]. Resour Environ Yangtze Basin, 2002, 11(6): 575-578.)
DOI: 10.13421/j.cnki.hjwsxzz.2020.01.011
中国疾病预防控制中心主办。
0
刘航, 李莉, 闫旭, 杨文静, 苏丽琴
LIU Hang, LI Li, YAN Xu, YANG Wenjing, SU Liqin
环境污染与胃癌相关人群研究的知识图谱分析
Knowledge Map Analysis of Environmental Pollution and Gastric Cancer Related Population Research
环境卫生学杂志, 2020, 10(1): 62-67, 93
Journal of Environmental Hygiene, 2020, 10(1): 62-67, 93
DOI: 10.13421/j.cnki.hjwsxzz.2020.01.011

相关文章

工作空间