基于GDELT新闻大数据的东南亚地缘交互关系制图研究 | ![]() |
2. 云南林业职业技术学院,云南 昆明,650051;
3. 云南大学新闻学院,云南昆明,650500
2. Yunnan Forestry Technological College, Kunming 650051, China;
3. School of Journalism, Yunnan University, Kunming 650500, China
地缘关系是指地理位置接近的地缘体在政治交往、经济贸易、文化交流等方面的相互联系[1]。以中国为中心节点,相关学者探讨了中国与周边国家的地缘政治关系[2, 3]、地缘经济关系[4, 5]、地缘风险评估和预测[6, 7]。大数据时代涌现的新生技术对地缘关系的认知与研究突破了原有定性研究的限制。有关定量研究多从合作与冲突的交互关系出发,采用社会网络分析、数据计量分析来探究地缘关系[8, 9],而主要的空间制图方式和定量方法相关,大体可分为基于关系链路和基于评价量值的可视化[10, 11]。
最常用的研究地缘关系的数据集为全球事件、语言与语调(global database of events,language,and tone,GDELT)新闻数据库。GDELT整合了全球新闻资讯、电视广播、报纸等涵盖的事件数据,数据库中既有定性的参与者代码、名称、发生时间、事件类型等字段,也有定量的报道次数、事件影响分数、地理位置信息等数据字段。秦昆等[12]基于GDELT数据库构建国家交互网络,利用复杂网络的理论和方法分析国家间的交互关系;Wang等[13]利用大数据分析和挖掘方法,跟踪分析了缅甸和越南GDELT数据集中的政治事件,并将其进行可视化分析。GDELT数据集具有时间跨度较长与实时更新的特点,能被应用于冲突、风险预测方面,如Qiao等[14]将子图挖掘模型应用于GDELT的占领抗议事件检测,并运用回归模型进一步预测抗议事件。
云南省是中国面向南亚、东南亚的辐射中心,地处中国与东南亚、南亚三大区域的结合部。而东南亚拥有陆海兼具的特殊地缘空间和丰富的资源[15],研究中国与东南亚国家间的地缘关系,对维护中国外交形象,保障国家安全,促进“一带一路”倡议的高效实施等具有重要意义。虽然目前已有很多基于GDELT的地缘交互关系研究,但在关系研究时忽略了多因子相互作用的机制,只是简单地计算单因子,在时空分析上也存在不确定性和复杂性。
因此,本文基于GDELT数据集,结合地理信息技术和方法定量分析地缘对象间的交互关系,从时空角度探索其变化趋势和发展规律,并通过可视化方法制作交互关系专题图,以中缅为例,从交互关系视角分析两国地缘政治、经济、文化关系,为通过云南省推进周边国家“一带一路”建设提供战略支撑。
1 数据与方法 1.1 GDELT数据集GDELT数据集记录了1979年至今的所有新闻数据,事件库里的每条数据记录由事件编号及日期、事件参与者、事件动作、事件地理信息以及数据管理5个部分组成,共58个字段[16]。事件编号及日期记录了事件的唯一标识符和具体发生日期。事件参与者描述了事件中两个参与者的属性,参与者1、参与者2分别代表事件的发起者和目标。GDELT还采用冲突与调解事件观察(conflict and mediation event observations,CAMEO)对事件进行编码[17],提取的事件为政治合作或冲突事件。参与者字段可能由于无法被识别而成为空白字段,因此本文仅考虑两个参与者都被明确识别的情况。事件动作描述了参与者具体的事件行为,包括事件类型、戈尔德斯坦量表分值、报道次数和平均语调。其中,事件类型字段名称是QuadClass,属性1和2表示合作性质,3和4表示冲突性质。GoldsteinScale字段用以衡量该事件对国家产生的潜在影响,每个事件被分配-10~10之间的数值,正值表示事件对国家有正面影响,负值表示事件对国家有负面影响。Actor1Geo_CountryCode、Actor2Geo_CountryCode表示国家字符代码。本文以中国及与云南相邻的5个东南亚国家,即越南、老挝、缅甸、泰国、柬埔寨作为研究对象,提取了2015—2019年与中国共同出现的新闻事件及属性信息,主要使用QuadClass、GoldsteinScale、Actor1Geo_CountryCode、Actor2Geo_CountryCode 4个字段筛选数据,共筛选出174 669条有效数据。
1.2 地缘交互关系制图采用空间制图方法表达地缘交互关系,不仅能直观反映各国的空间特征,还能表达其关系强弱,有助于分析其中蕴含的规律[10]。本文在可视化时,统计合作与冲突两类事件发生的次数和事件影响分数,使用柱状图反映不同时间内影响分数的变化。这种基于关系评价量值的方法能够直观地表达确切的数量概念,区分时序关系特征[18]。在基于关系链路的制图研究上,对合作与冲突事件进行了区分,用节点表示地缘体,节点的大小为事件交互次数,边的宽度是合作次数和事件影响分数的综合结果。
1.3 社会网络构建社会网络是对象成员及其相互关系的集合,社会网络分析方法旨在分析不同社会单位所构成的关系的结构或属性[19]。本文定义两个国家共同参与一个事件为一次交互,统计事件库中5个东南亚国家与中国合作及冲突的交互次数。基于统计筛选后的数据构建无向有权的国家交互网络G,计算一年内国家i与中国交互的边权重wi:
$ G=(V, E, l, w) $ | (1) |
式中,V表示与其他国家有交互的国家集合;E表示国家间的交互集合;l表示节点名称;w表示边权重。
$ w_i=N_i \times \frac{g_i}{\sum\limits_{i=1}^5 g_i} $ | (2) |
式中,Ni为一年内i国与中国的合作或冲突的交互次数;gi为两国合作或冲突交互的影响分数总和。计算结果示例见表 1。
表 1 2015年数据计算结果示例 Tab.1 Example of Calculation Results Obtained by Data in 2015 |
![]() |
1.4 新兴时空热点分析
本文使用新兴时空热点分析工具来探索中国与5个相邻东南亚国家的交互趋势。冷热点分析结果可以直观显示具有统计意义的地方以及随时间变化点分布的趋势。在进行时空热点分析之前,要先创建时空立方体,时空立方体涉及的两个变量是时空立方体条柱的空间大小和时间步长,通过控制变量改变另一个变量,不断测试和分析,最终确定立方体时间步长间隔为3个月,距离间隔为30 km,热点分析的邻域时间步长为12。
2 结果与讨论 2.1 交互事件空间制图基于GDELT计算2015—2019年GoldsteinScale字段的正分总和及负分总和,正分总和代表合作水平,负分总和代表冲突水平。图 1展示了2015—2019年中国与5个国家交互事件合作冲突事件的影响分数变化。事件主要发生于各个国家的几个重要城市和地区,这说明中国与5个国家的接洽主要发生在国家政治经济文化较活跃的地区。从变化趋势上看,中国与缅甸、泰国的合作得分呈下降趋势,与老挝、柬埔寨和越南的合作得分在2016年有激增,而后逐步趋于稳定并呈现略微下降趋势;5年来,中国与东南亚五国的冲突得分均呈减少趋势。总体而言,正分和负分的变化趋势相似,即在同一时段内,两国之间合作增多的同时,冲突也会相应增加。
![]() |
图 1 中国与东南亚五国的交互事件影响分数总和 Fig.1 Total Scores of Interaction Events Between China and Five Southeast Asian Countries |
2.2 社会网络分析 2.2.1 国家合作特征分析
表 2统计了5年来中国与东南亚五国的合作或冲突总数占比。由合作事件占比得出,近5年越南与中国合作最多,占比达41.47%,泰国其次,缅甸与老挝次数较少。图 2为2015—2019年5个国家与中国的合作事件网络。越南最为突出,2016年中国与越南的合作次数最多,双方交互的影响程度也最大。结合国际背景,中越两国合作事件报道的迅速增加是因为2016年中国成为越南最大的贸易进口国,同年设立了中国老挝磨憨和磨丁经济合作区,老挝的节点和边宽在2016年也相应增加,合作事件报道突增对应着两国与中国的经贸项目合作的增加。
表 2 5年中国与东南亚五国的合作/冲突总数占比 Tab.2 Proportion Values of the Total Numbers of Cooperations/Conflicts Between China and Five Southeast Asian Countries in the Five Years |
![]() |
![]() |
图 2 中国与东南亚五国的合作交互网络 注:越南(VM)、老挝(LA)、缅甸(BM)、泰国(TH)、柬埔寨(CB)、中国(CH)。 Fig.2 Interactive Networks of Cooperations Between China and the Five Southeast Asian Countries |
2.2.2 国家冲突特征分析
与合作事件比例相似,越南、泰国与中国冲突事件报道占比最大,柬埔寨和缅甸其次,老挝与中国的冲突事件占比最小。在和平的背景下,中国与其他国家并未发生显著的激烈冲突,主要是一些历史遗留问题导致的摩擦。比较表 2中冲突与合作的占比,发现越南、缅甸与中国的冲突比例大于合作比例。从图 3可以得出,越南的节点大小高于其他国家,由于南海岛礁问题,越南与中国的冲突事件在2016年居多,而后几年事态归于平稳。缅甸与中国冲突事件从2015年到2019年逐渐减少。值得注意的是,交互网络中边的权重是交互次数与影响得分计算所得的综合指数,因此交互次数的多少并不完全代表一年内事件总体对国家的影响,如柬埔寨与中国冲突事件次数5年都在1 000次左右,节点大小变化不大,但边宽从2017年逐渐变大,意味着冲突事件对两国的影响也在逐渐增加。
![]() |
图 3 中国与东南亚五国的冲突交互网络 注:越南(VM)、老挝(LA)、缅甸(BM)、泰国(TH)、柬埔寨(CB)、中国(CH)。 Fig.3 Interactive Networks of Conflicts Between China and the Five Southeast Asian Countries |
2.3 交互热点空间格局
通过新兴时空热点分析评估2015—2019年东南亚五国与中国合作事件和冲突事件交互模式的变化,最终未检测出交互冷点,检测出的热点类型有连续热点、加强热点和持续热点3种,见表 3。与中国的连续热点分布在泰国、柬埔寨、越南。泰国和越南有持续热点,在2015—2019年内中国与这两国长期保持友好关系。比起连续和持续热点,加强热点更值得关注。除越南外,中国与其他4个国家都有出现加强热点,合作水平呈增强态势。冲突的连续热点和合作事件热点均分布在泰国、柬埔寨、越南这3个国家。中国与5个国家的合作热点要多于冲突热点,中国与周边国家总体处于和平发展的大环境下,在全球化背景下,国家间的合作往来更多。
表 3 交互事件新兴时空热点分析结果 Tab.3 Analysis Results of Emerging Hot Spot Analysis of Interactive Events |
![]() |
2.4 中缅地缘关系变化分析
从地理环境上看,中国与缅甸、老挝、越南均有陆地接壤,其中,中国与缅甸陆地边境线最长。缅甸不仅自身自然资源丰富、地理条件优越,对中国而言,其地理战略位置也十分重要。此外,两国还具有悠久的历史民族联系,边境线两边住着同源跨境民族,语言相通,文化相融。因此,本文以缅甸为例进一步分析两国地缘关系变化的原因。
之前的分析结果显示,中缅合作处于较低的水平,冲突事件次数逐年降低,热点分析结果显示中缅存在合作方面的加强热点,无冲突热点。尽管2015年缅甸政府与北部少数民族武装组织签署了《全国停火协议》,但缅北的武装冲突依旧不断。在“一带一路”的倡议下,中缅在经济、文化领域保持交流合作,开展能源产业、劳动密集型产业合作,依托“人字形”中缅经济走廊,加强基础设施互通建设,深化资金融通[20]。中国出于国家安全和经济发展的角度一直在积极促进缅甸的和平进程,但碍于缅甸的复杂局势,中缅合作受限[21]。缅甸军方掌控经济的国情致使其社会经济发展受到一定影响,美国、日本等国家的对缅政策增加了中缅合作的不确定性,国内武装冲突一定程度上也阻碍了中缅的地缘合作。
图 4展示了中缅政治、经济事件报道数量变化。中缅两国的政治和经济交互事件均呈下降趋势。首先基于参与者类型字段的CAMEO代码分类,如参与者代码为COP(警方)、GOV(政府)、OPP(政府反对派)等则将其归为政治事件,为AGR(农业)、BUS(商业)等则将其归为经济事件,再根据QuadClass字段划分合作与冲突属性。受缅甸国内战事、选举、民族矛盾与外部势力的综合影响,中缅两国政治互信不足,安全合作水平不高,因此中国在缅甸的投资领域较窄,主要集中于矿产、水电、能源等资源领域,两国之间也多为政治层面的交涉。从筛选的数据中可以发现,中缅政治类型的事件报道比重较大,而经济合作较少。中缅合作可基于双边民族文化,借助“一带一路”这一契机,加强文化交流,经济发展重点也可由资源能源型产业向劳动密集型产业和制造业倾斜,建设交通基础设施从而促进中缅合作交流。
![]() |
图 4 2015—2019年中缅政治、经济事件报道数量 Fig.4 Numbers of Reports on Political and Economic Events in China and Myanmar from 2015 to 2019 |
3 结束语
本文利用GDELT新闻数据库进行中国与东南亚五国交互事件的空间制图、交互网络构建,利用热点分析对交互事件进行时空挖掘。对国家间的交互关系进行统计和分析,进一步分析了国家合作和冲突事件交互网络的时序变化规律。结果表明,越南和泰国交互最多,且中国与越南的交互最为复杂,而中国与老挝、缅甸、柬埔寨的交互较为平稳。除越南外,中国与另外4个国家的合作水平呈增强态势。本文改进了关系网络构建的边权重计算方法,采用事件交互次数与事件影响强度的综合指数来度量交互网络的边权重,不仅考虑国家之间的交互次数,还考虑了事件对国家的影响程度,一定程度上消除了GDELT数据集在统计上的误差影响。但在地缘关系研究中,定量分析也存在数据误差,因此在利用大数据进行定量研究时还要注重地缘理论的支撑,注重定量与定性结果的对比分析。
[1] |
秦奇, 吴良, 李飞, 等. 基于社会网络分析的东南亚地缘关系研究[J]. 地理学报, 2018, 73(10): 2014-2030. DOI:10.11821/dlxb201810014 |
[2] |
李鲁奇, 孔翔, 李一曼, 等. "一带一路"倡议下中国与中亚合作的战略支点选择[J]. 地理研究, 2019, 38(7): 1705-1719. |
[3] |
陈小强, 袁丽华, 沈石, 等. 中国及其周边国家间地缘关系解析[J]. 地理学报, 2019, 74(8): 1534-1547. |
[4] |
宋涛, 程艺, 刘卫东, 等. 中国边境地缘经济的空间差异及影响机制[J]. 地理学报, 2017, 72(10): 1731-1745. DOI:10.11821/dlxb201710001 |
[5] |
苏东辉, 骆华松, 蔡定昆. 区外大国与东南亚地缘经济关系测度分析[J]. 世界地理研究, 2013, 22(1): 1-11. |
[6] |
洪菊花, 骆华松, 梁茂林, 等. "一带一路"重大项目地缘风险研究[J]. 人文地理, 2018, 33(1): 130-136. |
[7] |
Zhang C C, Xiao C W, Liu H L. Spatial Big Data Analysis of Political Risks Along the Belt and Road[J]. Sustainability, 2019, 11(8): 2216. DOI:10.3390/su11082216 |
[8] |
翟晨阳, 杜德斌, 侯纯光, 等. 基于合作与冲突视角的"亚洲水塔"周边国家地缘关系网络演化研究[J]. 地理研究, 2021, 40(11): 3118-3136. DOI:10.11821/dlyj020201159 |
[9] |
魏中胤, 沈山, 贾广宇, 等. 基于媒体事件的中亚、东盟区域对中国地缘关系判别研究[J]. 世界地理研究, 2021, 30(4): 732-743. DOI:10.3969/j.issn.1004-9479.2021.04.2020841 |
[10] |
赵文双, 江南, 谢雨芮, 等. 地缘环境可视化方法综述[J]. 测绘科学, 2022, 47(1): 172-180. |
[11] |
牟乃夏, 任浩楠, 张灵先, 等. 海上丝绸之路海运网络交通不均衡性的可视化表达与分析[J]. 测绘地理信息, 2022, 47(1): 30-35. |
[12] |
秦昆, 罗萍, 姚博睿. GDELT数据网络化挖掘与国际关系分析[J]. 地球信息科学学报, 2019, 21(1): 14-24. |
[13] |
Wang B, Wang D, Xie Y C. Research on the Construction and Application of Burma-Vietnam's Political Event Data Set[C]. 2018 IEEE 4th International Conference on Big Data Security on Cloud(BigDataSecurity), IEEE International Conference on High Performance and Smart Computing, (HPSC)and IEEE International Conference on Intelligent Data and Security, Omaha, NE, USA, 2018
|
[14] |
Qiao F C, Wang H. Computational Approach to Detecting and Predicting Occupy Protest Events[C]. 2015 International Conference on Identification, Information, and Knowledge in the Internet of Things(ⅡKI), Beijing, China, 2015
|
[15] |
李兵, 彭飞. 基于GDELT数据库的中国及东南亚国家间地缘关系演变[J]. 世界地理研究, 2021, 30(6): 1127-1139. DOI:10.3969/j.issn.1004-9479.2021.06.2020251 |
[16] |
沈石, 宋长青, 程昌秀, 等. GDELT: 感知全球社会动态的事件大数据[J]. 世界地理研究, 2020, 29(1): 71-76. |
[17] |
Gerner D J, Schrodt P A, Yilmaz O, et al. The Creation of CAMEO (Conflict and Mediation Event Observations): An Event Data Framework for a Post Cold War World[C]. Proceedings of the Annual Meeting of the American Political Science Association, New Orleans, USA, 2002
|
[18] |
任福, 严涵, 龚丽芳, 等. 多空间尺度的灾害应急动态制图规则[J]. 测绘地理信息, 2020, 45(3): 1-7. |
[19] |
彭飞, 宋雪珂, 张琦琦, 等. 中美及中国周边海洋国家地缘政治关系时空演化[J]. 地理科学, 2021, 41(4): 598-605. |
[20] |
刘祎, 宋涛, 孙曼. 缅甸的地缘环境演化及中缅合作启示[J]. 世界地理研究, 2019, 28(2): 124-132. |
[21] |
Roy C. China's Grand Strategy and Myanmar's Peace Process[J]. International Relations of the Asia-Pacific, 2020, 22(1): 69-99. |