文章快速检索    
  地震地磁观测与研究  2024, Vol. 45 Issue (2): 171-176  DOI: 10.3969/j.issn.1003-3246.2024.02.022
0

引用本文  

胡越, 王卓, 方瑶. 基于新浪微博的2022年吉林松原MS 4.3地震舆情信息数据分析[J]. 地震地磁观测与研究, 2024, 45(2): 171-176. DOI: 10.3969/j.issn.1003-3246.2024.02.022.
HU Yue, WANG Zhuo, FANG Yao. Analysis of public opinion information data for the Jilin Songyuan MS 4.3 earthquake based on Sina Weibo[J]. Seismological and Geomagnetic Observation and Research, 2024, 45(2): 171-176. DOI: 10.3969/j.issn.1003-3246.2024.02.022.

基金项目

黑龙江省地震局一般科研项目(项目编号:202205)

作者简介

胡越(1995—),女,硕士研究生,助理工程师,主要从事信息网络安全工作。E-mail:724277294@qq.com

文章历史

本文收到日期:2023-10-24
基于新浪微博的2022年吉林松原MS 4.3地震舆情信息数据分析
胡越   王卓   方瑶     
中国哈尔滨 150090 黑龙江省地震局
摘要:基于新浪微博数据,运用网络爬虫技术,获取2022年3月16日吉林松原MS 4.3地震舆情信息数据并进行分析,发现舆情传播生命周期通常为震后48小时,震后舆情传播信息广度通常呈双峰分布,官方与自媒体的信息发布更易推动舆情事件热度多峰的形成,政府与自媒体的介入可有效稳定网友情绪并提升网友情绪评分。
关键词松原MS 4.3地震    网络舆情    新浪微博    数据分析    
Analysis of public opinion information data for the Jilin Songyuan MS 4.3 earthquake based on Sina Weibo
HU Yue   WANG Zhuo   FANG Yao     
Heilongjiang Earthquake Agency, Harbin 150090, China
Abstract: Based on Sina Weibo data, using web crawler technology, this study obtains and analyzes the public opinion information data of the MS 4.3 earthquake in Songyuan, Jilin on March 16, 2022. It is found that the life cycle of public opinion communication is usually 48 hours after the earthquake, and the breadth of public opinion communication information after the earthquake is usually bimodal distribution, and the information release of official and self-media is easier to promote the formation of multiple peaks of public opinion events, while the intervention of the government and self-media after the earthquake can effectively stabilize the emotions of netizens and improve the emotional score of netizens.
Key words: Songyuan MS 4.3 earthquake    network public opinion    Sina Weibo    data analysis    
0 引言

在破坏性地震发生后,大量网友通过新浪微博进行个人观点、态度和情感的表达,使得新浪微博的信息传播数据成为反映社会行为活动和灾害特征的重要数据源之一。同时,新浪微博具有实时性、互动性、强扩散性等特点。因此,通过对震后舆情信息传播数据进行挖掘和处理,分析地震舆情信息传播的规律,对于政府在网络信息的传播、监控、引导和处置等具有重要意义。

近年来,国内外学者对网络信息传播较为关注,利用社交媒体数据进行灾害信息传播演化分析成为研究热点之一。相关研究有:刘国巍等(2015)运用最优分割理论和Moran’s Ⅰ指数构建非常规突发事件网络信息传播演化模型,揭示非常规突发事件网络演化的时空分异规律;胡悦等(2017)提出基于模糊神经网络的微博信息传播趋势预测方法,对微博话题的发展趋势进行了预测。也有部分学者对于地震舆情信息分析挖掘展开了关注与研究,如:赵金楼等(2015)运用社会网络分析方法,对突发事件微博信息传播的网络结构对舆情信息传播的影响进行了研究;曹彦波等(2017)调用新浪微博API,分析了微博灾情时空演变特征。本文在前人研究基础上,对2022年3月16日吉林松原MS 4.3地震在新浪微博上的地震舆情信息讨论进行挖掘和分析,探讨地震信息的传播演化情况,并对地震舆情信息数据分析结果进行可视化展示。

1 技术路线

地震发生后,根据地震三要素等信息,可获取关键词、时间范围、发震地点等检索条件。本研究基于2022年3月16日吉林松原MS 4.3地震在新浪微博中产生的信息传播情况,利用网络爬虫技术,获取新浪微博上与本次地震内容相关的微博、转发、评论、点赞等信息,并进行下载、存储和解析,得到原始数据,就筛选范围内数据进行去重、去噪、分类统计等处理,得到可供研究分析的原始数据集。通过对已处理数据进行分析,计算震后舆情信息发布数量,得到舆情传播生命周期;利用数据中信息发布及转发的数量,计算传播规模广度,度量信息在微博级联网络各个深度的传播效果;采用主体影响力及转评赞数量的热度度量方法,计算主体影响力到单条微博实时热度,累积获得事件的实时热度;对地震微博中与公众情绪相关词汇进行筛选、计算,得到公众满意度情况,进而实现对吉林松原MS 4.3地震舆情信息数据的分析研究。具体研究技术框架见图 1

图 1 技术框架 Fig.1 Technical framework
2 研究方法与过程 2.1 数据获取

选用网络爬虫技术对微博相关舆情信息进行抓取,通过新浪微博的高级搜索功能模块,对吉林松原MS 4.3地震的话题、时间、地点等关键词进行设置,并将信息检索时间设置为震后48小时,以分析该舆情传播演变规律。基于上述条件进行搜索,将获取的浏览器地址导入爬虫程序。考虑到新浪微博的反爬机制,利用选取User Agent、降低爬取频率、使用相应Cookies等方式,通过地址解析、模拟登录、构造URL、爬取网页,同时对爬取数据进行人工抽检,确保数据的可信性和准确性。

2.2 数据处理

爬取的数据信息包括:用户名、发博链接、发博内容、发布日期、转发、点赞、评论数量等。针对本次地震,共爬取到震后48小时内相关信息1 591条,评论信息2 359条。采用去噪、去重等方法,将数据中的无关信息和重复信息进行筛选和删除,对可更正的错误信息予以更正,不可更正的错误信息进行删除,以提高数据质量。使用分类统计方法,对微博中关于地震舆情信息讨论的情绪词汇进行分类。

2.3 舆情传播生命周期

信息传播周期可以划分为4个阶段,分别是萌芽期、成长期、成熟期以及衰退期(王旭等,2017)。韩少卿(2018)在之前关于网络舆情热点事件传播生命周期的研究中发现,网络热点事件传播的生命周期具有短周期性。通过对吉林松原MS 4.3地震震后舆情信息发布数量的统计,讨论舆情信息发布数量变化趋势,分析本次地震舆情传播周期。

2.4 传播规模广度

在对吉林松原MS 4.3地震研究中,以原创微博用户作为网络节点,用户间的转发行为构成级联传播网络,见图 2。传播规模即事件在微博传播网络中所有节点的数目之和,即S+T1+T2+T3。传播广度为在微博传播任意层级上参与转发的用户数量最大值,即T1+T2+T3,该维度用于度量信息在微博级联网络各个深度的传播效果。

图 2 级联传播网络 Fig.2 Cascading propagation network
2.5 事件热度算法

根据爬取数据中获得的用户主体影响力和转发、评论、点赞的数量,逐步计算单条微博的实时热度,进而累积获得事件的实时热度。计算步骤如下:

(1)计算吉林松原MS 4.3地震相关微博原创及转发用户的主体影响力,进而度量其微博用户主体的影响力权重。用户主体影响力为

$ Z T_i=\log _{10}\left(1+F_i+W_i\right) * I_i $ (1)

其中,Fi为用户i的粉丝数量;Wi为用户i的历史发博数量;用户身份Ii对应权重,分别为:非认证用户∶认证用户= 1∶2(牛伟纳等,2019)。

(2)统计吉林松原MS 4.3地震中单条微博的转发数、评论数和点赞数,计算单条微博贡献在该事件中的实时热度值。单条微博的实时热度为

$ r_t=Z T_i \cdot \log _{10}\left(1+Z_t+C_t+L_t\right) $ (2)

其中,Zt为单条微博实时转发数,Ct为评论数,Lt为点赞数。根据所有单条微博实时热度得到吉林松原MS 4.3地震信息的实时热度Rt,公式如下

$ R_t=\sum\limits_{i=1}^n r_t $ (3)
2.6 公众满意度指标

提取新浪微博中关于吉林松原MS 4.3地震舆情讨论的内容,参考GB/T 17742—2008《中国地震烈度表》、GB/T 18207. 1—2008《防震减灾术语第1部分:基本术语》、GB/T 18207.2—2005《防震减灾术语第2部分:专业术语》等相关国家标准中提及的地震专业词汇,结合人工解译和判读,对本次地震微博中与公众情绪相关词汇进行提取、筛选和分类。利用AUC评价指标对民众满意度进行计算。则有

$ \mathrm{AUC}=\frac{m^{\prime}+0.5 m^{\prime \prime}}{m} $ (4)

其中,m为正向情绪词汇出现次数,m为中性情绪词汇出现次数,m为情绪词汇出现次数总数。当AUC = 0时,表示正向情绪得分远低于负向情绪得分;当AUC = 0.5时,表示正向情绪得分等于负向情绪得分;当AUC = 1时,表示正向情绪得分远高于负向情绪得分,即公众满意度高。AUC值越接近于1,证明公众满意度越高。

3 结果与发现 3.1 震后微博舆情信息发布数量走势分析

通过对本次地震震后48小时内新浪微博舆情信息发布数量(图 3)分析可知,震后2小时内,关于地震话题的信息发布数量最多,随后逐渐减少。由于本次地震发生在凌晨2时44分,受作息时间影响,震后于次日上午6—9时再次形成舆情信息发博高峰,但峰值低于震后2小时内信息发布数量峰值,随后逐渐衰减,48小时后信息发布数量趋近于0。因此,本次地震的舆情传播周期为48小时,震后2小时内舆情信息发布数量最多,此时政府部门应该提高舆情风险意识,加强舆情监测和分析。

图 3 吉林MS 4.3地震震后48小时内新浪微博舆情信息发布数量变化趋势 Fig.3 Trends in the number of public opinion information releases on Sina Weibo within 48 hours after the Jilin MS 4.3 earthquake
3.2 震后微博舆情信息传播广度分析

通过震后48小时内新浪微博舆情信息传播广度变化趋势(图 4)可知,本次地震发生后,受到作息时间影响,震后舆情信息的传播广度呈双峰分布,分别为震后2小时内和震后5—7小时,关于地震话题的讨论最为热烈,舆情信息传播广度更宽,更易得到广泛关注与大规模快速传播。对于政府相关职能部门来说,此时可以通过新媒体及时发声,传递科学信息和正能量,通过积极的舆情引导,提高公众对地震的正确认识,避免恐慌情绪的蔓延。

图 4 吉林MS 4.3地震震后48小时内新浪微博舆情信息传播广度变化趋势 Fig.4 Trends in the breadth of public opinion information dissemination on Sina Weibo within 48 hours after the Jilin MS 4.3 earthquake
3.3 震后微博舆情事件热度分析

通过震后48小时内新浪微博舆情事件热度变化趋势(图 5)可知,震后微博舆情事件热度呈多峰分布,热度从事件发生当日基本呈回落趋势,在48小时内逐渐平息。进一步分析发现,本次地震震后2小时内,官方发布地震信息,低权重账户对地震突发事件本身讨论度较高,事件热度形成小高峰;震后5—7小时,微博官方媒体等高权重账户发博数量上升,伴随着网友的关注及讨论,此时事件热度达到最高峰;震后10小时与震后22小时多为官方及自媒体进行相关知识科普引发网友对相关微博进行点赞、评论及转载,形成事件热度小高峰。综合来看,地震事件发生后,在峰值产生的关键时间范围内,政府部门可以把握舆情干预时机,形成网络舆论阵地,有效引导、化解地震信息网络舆情。

图 5 吉林MS 4.3地震震后48小时内新浪微博舆情事件热度变化趋势 Fig.5 Trends in the heat of public opinion events on Sina Weibo within 48 hours after the Jilin MS 4.3 earthquake
3.4 震后公众情绪变化分析

综合震后48小时内新浪微博网友情绪极性分布和情绪评分变化趋势(图 6)可以发现,地震发生后24小时内,网友消极情绪占比较大,47.48%的网友评论表达了害怕、恐惧等消极情绪。通过对这部分消极情感的评论内容进行分析,可以发现:虽然本次地震震级不高,但由于地震发生在凌晨,多地震感较为明显,引发了网友们的恐慌,震后7小时内,网友的情绪评分低于均值0.5并有下降趋势。但随着信息的快速传播,官方媒体与自媒体等影响权重较大的媒体介入,官方发布震情相关信息,自媒体跟进科普创作,网友们及时获得信息反馈,此时其情绪评分虽有波动,但处于上升趋势;在震后24—48小时,网友们情绪逐渐平复,不再有明显的情绪表达,说明政府与自媒体介入并进行正向信息传播时,可以有效稳定网友情绪,并提升网友的情绪评分。

图 6 吉林MS 4.3地震震后48小时内新浪微博网友情绪极性分布和评分变化趋势 Fig.6 Distribution of emotional polarity and trends in emotional scores of Sina Weibo netizens within 48 hours after the Jilin MS 4.3 earthquake
4 结论与讨论

从信息发布数量来看,新浪微博中的地震舆情信息传播周期通常为震后48小时,地震发生后2小时内和震后5—7小时较为关键,此时关于地震话题的信息发布数量最多,政府部门应提高舆情风险意识,加强舆情监测和分析,避免网络舆情危机的发生。

从舆情传播广度上来看,地震发生后传播广度呈双峰分布,震后2小时内和震后5—7小时舆情信息传播广度更宽,更易得到广泛关注与大规模快速传播。对于政府相关职能部门来说,此时可以通过新媒体及时发声,传递科学信息和正能量,通过积极的舆情引导,提高公众对地震的正确认识,避免恐慌情绪的蔓延。

从事件热度上来看,震后微博舆情事件热度呈多峰分布,低权重账号的讨论、官方的信息发布、高权重自媒体的跟进创作均能推动舆情事件的热度,在峰值产生的关键时间范围内,政府部门可以把握舆情干预时机,形成网络舆论阵地,有效引导、化解地震信息网络舆情。

从情绪评分上来看,震后7小时内,网友的负面情绪较多,但整体与官方及高权重自媒体账号的信息发布、科普创作呈正相关,政府与自媒体应在震后7小时内及时与网友进行良性互动,及时发布相关信息,避免造成信息真空和舆情恐慌,有效疏导网友负面情绪。

参考文献
曹彦波, 毛振江. 基于微博数据挖掘的九寨沟7.0级地震灾情时空特征分析[J]. 中国地震, 2017, 33(4): 613-625.
韩少卿. 网络舆情热点事件传播的生命周期研究[J]. 东南传播, 2018(10): 88-90.
胡悦, 王亚民. 基于模糊神经网络的微博舆情趋势预测方法[J]. 情报科学, 2017, 35(12): 28-33.
刘国巍, 程国辉, 姜金贵. 时空分异视角下非常规突发事件网络舆情演化研究——以"上海12.31踩踏事件"为例[J]. 情报杂志, 2015, 34(6): 126-130.
牛伟纳, 张小松, 范文慧. 基于评论数量的微博舆情事件热度与发展趋势预测方法: CN201811336392.3[P]. 2019-3-22
王旭, 孙瑞英. 基于SNA的突发事件网络舆情传播研究——以"魏则西事件"为例[J]. 情报科学, 2017, 35(3): 87-92.
赵金楼, 成俊会. 基于SNA的突发事件微博舆情传播网络结构分析——以"4.20四川雅安地震"为例[J]. 管理评论, 2015, 27(1): 148-157.