中国公共卫生  2016, Vol. 32 Issue (2): 225-229   PDF    
微博用户生活满意度微博语言及行为特征分析
汪静莹1,2, 朱廷劭1,3 , 郝碧波2, 刘天俐4    
1. 中国科学院心理研究所社会与工程心理学研究室, 北京 100101;
2. 中国科学院大学;
3. 中国科学院智能信息处理重点实验室中国科学院计算技术研究所;
4. 北京大学人口研究所
摘要目的 通过分析生活满意度高、低水平的微博用户在微博语言和行为上的差异,归纳出可以区分生活满意度高低的微博特征。方法 于2012年10月通过新浪微博招募被试,收集被试的人口学资料、生活满意度和微博特征数据。以生活满意度得分的平均数加减前后一个标准差为条件筛选出高低分组,得到325名高分组和303名低分组被试,对2组被试的各个特征进行差异检验。结果 生活满意度总均分为(13.6±9.8)分;高分组生活满意度为(22.8±2.7)分,低分组为(3.7±2.0)分,差异有统计学意义(P<0.001);非参数检验中,高分组(M,QR)特定人称代名词(3.92,2.67)、第一人称代词单数(2.04,1.29)、第一人称代词复数(0.06,0.00)、相对词(9.21,7.55)、空间词(3.91,3.07)和金钱词(0.42,0.00)6个语言特征的使用频率均高于低分组的(3.55,2.39)、(1.91,1.02)、(0.00,0.00)、(8.71,7.23)、(3.59,2.84)、(0.28,0.00),差异有统计学意义(P<0.05),高分组排除词的使用频率为(1.76,1.13),低于低分组的(1.98,1.22),差异有统计学意义(P<0.05);行为特征方面,高分组的互粉数与关注数之比(0.42,0.23)、互粉数(103,55)、粉丝数(463,309)和认证数(0.00,0.20)均高于低分组的(0.35,0.19)、(86,46)、(415,221)、(0.00,0.00),差异有统计学意义(P<0.05)。结论 不同生活满意度的微博用户在部分微博语言特征和行为特征上存在差异。
关键词生活满意度     微博     语言特征     行为特征    
Life satisfaction among microblog users:an analysis on linguistic and behavior features
WANG Jing-ying1,2, ZHU Ting-shao1,3 , HAO Bi-bo2, et al    
Department of Society and Engineering, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China
Abstract: Objective To analyze differences and characteristics in linguistic content and behaviors among the microblog users with different life satisfaction level.Methods The participants were recruited from active microblog users via Sina microblog.The information on demography,life satisfaction level,and online traces of the participants were collected with web crawler.We calculated the mean(M) and standard deviation(SD) of life satisfaction score and M±SD value was adopted as the threshold to assign the participants into a high(325) and low(303) satisfaction group.Then the disparities in the characteristics between the two groups were assessed.Results The overall average life satisfaction score was 13.6±9.8 for all the participants;the average score was 22.8±2.7 for the participants of high satisfaction group and 3.7±2.0 for those of low satisfaction group,with a significant difference(P<0.001).The results of non-parametric test showed that compared to those of low satisfaction group,the participants of high satisfaction group used following words more frequently(mean frequency;quartile range of the frequencies):particular personal pronoun(3.92 vs.3.55;2.67 vs.2.39),first-person singular pronoun(2.04 vs.1.91;1.29 vs.1.02),first-person plural pronoun(0.06 vs.0.00;0.00 vs.0.00),relative term(9.21 vs.8.71;7.55 vs.7.23),special word(3.91 vs.3.59;3.07 vs.2.84),words for money(0.42 vs.0.28;0.00 vs.0.00)(all P<0.05);but they used exclusive words less frequently(1.76 vs.1.98;1.13 vs.1.22)(P<0.05).For the behavior features,the participants of high life satisfaction group had a higher ratio of mutual follower versus following(mean value;quartile range of the values)(0.42 vs.0.35;0.23 vs.0.19),a greater number of mutual followers(103 vs.86; 55 vs.46),a greater number of followers(463 vs.415; 309 vs.221),and a high ratio of verification(0.00 vs.0.00; 0.20 vs.0.00) compared with those of participants of low life satisfaction group(all P<0.05).Conclusion There are significant differences in some online linguistic and behavior features between the microblog users with high and low life satisfaction.
Key words: life satisfaction     microblog     linguistic feature     behavior feature    

生活满意度(life satisfaction)是个体对其生活状况的总体评估[1]。影响生活满意度的因素很多,如工作、季节、经济状况、居住环境、文化等等[2, 3, 4, 5, 6]。当个体对其生活的不满累积到一定程度可能会做出过激行为,当群体对他们的生活感到不满则容易爆发群体事件危害整个社会和谐。有研究显示,越年长的人拥有越高的平均生活满意度[7]。年轻人的生活满意度更容易走低,意味着年轻人的生活满意度对社会稳定的影响权重更大。新浪微博72%的用户年龄在19~35岁,加之用户量庞大[8],使得微博可提供充足、对口的样本来源。微博受外部因素(如他人评价)影响相比现实更小,其言行也更能体现个体的真实想法。为此,本研究于2012年10月通过课题组的新浪微博公共账号“心理地图”随机邀请到628名微博用户参与调查,旨在揭示可区分出生活满意度的微博特征,为进一步利用这些差异因素建立生活满意度预测模型提供依据。现将结果报告如下。 1 对象和方法 1.1 对象

在新浪微博招募活跃用户为研究对象。本研究参照了以往研究[9]对微博活跃用户的定义(指在招募之前发布的微博总数超过500条的个人账号),同时排除了公共账号、营销号和僵尸号。招募时随机向20 000名活跃用户发送调查邀请,邀请发送一周后结束招募。在所有回收的数据中,排除胡乱填写、信息不全等无效样本后,得到1 773个有效个体,有效率约为8.9%。计算样本生活满意度的平均数[x=13.4]和标准差[s=6.5],使用x±s(6.9为下限,19.9为上限)作为生活满意度的高、低分组阈限筛选出研究需要的被试。最终得到高分组325人,低分组303人,共计628人。 1.2 方法 1.2.1 问卷调查

问卷以网络问卷的方式发放,在发送给被试的调查邀请中附带链接(http://ccpl.psych.ac.cn:10002/)。被试登陆链接,填写同意下载其微博数据(包括公开的微博和个人信息)的知情同意书后,再继续填写页面中的问卷。完成填写并提交后数据自动存储至后台。本研究涉及的问卷包括:(1)人口学资料问卷:自行编制。包括年龄、性别、民族、教育程度、婚姻状态、独生子女、居住地、收入、健康状况和宗教信仰共10个变量。(2)Diener 的生活满意度问卷(Satisfaction with Life Scale,SWLS)中文版[10]:SWLS共计5个项目,使用李克特七点计分,分数越高满意度越高。修订的版本在国内多次施测均得到良好的应用效果[11, 12]1.2.2 微博特征采集

在招募结束的1个月后通过新浪“应用程序编程接口”(application programming interface,API)下载得到微博特征数据。微博特征包括语言特征和行为特征两类。(1)语言特征指用户微博文本中的各种类型词汇的出现频率。因此,需要统计被试所有公开的微博文本中各类词的使用频率百分数。本研究统计词频借助的语言词汇分析程序为简体中文版“语言探索和词类计数”(Simplified Chinese Version of Linguistic Inquiry Words Count,SCLIWC)[13]。该版是根据Pennebaker等人开发的LIWC2007[14]的简体中文版。LIWC是一个专门开发用于对各种格式的文本中的各类词汇计算其使用频率的程序。LIWC将词汇划分为语言过程、心理过程、个人关切和口语四大类,共80种。LIWC信效度良好[15],已有研究将LIWC用于分析自杀意念、情绪情感、人格等心理特征[16, 17, 18, 19]。SCLIWC在LIWC2007的基础上扩展了新浪微博当中出现频率较高但LIWC2007词库中不存在的词汇,这种相容性是本研究采用该程序的原因。(2)行为特征指用户使用微博时做出的各种行为。出于隐私保护和实际需要的权衡,最终选择了13个变量。包括:①与个人隐私有关的:是否允许所有人发送私信、是否允许所有人评论、有无自定义头像、是否开启地理定位和是否获得认证。②与网络社交有关的:关注数(关注的用户的数量)、粉丝数(被多少用户关注)、互粉数(与他人互相关注的数量)、互粉数与粉丝数的比值、互粉数与关注数的比值。③与自我表达有关的:收藏数、微博数、微博中包含的原创微博比例。 1.3 统计分析 使用SPSS 22.0软件对数据进行处理。数据分析之前首先对所有的变量进行正态检验,分布正态的变量使用t检验分析差异,分布不服从正态的变量使用非参数检验中的Mann-Whitney U检验或者卡方检验进行差异分析。由于正态检验(Kolmogorov-Smirnov,K-S检验)的结果显示所有的人口学变量、微博语言和行为特征都是非正态的,故采用卡方检验和Mann-Whitney U检验进行差异分析。 2 结 果 2.1 一般情况

628名微博用户中,女性382人(60.8%),男性246人(39.2%);平均年龄(23.83±5.99)岁;少数民族30人(4.8%);教育程度大专319人(50.8%);未婚401人(63.9%);独生子女345人(54.9%);365人(58.1%)居住在直辖市及省会,210人(33.4%)居住在一般城市,仅53人(8.4%)居住在农村和乡镇;收入以<2 000元为最低档,每2 000元为一档,最高档>10 000元,其中2 000~4 000元227人(36.1%),<4 000元335人(53.3%),≥4 000元293人(46.7%);身体健康534人(85%);无宗教信仰531人(84.6%)。 2.2 生活满意度高分组和低分组人口学特征比较(表 1)

生活满意度总均分为(13.6±9.8)分;高分组为(22.8±2.7)分,低分组为(3.7±2.0)分,差异有统计学意义(P<0.001)。生活满意度高、低分组教育程度、婚姻状况、居住地、月收入、健康状况、宗教信仰差异有统计学意义(P<0.05),年龄、性别、民族及是否独生子女差异无统计学意义(P>0.05)。

表 1 生活满意度高分组和低分组人口学特征比较
2.3 生活满意度高分组和低分组微博语言特征比较(表 2)

生活满意度高、低分组在7项语言特征上的差异有统计学意义(P<0.05);除了排除词,其余6个特征上高分组的中数均高于低分组。提示高分组使用排除词的频率低于低分组,而使用特定人称和第一人称单复数代词、相对词、空间词和金钱词的频率要高于低分组。

表 2 生活满意度高分组和低分组微博语言特征比较
2.4 生活满意度高、低分组行为特征比较(表 3)

生活满意度高、低分组互粉数/关注数、互粉数、粉丝数、认证4个行为特征差异有统计学意义(P<0.05)。

表 3 生活满意度高、低分组行为特征比较
3 讨 论

本研究旨在通过分析生活满意度高、低水平的微博用户在微博语言和行为上的差异,归纳出可以区分生活满意度的高低的微博特征。结果显示,2组在年龄、性别、民族及是否独生子女上的差异无统计学意义,但高分组比低分组有更多的已婚人士、城市人口、身体健康和有宗教信仰者,并且收入和受教育程度更高。已有的研究表明,婚姻作为一个重要的生活事件,在较长的一段时间内对人的影响都是积极的,可显著改变人们的生活满意度水平[20, 21]。国内关于生活满意度城乡差异的研究表明,城镇人口的生活满意度显著高于农村人口[22, 23]。收入对生活满意度的影响研究表明收入与物质渴望有关,对低收入人群来说,提高收入能够显著改善其生活进而提升其生活满意度;但随着收入的增加,物质渴望降低,收入对生活满意度的影响将逐渐减弱[24]。跨国研究显示,对比发达国家,发展中国家中的人更可能受收入增长的影响而提高生活满意度[25]。许多研究都证明不健康的状况会降低个体的生活满意度,而当身体状况好转时生活满意度会得到显著改善[26, 27]。宗教信仰对生活满意度的益处可能来源于人们在参加宗教活动时,来自团体的社会支持间接地提高了信徒的生活满意度[28]。国内的研究发现教育程度能够对幸福感产生积极作用,拥有本科及以上学历的个体生活最满意[29]

语言特征方面,高分组比低分组更频繁的使用各类人称代词。特定人称代名词指如大家、他、你们等用于指代特定对象的人称代名词,而第一人称复数通常用来指代包括使用者在内的多名存在一定关系的人。推测这两类词的使用都与人际往来有关,使用越多表明人际往来越频繁。研究表明[30]在社交网络中如果能够通过社交得到社会支持将有利于生活满意度的提升。以往研究[31]显示第一人称单数词的使用多与负性情绪有关,不同于以往,本研究中高分组使用第一人称单数词频高于低分组。此外,高分组使用更多的金钱词、相对词和空间词,低分组的人使用更多的排除词。目前还未有理论或研究解释这些词类与生活满意度之间的关系。

行为特征方面,高分组比低分组有更多的粉丝数、互粉数和更高的互粉数与关注数之比。粉丝数一部分来源于原本线下就有的人际关系,另一部分则是用户在微博上发表言论(如发微博、评论)引起了陌生用户的关注。后部分的关注可能与在线自我暴露(online self-disclosure)有关。当自我暴露能够带来社会支持(如发表微博获得点赞或积极的回应)时,有利于生活满意度的提升[32],本研究中的高分组可能就是在自我暴露中获益的人群。互粉数体现一种相互关注的关系,与网络社交有关。互粉数与关注数之比指的是在用户关注的人当中有多少人也关注了自己,同样体现的是网络互动与社交。符合网络社交可以提高生活满意度的研究结论[33]。高分组中进行过认证的人数比例要高于低分组。微博认证是一种对用户身份真实性的审核,相当于实名制,意味着真实的自己暴露在公众视野之下。有研究显示网络匿名用户在网络中会表达更强的负面情绪[34],因此猜测认证会影响到用户的情绪表达倾向,即实名用户会抑制负性表达,从而显示出正性表达多的假象。

本研究发现生活满意度高的微博用户和满意度低的用户在部分微博语言特征和行为特征上存在差异。高生活满意度用户通常会使用更多的特定人称代词、第一人称代词单数和复数、相对词、空间词和金钱词,而较少使用排除词,有更高的认证率和被自己关注的人关注的比例,且拥有更多的粉丝数和互粉数。

本研究仍存在一些不足。第1,只取收集到的数据的高、低分组作为样本,浪费了大量的数据。第2,样本的部分人口学变量(性别比例、教育程度、城乡人口比例和收入分布)与实际情况[8, 35, 36]有所偏离可能对分析结果造成了影响。第3,在微博文本的使用中,单纯的排除了转发微博的内容,而未对原创微博和转发微博进行加权处理。未来可以尝试对多组不同生活满意度的人群进行差异研究,对原创微博和转发微博进行更有效的利用,还可以尝试利用已检测出的有差异的微博特征去预测用户的生活满意度。

参考文献
[1] Pavot W,Diener E.Review of the satisfaction with life scale[J].Psychol Assess,1993,5(2):164-172.
[2] Rode JC.Job satisfaction and life satisfaction revisited:a longitudinal test of an integrated model[J].Human Relations,2004,57(9):1205-1230.
[3] Maennig W,Steenbeck M,Wilhelm M.Rhythms and cycles in happiness[J].Appl Econ,2014,46(1):70-78.
[4] 冯晓黎,李兆良,高燕,等.经济收入及婚姻家庭对老年人生活满意度影响[J].中国公共卫生,2005,21(12):1426-1427.
[5] 宋逸,马军,张世伟,等.北京市亚运村社区居民环境与生活满意度比较[J].中国公共卫生,2008,24(8):902-904.
[6] Suh E,Oishi S,Tri HC,et al.The shifting basis of life satisfaction judgments across cultures:emotions versus norms[J].J Pers Soc Psychol,1998,74(2):482-493.
[7] Palgi Y,Shmotkin D.The predicament of time near the end of life:time perspective trajectories of life satisfaction among the old-old[J].Aging and Mental Health,2010,14(5):577-586.
[8] Li L,Li A,Hao B,et al.Predicting active users' personality based on micro-blogging behaviors[J].PLoS One,2014,9(1):e84997.
[9] Wang KT,Yuen M,Slaney RB.Perfectionism,depression,loneliness,and life satisfaction:a study of high school students in Hong Kong[J].Couns Psychol,2009,37(2):249-274.
[10] 张金凤,赵品良,史占彪,等.玉树地震后幸存者的创伤后应激症状、生活满意度与积极情感/消极情感[J].中国心理卫生杂志,2012,26(4):247-251.
[11] 佟永峰,李焰,范杰.中学聋生主观幸福感调查研究[J].中国特殊教育,2006(7):9-12.
[12] Gao R,Hao B,Li H,et al.Developing simplified Chinese psychological linguistic analysis dictionary for microblog[M].Brain and Health Informatics,Springer International Publishing,2013:359-368.
[13] Pennebaker J,Chung C,Ireland M,et al.The development and psychometric properties of LIWC2007[EB/OL].[2015-10-29] .http://www.liwc.net/LIWC2007LanguageManual.pdf.
[14] 张信勇.LIWC:一种基于语词计量的文本分析工具[J].西南民族大学学报:人文社会科学版,2015,4:101-104.
[15] 管理,郝碧波,程绮瑾,等.不同自杀可能性微博用户行为和语言特征差异解释性研究[J].中国公共卫生,2015,31(3):349-352.
[16] Zhang L,Huang X,Liu T,et al.Using linguistic features to estimate suicide probability of Chinese microblog users[M].Human Centered Computing,Springer International Publishing,2015,8944:549-559.
[17] Slatcher RB,Pennebaker JW.How do I love thee? Let me count the words:the social effects of expressive writing[J].Psychol Sci,2006,17(8):660-664.
[18] Bai S,Yuan S,Hao B,et al.Predicting personality traits of microblog users[J].Web Intelligence and Agent Systems,2014,12(3):249-265.
[19] Lucas RE,Clark AE,Georgellis Y,et al.Reexamining adaptation and the set point model of happiness:reactions to changes in marital status[J].J Pers Soc Psychol,2003,84(3):527-539.
[20] Edwards JN,Klemmack DL.Correlates of life satisfaction:a re-examination[J].J Gerontol,1973,28(4):499-502.
[21] 段景辉,陈建宝.中国城乡居民生活满意度的统计调查分析[J].统计与信息论坛,2009,24(4):79-84.
[22] 刘旺.中学生生活满意度的城乡差异[J].中国心理卫生杂志,2006,20(10):647-649.
[23] Easterlin RA,Morgan R,Switek M,et al.China's life satisfaction,1990-2010[J].Proc Natl Acad Sci USA,2012,109(25):9775-9780.
[24] Diener E,Oishi S.Money and happiness:Income and subjective well-being across nations.Culture and subjective well-being[M].Cambridge,MA,US:The MIT Press,2000:185-218.
[25] Palmore E,Luikart C.Health and social factors related to life satisfaction[J].J Health Soc Behav,1972,13(1):68-80.
[26] Diener E,Chan MY.Happy people live longer:subjective well-being contributes to health and longevity[J].Appl Psychol Health Well Being,2011,3(1):1-43.
[27] Lim C,Putnam RD.Religion,social networks,and life satisfaction[J].Am Sociol Rev,2010,75(6):914-933.
[28] 黄嘉文.教育程度、收入水平与中国城市居民幸福感一项基于CGSS2005的实证分析[J].社会,2013,33(5):181-203.
[29] Oh HJ,Ozkaya E,Larose R.How does online social networking enhance life satisfaction? The relationships among online supportive interaction,affect,perceived social support,sense of community,and life satisfaction[J].Comput Human Behav,2014,30:69-78.
[30] Boals A,Klein K.Word use in emotional narratives about failed romantic relationships and subsequent mental health[J].J Lang Soc Psychol,2005,24(3):252-268.
[31] Lee KT,Noh MJ,Koo DM.Lonely people are no longer lonely on social networking sites:the mediating role of self-disclosure and social support[J].Cyberpsychol Behav Soc Netw,2013,16(6):413-418.
[32] Valenzuela S,Park N,Kee KF.Is there social capital in a social network site?:facebook use and college students' life satisfaction,trust,and participation1[J].Journal of Computer-Mediated Communication,2009,14(4):875-901.
[33] 王芳,刘小增,汪静,等.网络社区匿名行为与实名行为比较研究[J].电子政务,2012,4(7):17-22.
[34] 国家统计局.2010年第六次全国人口普查主要数据公报(第1号)[EB/OL].[2011-4-28] .http://www.stats.gov.cn/tjsj/tjgb/rkpcgb/qgrkpcgb/201104/t20110428_30327.html.
[35] International Monetary Fund.World economic outlook database-April,2015[EB/OL][2015-10-29] .http://www.imf.org/external/pubs/ft/weo/2015/01/weodata/index.aspx.