中国公共卫生  2015, Vol. 31 Issue (3): 349-352   PDF    
不同自杀可能性微博用户行为和语言特征差异解释性研究
管理1,2, 郝碧波2, 程绮瑾3, 叶兆辉3, 朱廷劭1     
1. 中国科学院心理研究所社会与工程心理学研究室, 北京 100101;
2. 中国科学院大学;
3. 香港大学香港赛马会防止自杀研究中心
摘要目的 通过比较不同程度自杀可能性网络用户在微博行为和语言上的差异, 归纳高自杀可能用户的可识别特征, 探讨通过网络社交平台实时评估个体自杀可能的前景。方法 在线招募微博用户参与问卷调查, 根据个体自杀可能性量表中文版得分情况, 将982名受访者分为446名高自杀可能组和536名低自杀可能组, 分析2组在微博提取的10类行为特征和88类语言特征上的差异。结果 全部受访者自杀可能性总均分为(69.7±11.9)分;女性“敌意”分量表得分为(13.2±2.6)分, 高于男性的(12.7±2.4)分, “绝望”分量表得分为(24.4±4.7)分, 低于男性的(25.0±4.7)分, 差异均有统计学意义(P<0.05);二列相关分析表明,自杀可能性水平与“社交活跃度”和“未来词”使用频率呈负相关(r=-0.082、-0.073, P<0.05), 与“夜间活跃度”和“第三人称单数”、“否定词”使用频率呈正相关(r=0.081、0.077、0.066, P<0.05);非参数检验结果表明, 高自杀可能组的“社交活跃度”、“集体关注度”和“未来词”使用频率低于低自杀可能组(P<0.05), 高自杀可能组的“夜间活跃度”和“死亡词”使用频率大于低自杀可能组(P<0.05)。结论 不同自杀可能性的用户在微博行为和语言表达上存在差异, 高自杀可能性用户与其他用户相比社交活跃度低, 夜间更加活跃, 关注别人更少, 使用更多表达否定、死亡的词语, 使用更少指向未来的词语。
关键词自杀可能性     微博     行为特征     文本分析    
Behavioral and linguistic characteristics of microblog users with various suicide ideation level:an explanatory study
GUAN Li1,2, HAO Bi-bo2, CHENG Qi-jin3, et al3    
Department of Society and Engineering, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China
Abstract: Objective To compare the differences in linguistic and behavioral features of microblog users with various suicide ideation level and to identify the users with high suicide ideation for possible real-time assessment of suicide probability through social network platform.Methods Microblog users were recruited to participate an online survey and 982 respondents completed the survey.The respondents were divided into either high or low suicide ideation group according to their scores measured with the Suicide Probability Scale.The differences between the two groups in 10 behavioral and 88 linguistic features in microblog activities were analyzed.Results The average Suicide Probability Scale score was 69.7±11.9 for all respondents;compared to the male respondents,the female had a higher subscale score of hostility(13.2±2.6 vs.12.7±2.4,P<0.05)and scaled a lower subscale score of desperation(24.4±4.7 vs.25.0±4.7,P<0.05).Suicide ideation level was negatively correlated with social activeness and the frequency of future word use(r=-0.082,-0.073,all P<0.05)and positively correlated with nocturnal activeness and frequent use of third person singular and negative word(r=0.081,0.077,0.066,all P<0.05).The respondents of high suicide ideation were less social interactive,expressed themselves less in first person plural,used "future words" less frequently,were more active at night,and used "death words" more frequently than those of low suicide ideation group(P<0.05).Conclusion Microblog users with higher suicide ideation demonstrate significant differences from those with lower suicide ideation in terms of linguistic and microblog behavioral features.The study supports further exploration on online identification of suicidal individuals.
Key words: suicide probability     microblog     behavioral feature     text analysis    

自杀不仅仅是个人行为,更是重要的公共卫生和精神卫生问题[1,2]。自杀可能性的评估对于自杀的预防起着关键作用。量表作为一种传统自杀可能性评估方法,时效性上有所欠缺。有自杀可能的人尽管很多不会主动寻求专业帮助[3],但在言语表达中往往存在对于自杀倾向的流露[4]。近年来,随着社交网络飞速发展,人们越来越多地在虚拟集群中吐露感受和观点,微博等平台成为社会媒体用户自我表达的主要途径,其中也包含了与自杀有关的自我表达[5]。研究人员开始关注通过这一新的平台收集个体的心理状态信息[6 ,7,8],但有关利用微博平台针对个体进行自杀可能性分析的研究较少。为此,本研究于2014年5—7月,在新浪微博“心理地图”问卷填写平台上通过随机抽样的方法对982名用户进行自杀可能性调查,比较不同程度自杀可能性用户在社交行为、语言使用上的差异,归纳高自杀可能用户的可识别特征,为建立用户自杀可能性在线预警系统提供参考依据。

1 对象与方法 1.1 对象

邀请新浪微博用户参与在线问卷调查,并经过允许获得其公开微博数据。邀请用户参与研究的方式主要有3种:(1)在微博公共账号“心理地图Psymap”上发布招募通知;(2)通过随机给微博用户留言的方式发布邀请;(3)邀请微博认证名人帮助转发招募通知(如:用户“心理学张侃”,目前有超过97万名关注者)。共征集1 196名参与者,其中有效填写用户1 040人。根据伦理学的要求,只保留年满18周岁用户的数据,并且删除存在相同IP地址重复填写的账户,最终样本包含982名微博用户。本研究得到中国科学院心理研究所伦理委员会批准。

1.2 方法 1.2.1 数据收集及用户分组

问卷采用Cull 和 Gill在1982年编制的“自杀可能性量表”(Suicide Probability Scale,SPS)[9],该量表对于14岁以上青少年及成人个体的自杀风险评估有很好的效果。中文版共计36个条目,分为4个分量表:敌意,自杀意念,负性自我评价和绝望,每题1~4计分,得分越高,表明自杀可能性越大。收到邀请并有意向参与调研的用户通过新浪微博账号可登录访问“心理地图”微博应用,签署研究知情同意书后在线填写SPS中文版以及人口统计学信息(性别,年龄等)。“心理地图”微博计算并导出用户的量表分数。依据国外学者对高自杀可能的筛出分数研究[10],并结合国内学者对于6 794名大学生样本测试的得分分布[11],将70分作为高自杀可能和低自杀可能的分组标准,获得高自杀可能组用户446人(45.4%),量表平均得分(80.1±8.4)分,低自杀可能组用户536人(54.6%),量表平均得分(61.0±5.7)分。

1.2.2 行为和语言特征提取

通过填写问卷用户的微博ID,在新浪微博数据开放平台的接口可以下载到用户公开发布的微博数据。(1)行为特征提取:根据用户的自我表达,与其他用户的互动,以及活跃周期等方面提取10类微博用户行为数据(见表 1)。由于微博用户的登陆周期不尽相同,为排除时间因素对用户数据的影响,行为特征指标大多采用比率数据或平均每篇微博的特征计数值。(2)语言特征提取:本研究使用中文心理分析词典,是诸多计算机化文本分析工具中的一种,可以对心理学研究和实践中产生的大量有潜在价值的文本信息进行便利分析,同时兼顾词语使用的内容和形式,可以用来研究人们的口头与书面语言背后的认知、情绪和结构成分[12]。在原英文词典语言查询与词汇计数(linguistic inquiry and word count,LIWC)基础上,高锐等[13]编制了简体中文词典,涉及词类包括总体描述词、语言过程词、心理过程词、个人关切词等共计88种特征。语言特征的分析由中国科学院心理研究所计算机网络心理课题组研发的“文心中文心理分析系统”完成,输出88类词语使用频率百分数。

表 1 行为特征及操作定义



1.3 统计分析

采用SPSS 17.0软件进行性别差异分析、二列相关分析和特征值组间差异分析。在差异分析中,对于样本服从正态分布的,使用独立样本t检验;对于不服从正态分布的,采取非参数检验中的Mann-Whitney U秩和检验。

2 结 果 2.1 一般情况

982名用户中,女性608人(61.9%),男性374人(38.1%);平均年龄(24.2±4.9)岁,其中18~25岁737人(75.1%),26~35岁215人(21.9%),>35岁30人(3.0%)。在446名高自杀可能用户中,女性277人(62.1%),男性169人(37.9%);平均年龄(24.2±4.9)岁,其中18~25岁326人(73.1%),26~35岁109人(24.4%),>35岁11人(2.5%)。在536名低自杀可能用户中,女性331人(61.8%),男性205人(38.2%);平均年龄(24.2±4.9)岁,其中18~25岁411人(76.7%),26~35岁106人(19.8%),>35岁19人(3.5%)。

2.2 用户自杀可能性得分及性别差异比较(表 2)982名微博用户自杀可能性总均分为(69.7±11.9)分,其中敌意量表得分为(13.0±2.5)分,自杀意念量表(11.5±3.2)分,负性自我评价量表(20.5±4.4)分,绝望量表(24.6±4.7)分。女性敌意分量表得分高于男性,绝望分量表得分低于男性,差异均有统计学意义(P<0.05);女性和男性量表总均分及其他分量表得分差异均无统计学意义(P>0.05)。

表 2 微博用户自杀可能性得分的性别比较(分,x±s)
2.3 自杀可能性水平与微博特征二列相关分析

将自杀可能性水平(高或低)与行为、语言特征值之间作二列相关分析,共有2种行为特征和3种语言特征与自杀可能性水平的相关系数有统计学意义。在行为特征中,高自杀可能组与低自杀可能组的“社交活跃度”分别为0.22、0.27,自杀可能性水平与“社交活跃度”负相关(r=-0.082,P=0.010);高自杀可能组与低自杀可能组的“夜间活跃度”分别为0.17、0.15,自杀可能性水平与“夜间活跃度”正相关(r=0.081,P=0.011)。在语言特征中,高自杀可能组与低自杀可能组的“第三人称单数词”(例如:他,她,这位)使用频率分别为0.18%、0.17%,自杀可能性水平与“第三人称单数词”使用频率正相关(r=0.077,P=0.016);高自杀可能组与低自杀可能组的“否定词”(例如:不要,未必,没有)使用频率分别为0.07%、0.06%,自杀可能性水平与“否定词”使用频率正相关(r=0.066,P=0.040);高自杀可能组与低自杀可能组的“将来词” (例如:之后,即将,将来)使用频率分别为0.08%、0.10%,自杀可能性水平与“未来词”使用频率负相关(r=-0.073,P=0.023)。

2.4 高自杀可能组与低自杀可能组用户行为差异分析(表 3)

K-S检验结果表明,行为特征数据均不符合正态分布(P<0.05),因而对行为特征进行Mann-Whitney U秩和检验。结果表明,“社交活跃度”、“集体关注度”和“夜间活跃度”特征差异有统计学意义(P<0.05)。

表 3 行为特征秩和检验结果
2.5 高自杀可能组与低自杀可能组用户语言差异分析(表 4)

K-S检验结果表明,语言特征中的“功能词”、“时态标定词”和“其他标点符号词”数据服从正态分布(P>0.05)。因而对这些语言特征进行独立样本t检验,结果表明高分组和低分组在这些特征上的差异均无统计学意义(P>0.05)。对其余语言特征进行Mann-Whitney U秩和检验。结果表明,高分组和低分组在“死亡词”(如:亡故,自杀,遗嘱)和“未来词”(如:之后,即将,将来)的使用频率差异有统计学意义(P<0.05)。

表 4 语言特征秩和检验结果
3 讨 论

本研究结果显示,高自杀可能组与低自杀可能组相比在微博上社交程度更低,夜间(22点到次日6点)更加活跃,与已有研究结果一致,低水平社交互动被认为是高自杀风险的重要表现之一[14,15];精神病学报告也反映出自杀与夜间睡眠障碍之间的强关联[16]。国内学者曾在微博抑郁检测模型中使用“夜间活跃度”特征,也取得一定的效果[17]。这说明不论是在现实生活中还是网络社交平台,社会交往程度与夜间活跃程度可能是反映个体心理健康水平,进一步反映自杀可能性的重要行为评估指标。

本研究结果还显示,高自杀可能组更频繁地使用与死亡相关的词语,其中也包含与自杀有关的词汇。已有研究反映出相似的结果,有自杀倾向的诗人在作品中更多使用与死亡有关的词汇[18]。本研究发现高自杀可能组更少地使用指向未来的词语。这表明高自杀可能的用户对未来感受到更多的无助、无望[19 ,20],并且在网络上有所表达。

已有研究揭示了高自杀可能人群表达更多消极情感[21,22,23]。本研究中高自杀可能组对应更高频率的否定词语使用,这表明从认知角度高自杀可能的个体也会产生更多消极表达。已有研究表明,有高自杀风险的个体更加关注自我而提及周围环境较少[17,24]。本研究发现高自杀可能组对应更高频率的第三人称单数指代,与以往研究结果不尽相同;但这可能与中国文化表达习惯有关,今后的自杀语言研究中应予以特别注意。

国内学者运用SPS量表的主要施测对象为大学生群体[11,25],本研究首次将其应用到微博平台。根据新浪微博发布的用户调研报告,18岁以下青少年和35岁以下成年人占用户数目的90%左右,总体较年轻。本研究的量表得分分布与大学生样本的分布高度一致,因而作为探索性研究,可以认为SPS也可用于鉴别微博用户的自杀可能性。今后在进一步开展相关研究的过程中可以考虑检验SPS在网络用户群体中的信效度,推广应用范围。本研究招募用户的方式可能会吸引更关注自身心理健康水平的用户,女性样本更多。但由于研究主要关注不同程度自杀可能性用户间的特征比较,且男性与女性自杀可能性总分没有差异,因而并不对研究结果产生影响。

当代自杀预防工作迫切需要时间效率更高、渗透更广的方法,而网络社交平台很可能成为解决这一需求的突破口。本研究揭示了高自杀可能性用户在微博的一些行为表现以及语言表达上和其他用户存在差异,这在今后的工作中可能从一定程度上帮助研究人员鉴别具有较高自杀可能性的个体。

参考文献
[1] 阚双余,郑小方.大学生自杀意念与家庭环境关系[J].中国公共卫生,2013,29(2):167-168.
[2] 程龙慧,陈辉,郑名烺.农村老年人自杀意念及其与家庭环境因素关系[J]. 中国公共卫生,2013,29(2):157-158.
[3] 江光荣.心理求助行为:研究现状及阶段-决策模型[J].心理科学进展,2006,14(6):888-894.
[4] Ray LY,Johnson N.Adolescent suicide[J]. The Personnel and Guidance Journal,1983,62(3):131-5.
[5] Fu KW,Cheng Q,Wong PW,et al.Responses to a self-presented suicide attempt in social media:a social network analysis[J].Crisis:The Journal of Crisis Intervention and Suicide Prevention,2013,34(6):406.
[6] Cheng Q,Chang SS,Yip PS.Opportunities and challenges of online data collection for suicide prevention[J].The Lancet,2012,379(9830):e53-e54.
[7] Silenzio V,Duberstein PR,Tang W,et al.Connecting the invisible dots:reaching lesbian,gay,and bisexual adolescents and young adults at risk for suicide through online social networks[J].Social Science and Medicine,2009,69(3):469-474.
[8] Jashinsky J,Burton SH,Hanson CL,et al.Tracking suicide risk factors through Twitter in the US[J].Crisis:The Journal of Crisis Intervention and Suicide Prevention,2013,35(1):51-59.
[9] Cull JG,Gill WS.Suicide probability scale[M].Los Angeles,CA:Western Psychological Services,1982.
[10] Valadez A,Juhnke GA,Coll KM,et al.The Suicide Probability Scale:a means to assess substance abusing clients suicide risk[J].Journal of Professional Counseling:Practice, Theory,and Research,2009,37(1):51-65.
[11] 刘国华,张桂英.大学生自杀可能性的性别比较[J].中国学校卫生,2012,33(10):1198-1200.
[12] Pennebaker JW,Mehl MR,Niederhoffer KG.Psychological aspects of natural language use:our words,ourselves[J].Annual Review of Psychology,2003,54(1):547-577.
[13] Gao R,Hao B,Li H,et al.Developing simplified Chinese psychological linguistic analysis dictionary for microblog[M].Brain and Health Informatics,Springer,2013:359-368.
[14] Duberstein PR,Conwell Y,Conner KR,et al.Poor social integration and suicide:fact or artifact? A case-control study[J].Psychological Medicine,2004,34(07):1331-1337.
[15] Beautrais AL.A case control study of suicide and attempted suicide in older adults[J].Suicide and Life-Threatening Behavior,2002,32(1):1-9.
[16] McCall WV,Black CG.The link between suicide and insomnia:theoretical mechanisms[J].Current Psychiatry Reports,2013,15(9):1-9.
[17] Wang X,Zhang C,Ji Y,et al.A depression detection model based on sentiment analysis in microblog social network[M].Trends and Applications in Knowledge Discovery and Data Mining,Springer,2013:201-213.
[18] Stirman SW,Pennebaker JW.Word use in the poetry of suicidal and nonsuicidal poets[J].Psychosomatic Medicine,2001,63(4):517-22.
[19] Kovacs M,Garrison B.Hopelessness and eventual suicide:a 10-year prospective study of patients hospitalized with suicidal ideation[J].American Journal of Psychiatry,1985,1(42):559-563.
[20] Pompili M,Rihmer Z,Akiskal H,et al.Temperaments mediate suicide risk and psychopathology among patients with bipolar disorders[J]. Comprehensive Psychiatry,2012,53(3):280-285.
[21] Li TM,Chau M,Yip PS,et al.Temporal and computerized psycholinguistic analysis of the blog of a Chinese adolescent suicide[J].Crisis:The Journal of Crisis Intervention and Suicide Prevention,2014,35(3):1-8.
[22] Li TM,Chau M,Wong PW,et al.A hybrid system for online detection of emotional distress[M].Intelligence and Security Informatics,Springer,2012:73-80.
[23] Pestian JP,Matykiewicz P,Linn-Gust M,et al.Sentiment analysis of suicide notes:a shared task[J].Biomedical Informatics Insights,2012,5(Suppl 1):3.
[24] Wolf M,Sedway J,Bulik CM,et al.Linguistic analyses of natural written language:Unobtrusive assessment of cognitive style in eating disorders[J].International Journal of Eating Disorders,2007,40(8):711-717.
[25] 梁瑛楠,杨丽珠.自杀可能性量表的信效度研究[J].中国健康心理学杂志,2010,18(2):225-227.