一种基于OCC模型的文本情感挖掘方法

引用本文

皇甫璐雯, 毛文吉. 一种基于OCC模型的文本情感挖掘方法[J]. 智能系统学报, 2017, 12(5): 645-652. DOI: 10.11992/tis.201312032.

HUANGFU Luwen, MAO Wenji. OCC-model-based text-emotion mining method[J]. CAAI Transactions on Intelligent Systems, 2017, 12(5): 645-652. DOI: 10.11992/tis.201312032.

基金项目

国家自然科学基金项目（61175040，71025001）

通信作者

毛文吉.E-mail:wenji.mao@ia.ac.cn

作者简介

皇甫璐雯, 女, 1988年生, 硕士研究生, 主要研究方向为社会媒体信息分析与处理、情感分析与观点挖掘;
毛文吉, 女, 1968年生, 研究员, 博士生导师, 主要研究方向为智能信息处理、人工智能、社会计算

文章历史

收稿日期：2013-12-17
网络出版日期：2017-10-21

Contents Abstract Full text Figures/Tables PDF

一种基于OCC模型的文本情感挖掘方法

皇甫璐雯, 毛文吉

中国科学院自动化研究所复杂系统管理与控制国家重点实验室, 北京 100190

收稿日期：2013-12-17；网络出版日期：2017-10-21

基金项目：国家自然科学基金项目（61175040，71025001）

作者简介：皇甫璐雯, 女, 1988年生, 硕士研究生, 主要研究方向为社会媒体信息分析与处理、情感分析与观点挖掘;
毛文吉, 女, 1968年生, 研究员, 博士生导师, 主要研究方向为智能信息处理、人工智能、社会计算.

通信作者：毛文吉.E-mail:wenji.mao@ia.ac.cn.

摘要：观点挖掘（或情感分析）作为面向网络社会媒体分析挖掘领域的一个核心研究课题，具有重要的研究意义和应用价值。针对传统观点挖掘方法存在的不足和局限性，本文设计并实现了一种基于OCC情感模型的观点挖掘方法。该方法首先采用统计方法，利用WordNet词典、句法依存关系及少量标注数据，自动构建情感维度词典；其次，对所构建的情感维度词典进行求精，通过语义、情感倾向的不一致性处理和非情感词的过滤，得到高质量的情感维度词典；最后，基于所得到的情感维度词典，结合OCC模型中情感维度值与情感类型的对应关系，生成6种主要的情感类型。实验方法表明，此方法在使用灵活性、可解释性和有效性上具有明显的优势。

关键词：观点挖掘 OCC情感模型情感维度情感类型情感词典认知心理学情感挖掘共现

OCC-model-based text-emotion mining method

HUANGFU Luwen, MAO Wenji

State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Science, Beijing 100190, China

Abstract: Opinion mining, also called sentiment analysis, as one of the core research areas in the network-oriented social media analysis and mining domain, has important practical and research significance. Due to the weaknesses and limitations of traditional opinion mining methods, in this study, we designe and implemente an OCC emotion model-based opinion mining method for extracting emotion types from text. First, we adopte a statistical method to construct an emotion dictionary, based on candidate sets collected by the WordNet dictionary, as well as several syntactic dependent relationships and a small amount of annotated data. Next, we refine the constructed emotion-dimension dictionary to improve its quality by filtering out non-emotional words as well as emotional words that have conflicting syntactic or orientation. Lastly, we generate six main emotion types based on the obtained emotion-dimension dictionary combined with the corresponding relations between emotional dimensions and the different emotion types identified by the OCC model. Experimental results show that the proposed method has obvious advantages with respect to flexibility of usage, interpretability, and effectiveness.

Key words: opinion mining OCC emotion model emotional dimension emotion types emotion dictionary cognitive psychology emotion mining co-occurrence

近年来，社会媒体迅猛发展并快速渗透到了社会、经济、政治、文化等各方面，互联网用户产生的内容中包含大量关于用户意见、态度、情绪等有价值的信息，而且其数量随时间累积呈指数级增长。这些信息主要是用户的主观性观点，与客观的事实有很大的不同。这些包含用户观点的海量数据蕴含着巨大的实际应用价值，亟需自动化的计算分析与处理技术，这种现象促进了观点挖掘与情感分析这一新兴研究领域的蓬勃发展。目前，观点挖掘(或情感分析)^[1-2]已成为社会媒体分析挖掘领域的一个核心研究课题，其研究成果已应用于用户观点发现、产品评论分析及社会舆情监控等领域，并在推动社会和谐发展、改善人们生活方面发挥重要作用^[3]。

互联网中的文本数据大致可以分为两类：一类用来陈述客观性的事实，另一类用来表达主观性的观点。相对于客观性的事实数据，主观性的观点数据由于其内在的复杂性，在研究方法和技术上与前者区别较大。目前观点挖掘分为两类工作：识别观点的正负极性和文本中的情感类型。文本中的情感类型比正负极性包含更为丰富的信息，因而挖掘文本中的情感类型更具有挑战性，但往往需要大量的手工标注数据，并且所获得的情感类型常常缺乏可解释性。

挖掘观点正负极性的方法主要有文档级观点挖掘^[3-4]、语句级观点挖掘^[5-8]、基于情感对象特征的观点挖掘^[9-10]等。Turney^[4]提出了一种利用非监督学习方法计算词之间的互信息(PMI)来判断整个文档的正负极性。Pang等^[3]提出采用多种机器学习方法分类每篇电影评论的正负极性。Wiebe等^[8]通过大量数据集学习线索和特征，区分主观观点和客观事实，并在语句级判断观点的正负极性。Zhang等^[11]提出利用词之间的依赖关系分析中文语句的正负倾向性。Hu等^[9]利用频繁挖掘算法获得情感对象特征，再利用语义词典确定情感词的正负极性，从而输出针对每个情感对象特征的相关正负评论。

挖掘文本中情感类型的方法主要包括基于统计的方法^[12]、机器学习方法^[13-16]、基于情感结构/模型的方法^[16-17]等。基于机器学习的情感类型挖掘工作主要采用分类学习算法^{[13-14, 16, 18-19]}。Mostafa^[17]提出了一种基于情感模型的方法，该方法利用大量的手工标注数据，并基于主要的情感变量计算语句中几乎所有词的情感变量值，进而计算得到整个语句的情感类型。但是，这种方法不但需要大量人力，费时费力，而且不加区分地计算句子中出现的词，导致该方法的效率和性能较低。

综上，观点倾向性的传统挖掘方法主要关注观点的正负极性而忽略了其丰富的情感类型；已有的情感类型挖掘尽管能够输出丰富的情感类型，但是需要大量的标注数据支持。此外，以往工作几乎都未考虑情感认知理论模型在观点挖掘和情感分析中的重要作用。因此，为了更好地实现从网上文本数据中挖掘出丰富的情感类型，文中提出一种基于OCC情感模型的观点挖掘方法。

1 情感的认知结构模型OCC

认知评估理论^[20-23]是认知心理学研究中最为成熟和影响最广的情感理论。认知评估理论认为评估过程是个体评价其与所处环境间的关系，包括目前的条件、导致当前状态的事件和对未来的预期。评估理论认为评估本身尽管不是一个慎思的过程，但其确实由认知的过程提供信息，尤其是那些参与理解和与环境交互的过程。评估将这些异类过程的特征映射到一个共同的中介术语集(即维度变量)。这些维度变量作为个体与环境之间关系的中介描述，在刺激源和反应之间进行协调。维度变量刻画了对个体而言事件的重要特征。

认知评估理论中的不同情感模型采用了不同的情感维度变量，但它们所使用的情感维度变量间有很大的相似性，其中文献[23]工作中的分类最全，包括相关性(relevance)、合意性(desirability)、行动性(actionability)、责备/褒奖(praise/blame-worthiness)、可能性(likelihood)、意外性(unexpectedness)、自我投入(ego-involvement)、可控性(controllability)、权力(power)、适应性(adaptability)。

不同的情感维度变量及其取值产生不同的情感类型。比如，在一个具体的经济环境下，“赔钱”是个不合人意的事件，并导致负性情感评估。在此情形下，其他变量的不同取值可引发不同的情感评估。诸如，如果可能性是不确定的，引发“恐惧”(fear)情感，否则引发“悲伤”(distress)情感。自我的行动带来应受到责备的行为后果引发“羞耻”(shame)，如果事件是不合己意的，则带来“悔恨”(remorse)。如果不合己意的事件带来的后果是他人应受到责备的行为引发的，则导致“生气”(anger)情感。

OCC情感模型^[21]是认知心理学中经典的情感认知结构模型，也是在计算领域近年来采用最多的心理学情感模型，在情感的计算建模中有着非常广泛的应用。

OCC情感模型的整个层次结构主要包括3个部分：与事件结果相关的情感，与智能体行为相关的情感和与对象属性相关的情感。这3个部分也可以结合起来组合成更为复杂的情感类型。该模型共描述了22种不同情感类型的认知结构。OCC模型中每个情感类型的出现都由一定的条件触发，这些条件通过不同的情感维度值表达。其中，“合意性(desirability)” “褒贬性(praise-/blame-worthiness)”和“可能性(likelihood)”是该模型中3个最为重要的情感维度变量。“合意性”与主体的目标相关联，“褒贬性”与行为是否符合社会道德标准相关联，而“可能性”则表示对事件发生的期望。

在情感认知结构理论中，每个情感维度变量有不同的取值。“合意性(desirability)”维度的取值包括“合意的(desirable)”和“不合意的(undesirable)”。当某些事件的发生有利于最终目标的实现时，这种情况对于主体而言是合意的；反之则是不合意的。类似地，“褒贬性(praise-/blame-worthiness)”维度的取值有“值得称赞的(praiseworthy)”和“应受责备的(blameworthy)”。“可能性(likelihood)”维度有“可能的(likely)”和“确定的(certain)”这两个取值。情感维度变量的不同取值及其组合可以生成不同的情感类型。例如，如果“合意的”事件的可能性是“确定的”，引发“高兴(joy)”情感；否则引发“希望(hope)”。如果个体“值得表扬的(praiseworthy)”行为带来合乎自己心意的行为后果，则导致“骄傲(pride)”情感的产生。表 1给出了3个情感维度变量与情感类型之间的对应关系。

表 1 3个情感维度变量及其对应的情感类型 Tab.1 Three emotional dimension variables and their corresponding emotion types

表 1左边3列是情感维度取值列表，右边一列是在特定的情感维度取值下所产生的情感类型。本文的研究思路基于经典的OCC情感模型，选取其最主要的3个情感维度，以挖掘文中包含的这3类维度变量的情感。

词为重点，通过建立相应的情感维度词典，自动推演出6种主要的情感类型：高兴(joy)、悲伤(distress)、希望(hope)、恐惧(fear)、骄傲(pride)和羞耻(shame)。

2 基于OCC模型的情感挖掘方法

结合前面介绍的OCC情感认知结构模型，建立自动识别文本中情感类型的方法。基于OCC模型的情感类型挖掘问题可以分解成两个子问题：1)自动构建高质量的情感维度词典，即建立包括具体的词和抽象的情感维度值之间的映射关系；2)基于OCC模型，以规则的形式建立情感维度值与情感类型间的对应关系。构建情感维度词典则是建立文本情感类型识别系统的关键。情感维度词典涵盖了比通常仅包含正负极性的情感词库更丰富的信息，所以在构建情感维度词典时，综合考虑了依存句法关系、语义关系和统计信息。由于构建后的情感维度词典存在语义、情感倾向的不一致性等问题，因此还需要对情感维度词典进一步求精，过滤掉低质量的候选词。

图 1是基于OCC情感模型的观点挖掘方法的数据流图，主要由情感维度词典的构建、求精和情感类型的生成3个模块组成。该方法基于海量开源文本输入，以句子为单位输出情感类型及其关联的情感对象。其中，情感维度词典的构建模块利用通用语义词典和句法依存关系建立关于各情感维度值的词典，情感维度词典的求精模块包括语义、正负情感倾向的不一致性处理和非情感词的过滤。针对前2个模块，文中还提出了融合Bootstrapping的构建与求精同步的改进算法。情感类型的生成模块基于前2个模块得到情感维度词典，利用经典的OCC情感模型，获得情感类型。最后，得到情感类型与情感对象相结合的输出结果，以满足用户需求。

图 1 基于OCC模型的本文情感挖掘方法 Fig.1 OCC model-based emotion mining method from texts

2.1 情感维度词典的构建与求精

情感维度词典是基于WordNet词典和句法依存关系，采用统计的方法自动构建的。WordNet词典可以提供词的语义解释和词之间的关系，有同义词、反义词、还原词、派生词等。句法依存关系是指，通过句法分析树中得到的词之间存在的联系，可以提示词之间潜在的关系。

为自动构建情感维度词典，首先手工挑选少量高质量的情感维度值种子词(不超过10个)和4个依存关系模板。其中，关于每个情感维度值的种子词包含词的原型和词性信息。加入词性信息是因为相同的词在词性不同的时候含义大不相同，例如：sentence做动词时，意思为“判刑”，维度是Blameworthy；但是做名词时，意思为“句子”，可以认为不是情感词。4个依存关系包括conj_and、conj_or、prep_in和parataxis。其含义分别是词之间的并列and关系、词之间的并列or关系、词之间的介词in关系和2个词在分句中所处的并列关系。然而，仅仅依靠依存关系可能会有一些问题。比如，简单的并列关系“wonderful and exciting”中wonderful和exciting是同义词关系；而在另一个短语“young and old”中，young和old有着强烈的反义词关系而不是同义词关系。由此可见，尽管模板conj_and可以提示词之间存在语义关系，但是这种语义关系到底是一致还是恰好相反需要借助词典来进一步判断。因此，基于词典的方法不但用来寻找候选的情感维度词，而且用来判断候选情感维度词的情感维度值的合理性。

在第一轮循环开始，对于每种情感维度值挑选少量高质量的种子词，作为初始的情感维度词典输入。情感维度词典包括DIC_D(合意的)、DIC_U(不合意的)、DIC_P(值得称赞的)、DIC_B(应受责备的)。挑选情感维度种子词有多种策略，可以通过手工查看数据集凭经验进行挑选或者通过计算词出现的频率挑选出频率高并且包含情感维度值的词作为种子词。

2.1.1 构建过程

在每一轮循环中，用WordNet和手工挑选的模板不断地抽取不同维度值下的情感词。在每一轮循环后，利用一个基于共现思想的评分函数来评估抽取的情感维度词。情感维度词典的构建过程如下。

1) 针对情感维度词典中每个新加入的情感维度词，基于WordNet词典，找出其同义词和反义词，并将其同义词和反义词分别放入相应的情感维度词典候选集中。

2) 利用前面提到的4个句法依存关系从输入的海量文本中找出与所述相应的情感维度词典中已有的情感维度词具有依存关系的新情感维度词，放入相应的情感维度词典候选集中。

3) 利用(1)式所示的评分函数对相应的情感维度词典候选集进行评价与过滤，选取其中评分大于阈值的候选集中的情感词，放入相应的情感维度词典中：

$f(v \in {\rm{DI}}{{\rm{C}}_k}) = \frac{{\sum\limits_{u \in {\rm{DI}}{{\rm{C}}_k}} {c\left( {v,u} \right)} }}{{\sum\limits_u {c\left( {v,u} \right)} }} + \frac{{\left| {{\rm{DI}}{{\rm{C}}_k}} \right|\sum\limits_{u \notin {\rm{DI}}{{\rm{C}}_k}} {c\left( {v,u} \right)} }}{{\left| {{\rm{DIC}}} \right|\sum\limits_u {c\left( {v,u} \right)} }}$

(1)

4) 不断重复步骤2)~3)，直到不再有新的情感维度词加入；

5) 利用WordNet中的派生以及还原关系扩充情感维度词典。

构建情感维度词典过程中的输入是海量的文本和关于某个情感维度值的种子词，输出是针对这个情感维度值建立起来的情感维度词典。这里涉及3个维度，6个维度值，情感维度值可以是“合意的” “不合意的” “值得称赞的” “应受责备的” “可能的”和“确定的”，分别简写为“D” “U” “P” “B” “L” “C”。其中L、C情感维度词典的构建仅仅依赖WordNet中词之间的语义关系，并且Likelihood维度的默认值为C。

循环初始时挑选的高质量情感维度种子词为1)和2)提供一个良好的基础。1)和2)的目的是分别基于词典和基于依存关系获得候选的情感维度词。3)通过计算一个评分函数保证进入情感维度词典的词的质量。最后，在情感维度词典中的词基于WordNet中的同义、反义、还原和派生关系进行扩充。比如，如果“harm”是在情感维度词典中维度值为“blameworthy”的词，扩充它的派生词“harmful”到情感维度词典中，同时它的情感维度值也为“blameworthy”。

评分函数f(v∈DIC_k)主要是基于共现的思想，如果待评价的情感词与某一已知情感维度值的情感词共同出现的次数越多，则该情感词的维度值就更有可能成为该情感维度值。在每一轮循环中，评分函数利用WordNet词典和句法依存关系得到候选集，通过设定共现次数的阈值θ₁，过滤掉低质量的候选情感维度词。这里v是当前待评价的候选情感词，u是已知情感维度值为k的情感维度词典中的词，k的取值可以是“D” “U” “P” “B”。DIC_k是当前生成的维度值为k的情感维度词典，DIC_k表示情感维度词典元素个数。DIC是当前所有情感维度词典的并集，其元素个数为|DIC|。函数c(v, u)表示词v和词u在同一语句中共现的次数。评分函数中词v是否属于某类情感维度词典的计算既考虑了v与该类情感维度词共现的次数(作为后验)，也考虑到该类情感维度词典在当前所有情感维度词典中所占的词的比例(作为先验)。

2.1.2 求精过程

构建完成后的情感维度词典往往存在不一致性或者噪声，包括语义不一致性、情感倾向不一致性，以及非情感词等。因此利用情感维度词的同义词集合和反义词集合检查情感维度词的正负倾向，从而过滤掉质量低的情感维度词，完成情感维度词典的求精过程。

语义不一致性是指同一个词在同一情感维度上具有相互矛盾的取值，比如在“褒贬性”维度上同时具有“P”和“B”这两个维度值或者在“合意性”维度上同时具有“D”和“U”这两个维度值；情感倾向不一致性是指一个词同时具有正负情感倾向相互冲突的情感维度值。情感词的极性可以是正向或负向。根据含义可知，“P”和“D”表示对情感对象的正面态度或评价，故极性为正；“B”和“U”表示对情感对象的负面态度或评价，故极性为负。若检测到语义或情感倾向不一致的词，对该情感词的求精方法根据通用语义词典中的同义和反义关系共同确定其情感倾向。当前待求精的情感维度词的计算公式如式(2)：

${\rm{score}} = \frac{{{n_{{\rm{Syn}} + }} - {n_{{\rm{Syn - }}}}}}{{2 \cdot {n_{{\rm{Syn}}}}}} - \frac{{{n_{{\rm{Ant}} + }} - {n_{{\rm{Ant - }}}}}}{{2 \cdot {n_{{\rm{Ant}}}}}}$

(2)

式中：n_Syn、n_Ant分别是当前待求精的情感词的同义词和反义词的总数，n_Syn+、n_Syn-分别是该词的极性为正和为负的同义词个数，n_Syn-、n_Ant-分别是该词的极性为正和为负的反义词个数。同时，为了保证同义词和反义词集合的均衡性，将其归一化后相加。如果计算得到的score值小于某一阈值θ₂，则过滤掉该情感词。由于以往相关工作中已建立了多个关于情感词的正负极性词典，这里n_Syn、n_Ant的正负极性可通过参照这些情感极性词典来确定。

非情感词包括无实际意义的词，如具体数字、代词等，也包括中性的名词和动词。过滤的方法包括直接列出这些明显的不应该加入的词加以过滤，或者计算情感倾向，将某一阈值范围内的词剔除。

除了以本身建造的情感维度词典作为极性词典，还采用一个公开的极性词表^[9]。选择这两个极性词典的原因是它们的优势可以互补。构建的情感维度词典能够覆盖到较大集合的情感维度词，词性词表尽管质量高，但是包含词的数量非常有限，并且只有词的极性信息。所以，两者结合后彼此扬长避短。同时可以通过(3)式进一步提高词的质量。

$\begin{array}{l} {\rm{score}} = \alpha \cdot {\rm{scor}}{{\rm{e}}_{{\rm{polarity1}}}} + \left( {1 - \alpha } \right) \cdot {\rm{scor}}{{\rm{e}}_{{\rm{polarity2}}}}\\ \quad \quad \quad \quad \quad \quad \quad \left( {0 \le \alpha \le 1} \right) \end{array}$

(3)

式中score_polarity1和score_polarity₂虽然基于相同的(2)式，但是分别利用了上面提到的不同的极性词典计算而得的。通过设定score的阈值，以避免加入质量过低的词。

2.2 情感类型的生成

完成构建和求精情感维度词典后，便可以利用OCC情感模型生成情感类型。情感类型的生成基于情感认知结构模型，根据该模型中每种情感类型与情感维度及其取值的对应关系，自动生成6种主要的情感类型。具体地说，“合意性”维度值为“合意的”并且“可能性”维度值为“确定的”时对应的情感类型为“高兴”；“合意性”维度值为“不合意的”且“可能性”维度值为“确定的”对应的情感类型为“悲伤”；“合意性”维度值为“合意的”且“可能性”维度值为“可能的”对应的情感类型为“希望”；“合意性”维度值为“不合意的”且“可能性”维度值为“可能的”对应的情感类型为“恐惧”；“合意性”维度值为“合意的”，“褒贬性”维度值为“值得称赞的”且“可能性”维度值为“确定的”对应的情感类型为“骄傲”；“合意性”维度值为“不合意的”，“褒贬性”维度值为“应受责备的”且“可能性”维度值为“确定的”对应的情感类型为“羞耻”。工作实现的6种情感类型生成规则如下。

规则 1 如果“合意性”维度值=“合意的”并且“可能性”维度值=“确定的”对应的情感类型=“高兴”。

规则 2 如果“合意性”维度值=“不合意的”并且“可能性”维度值=“确定的”对应的情感类型=“悲伤”。

规则 3 如果“合意性”维度值=“不合意”并且“可能性”维度值=“可能的”对应的情感类型=“希望”。

规则 4 如果“合意性”维度值=“不合意的”并且“可能性”维度值=“可能的”对应的情感类型=“恐惧”。

规则 5 如果“合意性”维度值=“合意的”并且“褒贬性”维度值=“值得称赞的”对应的情感类型=“骄傲”。

规则 6 如果“合意性”维度值=“不合意的”并且“褒贬性”维度值=“应受责备的”对应的情感类型=“羞耻”。

根据前述的情感类型的生成过程，下面给出一个具体示例。

图 2是对句子“US’s providing aid is a step in the right direction.”的情感类型挖掘过程。查看情感维度词典，可得到这句话中包含2个情感维度词，分别是“is”和“right”。其中，“is”的情感维度“可能性”取值为“确定的”，“right”的情感维度“合意性”取值为“合意的”，情感维度“褒贬性”的取值为“值得称赞的”。再根据情感类型生成规则1和规则5得到两种情感，分别为“Joy(高兴)”和“Pride(骄傲)”。

图 2 情感类型生成示例图 Fig.2 Generation of emotion types example

由此可见，通过求精后的情感维度词典和OCC模型，最后生成多种情感类型是切实可行的。与这些情感类型相关联的情感对象则通过由文献[9]提出的频繁情感对象识别算法进行挖掘。下面是一些输出结果的示例：

North Korea is in a bad situation.

=>(North Korea, {Distress})；

It was very wise for us to compromise and to promise food aid.

=>(food aid, {Joy, Hope, Pride}).

Consequently, this deal is brilliant.

=>(deal, {Joy, Pride}).

2.3 实验结果与分析

为实际验证提出的基于OCC情感模型的挖掘方法，文中基于网上新闻评论数据，设计实验方法，对所建立的情感维度词典进行有效性验证。

2.3.1 数据获取

从纽约时报抓取了2002年1月1日~2012年1月1日这10年间的16 398个新闻评论数据作为实验数据，然后利用斯坦福的句法分析器将句子的成分都提取出来，并且手工定义高质量的情感维度种子词，覆盖情感维度值包括“D” “U” “P” “B” “L”。全部种子词如表 2(括号外为情感维度词，括号内为情感维度词的词性)所示。

表 2 情感维度种子词 Tab.2 Emotional dimension seed words

基于情感维度种子词，利用WordNet词典和句法依存关系得到情感维度词的候选集合，并基于共现思想进行过滤，进而获得高质量的情感维度词，建立相应的情感维度词典。对情感维度词典的求精过程完成语义、情感倾向的不一致处理和非情感词的过滤。由于维度L主要通过同义词和反义词获得，文中仅验证情感维度词典DUPB的性能。词典DUPB在求精前和求精后所包含词的数目如表 3所示。

表 3 求精前后情感维度词典 Tab.3 Emotion-dimension dictionaries before and after refinement

2.3.2 实验设计

为了保证标注数据的客观性，请两个标注者分别独立标注了237个测试数据。若标注者认为一句话中某个单词包含某种情感维度值，就将其连同维度值一起标注出来。为了检查两个标注者的一致程度，采用式(4)计算其Kappa值：

${\rm{Kappa}} = \frac{{{\rm{Pr}}\left( a \right) - {\rm{Pr}}\left( e \right)}}{{1 - {\rm{Pr}}\left( e \right)}}$

(4)

其中，Pr(a)表示实际标注时的一致程度，Pr(e)表示随机情况下期望的一致程度。实验中两个标注者的Kappa值为0.613(Kappa值大于0.6表明一致程度较好)。

基于标注数据，利用精度、召回率和F值这3个指标对情感维度词典DUPB进行定量评价。F值的计算公式为

$F\_{\rm{value}} = \frac{{2 \cdot {\rm{precision}} \cdot {\rm{recall}}}}{{{\rm{precision}} + {\rm{recall}}}}$

(5)

式中：F_value表示F值，precision表示精度，recall表示召回率。

2.3.3 实验结果

平均精度、召回率和F值的实验结果如表 4所示。

表 4 实验结果 Tab.4 Experimental results

由表 4可知，平均精度、召回率和F值分别为0.622、0.400和0.482。可以看到，情感维度词典DUPB的平均精度较好但召回率还比较低，导致召回率较低的一个原因是情感维度词典中的情感维度词的数量有限，对于验证集中的情感维度词覆盖程度不足，因此召回率不高。

2.3.4 结果分析及改进

上面介绍的基于OCC模型的情感挖掘方法仍存在一些可改进之处，如：将情感维度词典的构建和求精分开进行，使用预先定义的固定模板，以及不加区分地对待词之间的共现情形等。特别是，考虑到情感维度词和模板之间的相互关联，可以通过两者之间的互学习促进情感挖掘的性能。

针对以上不足，文中考虑了融合Bootstrapping的改进方法。该方法将情感维度词典的构建和求精在同一个循环中完成。算法的主要思想是利用情感维度词与模板进行互学习，并且对两者分别进行评分。基于情感维度词在模板前后的维度值，对模板进行评分，将一致性/不一致性用模板的可区分性指标进行刻画。这里的可区分情况有两种：一种是模板前后的词维度恰好一致，另一种是模板前后的词维度恰好相反。如果一个模板在这两种情况中的一种占大多数，则该模板的质量较好。基于模板，对情感维度词进行评分，将情感维度词属于某个情感维度值的概率用可靠性进行刻画。此外，用相关性刻画某一模板与情感维度词共现的程度，用倾向性刻画某一情感词的极性值。

3 结束语

本文提出了一种基于认知心理学领域发展成熟的情感认知结构模型OCC，设计并实现了一种基于OCC情感模型的观点挖掘方法，并采用网上新闻评论数据，采用实验方法初步验证了文中方法的有效性。与相关工作比较，该方法所需要的人力少，且在使用灵活性和有效性上具有明显的优势。同时，本文基于经典的情感认知结构模型，不但给文本情感分析这一研究问题赋予了更深层次的认知结构关联，而且为情感类型的输出维度提供了一个建立在认知心理学模型基础上的更加精细的解释。

参考文献

[1]	CH EN, Hsinchun. AI and opinion mining, part 2[J]. IEEE intelligentsystems, 2010, 25(4): 72-79. (0)
[2]	CH EN, Hsinchun, DAVID Z. AI and opinion mining[J]. IEEE intelligentsystems, 2010, 25(3): 74-80. (0)
[3]	PANG B, LEE L, VAITHYANATHAN S. Thumbs up?:sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing-Volume 10. Stroudsburg, USA, 2002:79-86. (0)
[4]	TURNEY P D. Thumbs up or thumbs down?:semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Stroudsburg, USA, 2002:417-424. (0)
[5]	WIEBE J, WILSON T, BRUCE R, et al. Learning subjective language[J]. Computational linguistics, 2004, 30(3): 277-308. DOI:10.1162/0891201041850885 (0)
[6]	ATTARDI G, SIMI M. Blog Mining through opinionated words[C]//Fifteenth Text Retrieval Conference, Trec 2006.Gaithersburg, USA, 2006. (0)
[7]	HATZIVASSILOGLOU V, WIEBE J M. Effects of adjective orientation and gradability on sentence subjectivity[C]//Proceedings of the 18th Conference on Computational Linguistics-Volume 1. Stroudsburg, USA, 2000:299-305. (0)
[8]	RILOFF E, WIEBE J, WILSON T. Learning subjective nouns using extraction pattern bootstrapping[C]//Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003-Volume 4. Stroudsburg, USA, 2003:25-32. (0)
[9]	HU M, LIU B. Mining and summarizing customer reviews[C]//Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2004:168-177. (0)
[10]	HU M, LIU B. Mining opinion features in customer reviews[C]//AAAI. 2004, 4(4):755-760. (0)
[11]	ZHANG C, ZENG D, LI J, et al. Sentiment analysis of Chinese documents:from sentence to document level[J]. Journal of the American society for information science and technology, 2009, 60(12): 2474-2487. DOI:10.1002/asi.v60:12 (0)
[12]	READ J. Recognising affect in text using pointwise-mutual information[D]. Brighton:University of Sussex, 2004:1-29. (0)
[13]	MISHNE G. Experiments with mood classification in blog posts[C]//Proceedings of ACM SIGIR 2005 Workshop on Stylistic Analysis of Text for Information Access. Stroudsburg, USA, 2005:19. (0)
[14]	ALM C O, ROTH D, SPROAT R. Emotions from text:machine learning for text-based emotion prediction[C]//Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing. Association for Computational Linguistics, 2005:579-586. (0)
[15]	FENG S, WANG D, YU G, et al. Extracting common emotions from blogs based on fine-grained sentiment clustering[J]. Knowledge and information systems, 2011, 27(2): 281-302. DOI:10.1007/s10115-010-0325-9 (0)
[16]	KESHTKAR F, INKPEN D. Using sentiment orientation features for mood classification in blogs[C]//Proceedings of the IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE 2009).Dalian, China, 2009. (0)
[17]	SHAIKH M A M. An analytical approach for affect sensing from text[D]. Toyko:University of Tokyo, 2008:1-111. (0)
[18]	YANG C, LIN K H Y, CHEN H H. Building emotion lexicon from weblog corpora[C]//Proceedings of the 45th Annual Meeting of the ACL on Interactive Poster and Demonstration Sessions. Stroudsburg, USA, 2007:133-136. (0)
[19]	MAO Y, LEBANON G. Sequential models for sentiment prediction[C]//ICML Workshop on Learning in Structured Output Spaces. Pittsburgh, USA, 2006. (0)
[20]	FRIJDA N H. The emotions[M]. New York: Cambridge University Press, 1986. (0)
[21]	ORTONY A. The cognitive structure of emotions[M]. New York: Cambridge University Press, 1990. (0)
[22]	LAZARUS R S. Emotion and adaptation[M]. New York: Oxford University Press, 1991. (0)
[23]	SCHERER K R, SCHORR A E, JOHNSTONE T E. Appraisal processes in emotion:theory, methods, research[M]. New York: Oxford University Press, 2001. (0)