中文微博的立场判别研究

暂未开放讨论



中文微博的立场判别研究

浏览下载总计

网页浏览 论文下载
906 10

中文微博的立场判别研究

作者发表的论文

1 基于马尔可夫链的舆情热度趋势分析
刘勘,李晶,刘萍. 计算机工程与应用[J],2011,47(36),170-173

数据来源:CSCD中国科学引文数据库      CSCD      被引次数: 5

中文微博的立场判别研究

刘勘 田宁梦 王宏宇 林荣蓉 王德民

中南财经政法大学信息与安全工程学院信息系 武汉 430073

摘要:[目的/意义]提出一种以情感加权算法和朴素贝叶斯算法为基础的组合分类模型(SWNB模型),旨在对中文微博话题的立场进行判别。[方法/过程]该模型首先通过给定的复杂句模型对微博进行简化,然后依据情感规则得到情感权值,提取微博中与话题相关的实体并进行优化,进而将微博分为包含立场和未表明立场(NONE)两类;再对包含立场的微博提取特征词,利用朴素贝叶斯算法将其立场判别为支持(FAVOR)或反对(AGAINST)。[结果/结论]实验结果表明,本模型有较好的立场判别精度,并能同时有效地处理中文复杂句式、话题相关评价对象以及上下文语境等复杂情形。

关键词中文微博;立场判别;情感加权算法;朴素贝叶斯

分类号G202

基金项目本文系国家社会科学基金项目“基于文本挖掘的网络谣言预判研究”(项目编号:14BXW033)研究成果之一。

作者简介:刘勘(ORCID: 0000-0001-9339-7315),副教授,E-mail:liukan@znufe.edu.cn;田宁梦(ORCID: 0000-0003-0533-3835),硕士研究生;王宏宇(ORCID: 0000-0002-5063-9166),硕士研究生;林荣蓉(ORCID: 0000-0002-9026-0417),硕士研究生;王德民(ORCID: 0000-0002-4824-7489),硕士研究生。

收稿日期:2017-02-06        发表日期:2017-05-12        本文责任编辑:王善军

 

##正文##

 

1 引言

近年来,社会媒体蓬勃发展,以Twitter、新浪微博为代表的微博平台凭借其及时便捷的互动方式、简单多样的操作方式、高效开放的传播方式逐渐成为全球热点信息的传播中心。越来越多的用户选择在微博上表达情感体验、点评时事热点,微博中包含了用户丰富的情感信息。因此,文本倾向性分析领域也涌现出立场判别这一研究热点,立场判别是指能够自动判别文本作者对于给定的目标话题(Target)是否持有支持(FAVOR)、反对(AGAINST)立场或是未表明任何立场(NONE)[1]。及时把握微博中热点话题的立场,有效提取用户的情感信息,已成为舆情分析、舆论监督以及企业改进产品体验等方面的有力手段。

2 相关工作

立场判别虽然是文本倾向性分析研究的一部分,但有别于传统的情感分析。传统的情感分析通过分析带有情感色彩或褒贬倾向的主观性文本,挖掘其中的观点,直接获取文本中所包含对象的评价信息[2]。然而立场判别强调文本对于给定的目标话题是否持有支持、反对立场或是未表明任何立场,文本自身可能不带有任何情感色彩和主观性评价,也可能间接通过表达对其他事件的观点来展现作者对给定目标话题的立场,因此给定的目标话题不一定会在文本中明确显现[3]

目前国内外学者提出的立场判别研究方法主要是在以下两类文本倾向性分析方法的基础上展开的:基于情感规则的分析。通过借助情感词典等资源提取文本中的情感因子,并考虑情感因子与特征对象的依存关系,对倾向值进行简单统计从而得到文本整体的情感倾向。但是这类方法往往不能捕捉到隐含的文本语义关系。这类方法的代表有:Y. Lu等人提出了一种基于统一原则的自动构建与上下文相关的情感词典的最优化方法[4];C. J. Hutto等人提出的VADER规则模型综合考虑英文文本的情绪知识、语法结构以及语义特征,对情感强度进行了细致区分[5];陈忆金等人提出的舆情意见句定量计算方法能够抽取舆情意见句的主题,并针对该主题对帖子进行情感倾向分析[6];刘全超等人针对微博内容特征以及转发、评论关系特征,构建情感分析用词典、网络用语词典以及表情符号库,设计了基于短语路径的微博话题情感倾向性判定算法[7];B. K. Y. Tsou等人通过计算词语的语义倾向,综合考虑极性元素分布、密度和语义强度来分析新闻文本的情感倾向[8]。‚基于机器学习的方法。在特征提取的基础上采用机器学习模型构造分类器,从而将文本倾向性分析转化为分类问题,但是这类方法不能很好地考虑到句式以及上下文因素的影响。比如M. Wojatzki等人使用基于Stacking的组合分类方法,在提取n-gram、syntactic、lexicon、target-transfer、concept 等特征后,采用可训练的元学习方法来组合多种基分类器用以实现立场判别[9];P. Anand等人提出了一种针对在线实时讨论的立场判别模型,采用JRIP算法不断进行规则的归纳学习,根据规则提取相关特征后用朴素贝叶斯算法进行分类[10];S. M. Mohammad 等人根据人工建立的词语粒度情感词典和情感符号词典,提取文本的语义特征和情感特征来构造特征向量,采用SVM算法判别Twitter文本中某一特定评价对象的情感倾向[11];B. Velichkov等人利用GATE框架抽取特征信息,然后采用线性SVM模型对特征向量进行分类[12];W. Casey等人针对Twitter数据定义了评价信息词组,并为其定义了attitude、orentation、force、focus、polarity五大属性,提取文本中的属性特征作为SVM分类器的输入[13];A. Severyn等人采用卷积神经网络模型进行情感分析,将字级别的词向量作为原始特征,利用多个不同大小的卷积核对特征向量进行串接,获得了较高的准确率[14]

面对立场判别问题,对中文微博进行立场判别的难度大于英文微博,主要原因有:分词是中文文本分析的关键步骤,分词结果的好坏将直接影响模型的准确度;‚微博的表达方式较为随意,微博作者针对某一个话题常常会自动生成一些相关的网络用语和昵称,比如 “土鸡”“烧高香”“坑人”等;ƒ微博文本语义关系更加隐晦,有研究表明,传统的依存句法分析方法并不适合提取微博文本的评价对象和评价词[15]。鉴于以上问题,本文在结合情感加权算法和朴素贝叶斯算法的基础上,提出了一种将三分类问题转化成多次二分类问题的SWNB(serial sentiment weighted and naïve bayes model)模型,采用半监督学习方法,针对特定话题扩充了情感词库并建立了关联实体集,帮助提升评价对象提取的准确度;提出了能够同时对复杂句式、话题相关实体进行处理的情感加权规则,有效地区分出文本是否表达立场;将朴素贝叶斯算法着眼于文本中的情感词、否定词、关联词、程度副词等各类语义元素,从而对微博的立场进行细致判别。

3 特征概述

3.1 情感特征词

本文参考了台湾大学NTUSD简体中文情感词典(http://nlg.csie.ntu.edu.tw/)、中国知网HowNet中文情感词典(http://www.keenage.com/)来构建情感词表,过滤掉情感倾向模棱两可的词语。由于目前已有的情感词典资源不具有针对性,有一些动词和情感词只有出现在与某一目标话题相关的语境中才会表现出一定的情感倾向,这些词也应该被视为情感项。例如,在话题“iPhone SE”的相关微博中常常出现“买”“入手”等动词,说明作者对其所描述的事物持肯定态度;在话题“春节放鞭炮”的相关微博中常常出现“有声有色”“年味十足”等形容词,说明作者喜爱放鞭炮这一习俗。因此本文人工补充了一些与各目标话题相关的具有正向或负向情感倾向的动词和形容词。

3.2 关联实体

微博作者通过评价与某一目标话题直接或间接相关的实体对象,来直接或间接地展现对该目标话题所持有的立场,本文定义这些实体对象为关联实体。有效识别文本中的关联实体,通过分析微博作者对这些实体持有的情感态度来判断作者对该目标话题持有的立场,将使立场判别工作具有针对性,从而提高判别精度。在构建关联实体库的过程中,本文定义了以下基本术语和数据结构:

核心实体(Core Entity):代表与该目标话题(Target)直接相关的核心内容(人、事物、组织)等。某个目标话题对应的核心实体集可表示为 Target:{core entity 1, core entity 2, core entity 3, ...}。

普通实体(Normal Entity):代表与该目标话题(Target)间接相关,但与该目标话题的核心实体之间存在比较/并列关系。如果两个实体之间是比较关系,那么通常对两个实体表现的是不同的情感倾向;如果两个实体之间是并列关系,那么通常对两个实体表现的是相似的情感倾向。某个Target对应的普通实体可按照以下结构表示:

每个目标话题对应的关联实体库包含该目标话题的核心实体集以及按照比较/并列等关系划分的普通实体集。在构造关联实体库的过程中,本文使用NLPIR系统的关键词识别功能提取出各个目标话题的微博中的关键词,使用NLPIR系统(http://ictclas.nlpir.org/)的词性标注功能提取出各个目标话题的微博中的名词,对这些词进行词频统计,辅以人工筛选得到各个目标话题对应的核心实体。然后以各个核心实体作为种子词,针对包含该核心实体的微博,按照宋锐等人提出的四类比较句模式[16]找出含有比较关系的微博,采用序列标注中常用的条件随机域模型(Condition Random Field)[17]提取出比较主体、比较客体及其词性、位置,若提取出的主体或客体中包含核心实体,则将另一方非核心实体按上述数据结构定义后加入到普通实体集中。对于未包含比较关系的微博,使用哈尔滨工业大学语言云平台(http://www.ltp-cloud.com/)中的依存句法分析工具标注出微博中的并列关系成分,提取与该核心实体存在并列关系的实体,按上述数据结构定义后加入到普通实体集中。对于一些无法确定的实体,人工辅助对其进行筛选。以本文实验所使用的数据集为例,数据集中包含“春节放鞭炮”“iPhone SE”“俄罗斯在叙利亚的反恐行动”“开放二胎”“深圳禁摩限电”5个话题,为每个目标话题构建了相应的关联实体库,如表1所示:

1 关联实体库

目标话题

核心实体数量

核心实体示例

普通实体数量

普通实体示例

春节放鞭炮

6

鞭炮,烟花,烟火,爆竹,礼花,花炮

40

禁令,道德,空气,污染,雾霾,噪音.......

iPhone SE

4

iPhone SE,5SE,苹果SE, Iphone 5SE

39

 iPhone 5s,iPhone 5C,小米,华为,4s,6s,苹果6,iPhone 6,苹果,苹果系统......

俄罗斯在叙利亚的反恐行动

5

俄罗斯, 叙利亚政府军,普京, 叙利亚

44

土鸡,恐怖组织,美国,奥巴马,土库曼人,沙特,

东突,萨达姆......

开放二胎

3

开放二胎,全面二胎,二胎

10

计划生育,政府,婚假

婚晚育假期,晚婚晚育,

独生子女政策......

 深圳禁摩限电

3

禁摩限电,限电,禁摩

9

电动车,摩托车,政府,

3.3 从句关联词

根据语法关系,通常复杂句可以分为转折、条件、假设、因果句等,它们都有其特定的从句关联词。诸如“虽然”“不论”“即使”这一类关联词,通常引导的分句与作者的真实感情相反,这一类关联词常被称为“让步关联词”;诸如“但是”“可是”这一类关联词,它们所引导的分句所表达的情感与作者的真实情感相同,这一类关联词常被称为“坚持关联词”[18]

2 关联词表

种 类

常用关联词

让步关联词

虽然、尽管、固然、不论、无论、不管、任凭、即便、即使、纵然、就算、哪怕、纵使、与其、宁可

坚持关联词

但是、可是、然而、然则、但、可、不过、不如、也

3.4 强度修饰词

情感词强度会受到副词和否定词修饰的影响[19]。若文本中有否定词修饰情感词,则文本表达的情感倾向会发生反转,因此本文收集了一些常用的否定词用于识别否定句。若文本中有程度副词修饰情感词,则文本表达的情感强弱程度存在差异,本文将程度副词划分为最|most、很|very、较|more、稍|-ish、欠|insufficiently、超|over六个等级,设定每个等级的程度副词对应的权重分别为2、1.25、1.2、0.8、0.5、1.5,以此来对不同强度的情感倾向进行细致区分。

4 立场判别模型

将立场判别看成分类问题,本文SWNB模型则将三种立场的分类转化成了多次二分类问题[20]。首先使用一种新的情感加权算法来将微博分为包含立场(非NONE)和未表明立场(NONE)两类;然后使用朴素贝叶斯算法对被第一层分类器划分为包含立场(非NONE)的微博进行二分类,将其立场分为支持(FAVOR)或反对(AGAINST)。SWNB模型的总体框架如图1所示。

1 SWNB模型整体框架

4.1 情感加权算法

在对微博文本进行情感权值计算时,首先根据“。”“!”“……”和“?”等标点符号将微博文本进行断句,微博文本转化为一系列句子的集合\textup{Microblog}=(S_{1},S_{2},\cdots ,S_{n}) 。然后依据本文提出的句式模型利用从句的关联词将复杂句转化为简单句,接着使用情感加权算法计算每个句子的情感权值,再通过判断微博中是否出现与该目标话题相关的关联实体以及该实体与目标话题的核心实体之间的关系,来调整前述步骤中得到的该句的情感权值。最后取所有句子情感值的平均值作为该条微博的情感权值。

在分类器训练阶段,本文使用一种基于grid search算法的边界探测方法[21]寻找出划分非NONE和NONE的情感权值的最佳上界阈值和最佳下界阈值(这两个阈值使训练数据的分类准确率最高)。在分类器应用阶段,当待分类文本的最终情感权值位于该上界阈值和下界阈值构成的区间内,待分类文本的立场将被分为NONE,否则待分类文本的立场为非NONE。情感加权算法的流程图如图2所示:

2 情感加权算法流程图

4.1.1 复杂句的处理策略

由于让步关联词引导的从句往往与作者的真实情感相反,坚持关联词引导的从句往往与作者的真实情感相同,因此对两者之一进行情感分析即可[22]。一般,复杂句式存在以下表现形式:

[让步关联词 + 否定词 + 情感词 +标点 +]坚持关联词 + 否定词 + 情感词

扫描微博中的每个句子Sn,先看是否出现坚持关联词,若未出现坚持关联词,则直接按照下文的情感规则计算情感值。若出现坚持关联词,扫描从句子开头至坚持关联词的这部分文本,若此部分含有让步关联词,将让步关联词引导的分句情感值设为0,此部分其他的分句按照下文的情感规则计算情感值;若此部分不含有让步关联词,则将从句子开头至坚持关联词之前的这部分文本情感值设为0。

4.1.2 句子情感权值计算规则

在对复杂句进行简化之后,一个完整句子的情感值可直接通过计算各分句情感值之和得到,而分句情感值是基于分句中各个情感意群的情感值得到的。分句中每出现一个情感词,就认为出现了一个情感词意群。否定词和程度副词也会对意群表达的情感程度产生影响,因此计算句子情感权值时需要考虑上下文中出现的否定词和程度副词。

(1)抽取分句中的情感词意群,将情感词的相关信息按如下形式表示:

senWord = (句中位置, 情感倾向,情感权值)

其中正向情感词权值设为1,负向情感词权值设为-1。

(2)将上一个情感词意群的位置(lastWordPos)或者上一个标点符号的位置(lastPuncPos)作为起始点(选距离当前情感词意群最近的位置),在起始点和当前情感词意群之间扫描:

a.抽取程度副词,将程度副词的相关信息以如下形式表示:

degreeWord = (句中位置,权值)

b.抽取否定词:当否定词位置先于程度副词位置时,则将否定词权重赋值为-1,否则将否定词权重赋值为0.5。若该分句中出现多个否定词,则当否定词个数为奇数时否定词权重不变,当否定词个数为偶数时否定词权重取相反数。

(3)情感词意群的情感权值采用公式(1)进行计算:

\mathrm{score=W_{negWord}*W_{dereeWord}W_{senWord}}                     公式(1)

分句的情感权值为分句中各情感词意群的情感倾向值之和。一个完整句子\mathit{S_{\textrm{n}}} 的情感值\mathit{W_{\mathrm{Sn}}} 基于各分句的情感权值采用公式(2)加和得到。

             \mathit{W_{\textrm{Sn}}}=\sum \mathrm{{W_{subsentence}}}                                           公式(2)

4.1.3 关联实体的处理策略

扫描微博文本的每个句子,若该句子中包含目标话题的核心实体,则句子情感倾向值不变;若该句子中包含目标话题的普通实体且普通实体被定义为正向情感倾向,则句子情感倾向值不变;若该句子中包含目标话题的普通实体且普通实体被定义为负向情感倾向,则句子情感倾向值取相反数;若该句子中既无核心实体也无普通实体,则不更改句子的情感倾向值。

完成上述三个步骤后,一条微博文本的情感值为各句子情感值的平均值。

  \mathrm{W_{final}=avg\left (W_{s1},W_{s2},\cdots,W_{sn}\right )}                           公式(3)

4.2 朴素贝叶斯算法

对被情感加权算法划分为非NONE的微博使用朴素贝叶斯算法进行立场判别(支持或反对)的二分类工作。对照情感词库、否定词表、程度副词表以及各个目标话题的关联实体库提取出每条微博文本中的情感词、关联实体、否定词、程度副词,将它们作为特征词,计算这些特征项和各类别的联合概率,从而估计给定微博文本的分类概率。本文采用朴素贝叶斯分类器中的伯努利模型[23]来判断微博X所属的类别c:

                                           公式(4)

筛选出n个特征词,对每一条微博X用极大似然估计法[24]计算P(X_{j}|C_{i}) 时,如果某个特征词在训练集从没出现过,会导致整体的概率计算结果为0,因此采用拉普拉斯平滑法对其概率值进行加一平滑。此外,多个P(X_{j}|C_{i}) 概率值相乘的结果很小,能否在概率值很小的情况下保证较高的计算精度将对结果产生影响,因此需要对该值进行数据转换,使其呈现方式更好地接近所希望的假设,进行更准确的统计推断。本文在朴素贝叶斯算法的基础上,通过对取对数的方式可以将概率值的乘法计算转换为加法计算,将不确定性分析转换成信息量的分析,从而提高计算精度,提高分类的正确率,计算方法如公式(5)所示:

   公式(5)

5 实验与分析

5.1 实验数据

本文选用2016 NLPCC评测任务中立场判别任务所提供的部分语料作为实验数据集,包含3 000条已标注的训练语料和1 000条黄金测试语料(gold data)。两类语料均包含“iPhone SE”“春节放鞭炮”“俄罗斯在叙利亚的反恐行动”“开放二胎”“深圳禁摩限电”5个目标话题的微博数据,表3和表4分别统计了两个语料中各目标话题的数据分布情况。

3 3 000条已标注的训练语料统计结果

目标话题

Favor

Against

None

总数

iPhone SE

245

209

146

600

春节放鞭炮

250

250

100

600

俄罗斯在叙利亚的反恐行动

250

250

100

600

开放二胎

260

200

140

600

深圳禁摩限电

160

32

138

600

 

4 1 000条黄金测试语料(gold data)测试语料统计结果

目标话题

Favor

Against

None

总数

iPhone SE

85

94

21

200

春节放鞭炮

88

94

18

200

俄罗斯在叙利亚的反恐行动

88

90

22

200

开放二胎

94

86

20

200

深圳禁摩限电

83

90

27

200

5.2 实验预处理

在清洗数据的过程中,通过添加正则的方式清除微博内容中的@标记、转发标记(通常以 //@ 开头)以及网页链接标记(通常以 http 开头)。由于一部分微博文本是与各个Target相关的新闻内容,通常【】符号中包含了新闻的关键内容,能够表明微博的立场,因此针对这类文本,只提取了【】符号中的内容来分析。在分词过程中,将第3节中提及的关联实体库、情感词表、从句关联词表、否定词表以及程度副词表整合后作为用户自定义词典添加到中国科学院的NLPIR分词系统中,以此来提升分词效果。在去停用词过程中,使用哈工大信息检索中心发布的停用词表来对微博中的停用词进行匹配查询后将其去除。

5.3 实验设计

作为对比,选取以下3种模型来对相同的数据集进行立场判别:

(1)朴素贝叶斯三分类模型(NB模型):使用第上文提出的朴素贝叶斯分类器的伯努利模型来将某一条微博的立场划分为FAVOR、AGAINST或NONE。

(2)SVM三分类模型:将每一条微博用一个特征向量表示,将其作为输入SVM算法的输入,识别三种立场[25]。表5列出了SVM模型的所有特征类型及含义。

5 SVM模型的特征类型及含义

特征类型

含 义

Bigram

Bigram语言特征

Sentiment score

情感权值

Negations

否定词个数

DegreeAdverb

程度副词个数

Associated Entities

关联实体个数

(3)Glove_SVM模型:文献[4]将无监督学习的GloVe算法训练出的单词词向量加和后得到微博文本的向量表示,将其作为逻辑回归模型的输入。

在评价模型的实验效果时,本文使用准确率、召回率、F值等指标对Favor和Against这两类立场分类结果进行评测。在实现中,涉及到SVM算法的分类工作采用台湾大学开发的LibSVM(https://www.csie.ntu.edu.tw/~cjlin/libsvm/)工具包来实现。

5.4 实验结果与分析

5.4.1 实验1

针对每个模型都做了两组实验,实验1将 3 000条已标注的训练语料中5个目标话题对应的数据按6:4的比例随机拆分成两部分,分别作为训练集和测试集,最终训练集共包含1 800条数据(其中每个目标话题包含360条数据),测试集共包含1 200条数据(其中每个目标话题包含240条数据)。

表6列出了实验1 中测试数据的整体F值以及各个目标话题对应的F值。图3中的折线图对测试数据在各模型的整体实验结果进行了可视化,柱状图对各个目标话题对应的实验结果进行了可视化。

6 3 000条标注数据按照6:4比例划分后的实验结果

分类器

Overall

iPhone SE

春节放鞭炮

开放二胎

俄罗斯在叙利亚的反恐

深圳禁摩限电

Favg

Favg

Favg

Favg

Favg

Favg

NB

0.546 641 665

0.472 673 267

0.541 747 904

0.498 002 426

0.349 370 047

0.601 350 119

SVM

0.484 132 088

0.415 827 338

0.512 185 346

0.422 314 381

0.453 263 158

0.113 079 260

Glove_SVM

0.528 382 279

0.449 099 099

0.514 323 367

0.565 268 817

0.480 716 253

0.430 696 393

SWNB

0.572 687 486

0.505 083 450

0.654 954 425

0.566 974 999

0.558 544 967

0.561 043 048

3 实验1结果

 

从实验结果可以发现,除了话题“俄罗斯在叙利亚的反恐行动”,SVM三分类模型的F值均低于NB模型和Glove_SVM模型,说明特征选择的好坏对于SVM模型的分类效果影响很大。一方面,将词的bigram作为文本特征,数据规模较大;另一方面,否定词个数、程度副词个数以及关联实体个数等特征并不能刻画三者之间的情感修饰关系。而GLOVE_SVM算法通过Glove算法训练出词向量,进而得到文本向量,通过深度学习考虑到了文本中不同粒度的潜在语义关系,能够更好地表示文本特征。朴素贝叶斯算法将某一条微博的立场直接划分为FAVOR、AGAINST或NONE,整体结果F值较高,说明朴素贝叶斯模型在识别FAVOR和AGAINST这两种立场时准确率较高。

相比于NB模型、SVM模型和Glove_SVM模型,本文的SWNB模型针对5个目标话题进行立场判别的结果更准确。SWNB模型在将微博立场划分为包含立场(非NONE)和未表明立场(NONE)两类时,考虑到了微博文本中是否出现与话题有关的实体,进而分析微博作者对这些实体持有的情感态度来判断作者对该目标话题持有的立场。在立场为NONE的微博中,微博作者往往只对相应话题的事实进行了客观分析,没有表达任何态度,例如微博“开放二胎,既是对年轻人勇气的考验,也是对爷爷奶奶们精力的考验。中国父母既要含辛茹苦养育自己的孩子,还要劳心劳力照顾孩子的孩子,不容易。”并没有透露作者对“开放二胎”这一政策的明确态度。改进后的朴素贝叶斯算法对被划分为包含立场(非NONE)的微博进行二分类时重点考虑了情感特征词,关联实体、否定词、程度副词的影响。

5.4.2 实验2

为进一步验证本文模型的有效性与合理性,实验2使用3 000条已标注的训练语料作为训练集,1 000条黄金测试语料(gold data)作为测试集来进行实验。表7列出了实验2中测试数据的整体F值以及各个目标话题对应的F值。图4中的折线图对测试数据的整体F值进行了可视化,柱状图对各个目标话题对应的F值进行了可视化。

7 3 000条标注数据作为训练集、1 000条黄金测试语料(gold data)作为测试集的实验结果

分类器

Overall

iPhone SE

春节放鞭炮

开放二胎

俄罗斯在叙利亚的反恐

深圳禁摩限电

Favg

Favg

Favg

Favg

Favg

Favg

NB

0.379 693 425

0.276 192 633

0.485 239 039

0.141 843 972

0.394 790 078

0.428 917 051

SVM

0.289 700 706

0.255 267 664

0.307 207 412

0.211 006 494

0.369 406 393

0.137 407 407

Glove_SVM

0.420 293 605

0.537 173 203

0.516 744 884

0.074 766 355

0.476 173 021

0.355 987 055

SWNB

0.670 646 777

0.716 070 461

0.730 011 106

0.520 535 714

0.559 264 635

0.641 665 701

 

4 实验2结果

 

本文的SWNB模型在对“iPhone SE”“春节放鞭炮”这两个目标话题的微博进行立场识别时,F值都可达到0.7;话题“开放二胎”的F值最低,为0.52;其他两个目标话题的F值居于0.52-0.7之间。对该结果进行分析发现,在立场识别错误的微博中,话题“春节放鞭炮”“iPhone SE”“俄罗斯在叙利亚的反恐行动”的大部分微博被识别为与正确结果相反的立场,主要是这几类微博中常采用反语等方式表达立场,例如“装傻?俄罗斯货币跌幅60,石油经济奄奄一息,2015年GDP下降3.7,感情都是俄罗斯一盘大棋?”通过反问对俄罗斯在叙利亚的反恐行动的反对立场,因此在第二层分类器中只提取情感词、关联实体、否定词、程度副词作为特征词时不能很好地识别这类情况;话题“开放二胎”和“深圳禁摩限电”的大部分微博被分为NONE,主要是这两个话题的微博直接出现关联实体的频率较低,导致在一层分类器中计算情感权值产生误差。

6 结语

本文提出了有监督的SWNB分类模型来判别中文微博话题的立场。SWNB模型提出的对复杂句式、话题相关实体进行处理的新的情感加权规则,能够有效地区分出文本是否表达立场;改进的朴素贝叶斯算法能对被情感加权算法划分为包含立场(非NONE)的微博进行二分类,将其分为支持(FAVOR)或反对(AGAINST)立场。本文的SWNB模型结合了情感规则和机器学习模型的优势,充分考虑到中文复杂句式、话题相关实体、上下文语境以及文本语义对文本情感倾向的影响,实现简单,研判精度较高。

然而,SWNB模型对情感词典、关联实体集等资源的完整性以及分词结果的准确性依赖较大。此外,大量情感词存在歧义,在不同语境中表达的含义存在差别,本文模型目前无法对含有歧义的情感词进行严格区分,因此未来需要进一步完善情感词典等资源,并结合语义分析和深度学习技术,以期能更加准确地判别中文微博话题的立场。

参考文献

[1] MOHAMMAD S M, SOBHANI P, KIRITCHENKO S. Stance and sentiment in Tweets[J]. ACM transactions on embedded computing systems, 2016, 1(1):1-21.

[2] MANKE S N, SHIVALE N. A review on: opinion mining and sentiment analysis based on natural language processing[J]. International journal of computer applications, 2015, 109(4): 29-32.

[3] BøHLER H, ASLA P F, MARSI E, et al. IDI@NTNU at SemEval-2016 task 6: detecting stance in Tweets using shallow features and GloVe Vectors for word representation[C]//International workshop on semantic evaluation. San Diego: Elsevier, 2016: 445-450.

[4] LU Y, CASTELLANOS M, DAVAL U, et al. Automatic construction of a context-aware sentiment lexicon: an optimization approach[C]//International conference on World Wide Web. Hyderabad: ACM, 2011: 347-356.

[5] HUTTO C J, GILBERT E. VADER: A parsimonious rule-based model for sentiment analysis of social media text[C]// Eighth international conference on weblogs and social media. Michigan: AAAI, 2014: 216-225.

[6] 陈忆金, 曹树金, 陈桂鸿. 网络舆情意见挖掘: 用户评论情感倾向分析研究[J]. 图书情报知识, 2013(6): 90-96.

[7] 刘全超, 黄河燕, 冯冲. 基于多特征微博话题情感倾向性判定算法研究[J]. 中文信息学报, 2014, 28(4): 123-131.

[8] TSOU B K Y, YUEN R W M, KWONG O Y, et al. Polarity classification of celebrity coverage in the Chinese press[C]// 2005 International Conference on Intelligence Analysis. Virginia: IEEE, 2005: 102-108.

[9] WOJATZKI M, ZESCH T. ltl.uni-due at SemEval-2016 Task 6: Stance detection in social media using stacked classifiers[C]// International workshop on semantic evaluation. San Diego: Elsevier, 2016: 428-433.

[10] ANAND P, WALKER M, ABBOTT R, et al. Cats rule and dogs drool!: Classifying stance in online debate[C]// The 2nd workshop on computational approaches to subjectivity and sentiment analysis. Oregon: ACL Anthology, 2011: 1-9.

[11] MOHAMMAD S M, KIRITCHENKO S, Zhu X. NRC-Canada: building the state-of-the-art in sentiment analysis of tweets[C]//International workshop on semantic evaluation. Atlanta: ACL Anthology, 2013: 321-327.

[12] VELICHKOV B, KAPUKARANOV B, GROZEV I, et al. SU-FMI: System description for SemEval-2014 Task 9 on sentiment analysis in Twitter[C] // International workshop on semantic evaluation. Dublin: ACL Anthology, 2014: 590-595.

[13] CASEY W, NAVENDU G, SHLOMO A. Using appraisal groups for sentiment analysis[C]// The 14th ACM international conference on Information and knowledge management. Bremen: ACM, 2005: 625-631.

[14] SEVERYN A, MOSCHITTI A. UNITN: Training dep convolutional neural network for Twitter sentiment classification[C]// The 9th international workshop on semantic evaluation. Denver: ACL Anthology, 2015: 464-469.

[15] LIU X, LI K, ZHOU M, et al. Collective semantic role labeling for tweets with clustering[C]// The twenty-second international joint conference on artificial intelligence. Barcelona: AAAI, 2011:1832-1837.

[16] 宋锐, 林鸿飞, 常富洋. 中文比较句识别及比较关系抽取[J]. 中文信息学报, 2009, 23(2): 102-107.

[17] LAFFERTY J, MCCALLUM A, PEREIRA F. Conditional random fields: probabilistic models for segmenting and labeling sequence data[C] //Proceedings of ICML 2001. San Francisco, 2001: 282-289.

[18] 姚双云, 沈威. 关联词的搭配研究[J]. 计算机与现代化, 2007(4): 7-9.

[19] 刘翠娟, 刘箴, 柴艳杰, 等. 基于微博文本数据分析的社会群体情感可视计算方法研究[J]. 北京大学学报(自然科学版), 2016, 52(1): 178-186.

[20] 韩宏, 杨静宇, 娄震. 基于层次的分类器组合[J]. 南京理工大学学报(自然科学版), 2002, 26(1): 10-14.

[21] LAMESKI P, ZDRAVEVSKI E, MINGOV R, et al. Svm parameter tuning with grid search and its impact on reduction of model over-fitting[M]//In rough sets, fuzzy sets, data mining, and granular computing. Germany: Springer, 2015: 464-474.

[22] 李爱萍, 邸鹏, 段利国. 基于句子情感加权算法的篇章情感分析[J]. 小型微型计算机系统, 2015, 36(10): 2252-2256.

[23] LEWIS D D. Naive (Bayes) at forty: the independence assumption in information retrieval[C]//European Conference on Machine Learning. Berlin: Springer, 1998: 1204-1206.

[24] MYUNG I J. Tutorial on maximum likelihood estimation[J]. Journal of mathematical psychology, 2003, 47(1): 90-100.

[25] PANG B, LEE L, VAITHYANATHAN S. Thumbs up?: sentiment classification using machine learning techniques[C]// The ACL-02 conference on empirical methods in natural language processing. Philadelphia: ACL Anthology, 2002: 79-86.

作者贡献说明:

刘 勘:主要完成论文思路、算法模型提出和论文修改;

田宁梦:主要完成论文算法的提出、主要实验和初稿撰写;

王宏宇:主要完成论文算法的讨论、对比实验;

林荣蓉:主要完成论文对比实验;

王德民:主要完成论文数据搜集和预处理。

 

Stance Detection in Chinese Microblogs

Liu Kan Tian Ningmeng Wang Hongyu Lin Rongrong Wang Demin

Department of Information, School of Information and Safety Engineering,
Zhongnan University of Economics and Law, Wuhan 430073

Abstract: [Purpose/significance] The paper introduces a new approach to automatically detect stance in Chinese microblogs by building a serial combination model based on Sentiment Weighted Algorithm and Naive Bayes (SWNB model). [Method/process] Firstly, this paper used the SWNB model to simplify complex sentences by using a defined complex sentence pattern, assigning a sentiment weight to each microblog according to calculation rules, and optimizing sentiment weight by detecting the presence of the target’s associated entities; thus, we could classify microblogs into those containing any stance or with no stance at all. Secondly, the SWNB model extracted some feature words and used Naive Bayes to classify the microblogs labeled as FAVOR or AGAINST. [Result/conclusion] Experiments show that this model can comprehensively process complex sentences, target-related entities and linguistic context.

Keywords: Chinese microblogs; stance detection; sentiment weighted algorithm; Naive Bayes

引用格式:刘勘, 田宁梦, 王宏宇, 等. 中文微博的立场判别研究[J/OL]. 知识管理论坛, 2017, 2(3): 175-185[引用日期]. http://www.kmf.ac.cn/p/1/132/.

 

 


知识共享许可协议
本作品采用知识共享署名 3.0 中国大陆许可协议进行许可。

下载