微博情感倾向算法的改进与实现

张伟舒, 吕云翔

知识管理论坛 ›› 2013, Vol. 2013 ›› Issue (9) : 21-27.

PDF(568 KB)
PDF(568 KB)
知识管理论坛 ›› 2013, Vol. 2013 ›› Issue (9) : 21-27. DOI: 10.7536/j.issn.2095-5472.2013.09.004
研究论文

微博情感倾向算法的改进与实现

作者信息 +

Improvement and Implementation of Weibo Sentiment Analysis Algorithm

Author information +
文章历史 +

摘要

为了提升对微博数据分析的准确度,首先对微博的发展现状及文本特点进行分析;其次提出全新的情感倾向词典构建方案,在改进现有词典的同时加入三个全新类型的词典,并以此作为词法分析的基础;随后建立可解析词与词、子句与子句之间的逻辑关系的语法库,从而实现对微博文本的语法分析;最后,应用本文提出的改进算法,设计、实现算法验证程序并进行测试。结果表明,改进算法在处理微博文本数据时正确率为80.74%,较原算法提高了22.72%。

关键词

情感倾向分析 / 微博 / 情感词典 / 算法

引用本文

导出引用
张伟舒 , 吕云翔. 微博情感倾向算法的改进与实现[J]. 知识管理论坛. 2013, 2013(9): 21-27 https://doi.org/10.7536/j.issn.2095-5472.2013.09.004
Zhang Weishu , Lv Yunxiang. Improvement and Implementation of Weibo Sentiment Analysis Algorithm[J]. Knowledge Management Forum. 2013, 2013(9): 21-27 https://doi.org/10.7536/j.issn.2095-5472.2013.09.004
中图分类号:   

参考文献

[1]
新浪网. 新浪2012年第三季度财务报告[EB/OL].[2013-04-17].http://tech.sina.com.cn.
[2]
冯希莹,王来华. 舆情概念辨析[J]. 社会工作(学术版), 2011(5):83-87.
[3]
Hatzivassiloglous V, MCKeown K. Predicting the semantic orientation of adjectives[C]// Proceedings of ACL-97, 35th Annual Meeting of the Association for Computational Linguistics. Madrid: ACL, 1997:174-181.
[4]
Zagibalov T, Carroll J. Automatic seed word selection for unsupervised sentiment classification of Chinese text[C]//Proceedings of the 22nd International Conference on Computational Linguistics (Coling 2008).Manchester: Coling 2008 Organizing Committee, 2008:1073-1080.
[5]
Pang B, Lee L, Vaithyanathan S. Thumbs up? Sentiment classification using machine learning techniques[C]//Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing(EMNLP 2002). Philadelphia:ACL,2002:79-86.
[6]
Turney P D, Littman M L. Measuring praise and criticism: Inference of semantic orientation form association[J]. ACM Transactions on Information Systems, 2003, 21(4):315-346.
[7]
王素格. 基于Web的评论文本情感分类问题研究[D].上海:上海大学, 2008.
[8]
Tan S, Wu G, Tang H. A Novel scheme for domain-transfer problem in the context of sentiment analysis[C]//Proceedings of the 16th ACM Conference on Information and Knowledge Management. Lisbon: ACM, 2007:979-982.
[9]
Hu M, Liu B. Mining and summarizing customer reviews[C]//Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Seattle: ACM, 2004:168-177.
[10]
魏韡,向阳. 中文文本情感分析综述[J].计算机应用,2011(12):3321-3323.
[11]
杜伟夫,谭松波,云晓春,等. 一种新的情感词汇语义倾向计算方法[J].计算机研究与发展,2009,46(10):1713-1720.
[12]
Yuen R W M, Chan T Y W, Lai T B Y. Morpheme-based derivation of bipolar semantic orientation of Chinese words[C]//Proccedings of the 20th International Conference of Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 2004: 1008 - 1014.
[13]
张靖,金浩. 汉语词语情感倾向自动判断研究[J]. 计算机工程, 2010, 36(23): 194-196.
[14]
Yang Shen. Emotion mining research on Micro-blog[C]//2009 1st IEEE Symposium on Web Society(SWS 2009). Lanzhou: Lanzhou University,2009.
[15]
朱嫣岚,闵锦,周雅倩,等. 基于HowNet的词汇语义倾向计算[J]. 中文信息学报, 2006, 20(1): 14-20.
[16]
熊德兰,程菊明,田胜利. 基于HowNet的句子褒贬倾向性研究[J]. 计算机工程与应用, 2008, 44(22): 143- 144.
[17]
李实,叶强,李一军. 中文网络客户评论的产品特征挖掘方法研究[J]. 管理科学学报, 2009, 12(2): 142-152.
[18]
刘鸿宇,赵妍妍,秦兵,等. 评价对象抽取及其倾向性分析[J]. 中文信息学报, 2010, 24(1): 84-88.
[19]
唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J].中文信息学报, 2007, 21(6):88 - 94.
[20]
李寿山,黄居仁. 基于Stacking组合分类方法的中文情感分类研究[J]. 中文信息学报, 2010, 24(5): 56 - 61.
[21]
吴迪. 汉语微博文本特征研究[D]. 长春:吉林大学, 2012.

PDF(568 KB)

Accesses

Citation

Detail

段落导航
相关文章

/