
微博情感倾向算法的改进与实现
Improvement and Implementation of Weibo Sentiment Analysis Algorithm
为了提升对微博数据分析的准确度,首先对微博的发展现状及文本特点进行分析;其次提出全新的情感倾向词典构建方案,在改进现有词典的同时加入三个全新类型的词典,并以此作为词法分析的基础;随后建立可解析词与词、子句与子句之间的逻辑关系的语法库,从而实现对微博文本的语法分析;最后,应用本文提出的改进算法,设计、实现算法验证程序并进行测试。结果表明,改进算法在处理微博文本数据时正确率为80.74%,较原算法提高了22.72%。
[1] |
新浪网. 新浪2012年第三季度财务报告[EB/OL].[2013-04-17].http://tech.sina.com.cn.
|
[2] |
冯希莹,王来华. 舆情概念辨析[J]. 社会工作(学术版), 2011(5):83-87.
|
[3] |
Hatzivassiloglous V, MCKeown K. Predicting the semantic orientation of adjectives[C]// Proceedings of ACL-97, 35th Annual Meeting of the Association for Computational Linguistics. Madrid: ACL, 1997:174-181.
|
[4] |
Zagibalov T, Carroll J. Automatic seed word selection for unsupervised sentiment classification of Chinese text[C]//Proceedings of the 22nd International Conference on Computational Linguistics (Coling 2008).Manchester: Coling 2008 Organizing Committee, 2008:1073-1080.
|
[5] |
Pang B, Lee L, Vaithyanathan S. Thumbs up? Sentiment classification using machine learning techniques[C]//Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing(EMNLP 2002). Philadelphia:ACL,2002:79-86.
|
[6] |
Turney P D, Littman M L. Measuring praise and criticism: Inference of semantic orientation form association[J]. ACM Transactions on Information Systems, 2003, 21(4):315-346.
|
[7] |
王素格. 基于Web的评论文本情感分类问题研究[D].上海:上海大学, 2008.
|
[8] |
Tan S, Wu G, Tang H. A Novel scheme for domain-transfer problem in the context of sentiment analysis[C]//Proceedings of the 16th ACM Conference on Information and Knowledge Management. Lisbon: ACM, 2007:979-982.
|
[9] |
Hu M, Liu B. Mining and summarizing customer reviews[C]//Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Seattle: ACM, 2004:168-177.
|
[10] |
魏韡,向阳. 中文文本情感分析综述[J].计算机应用,2011(12):3321-3323.
|
[11] |
杜伟夫,谭松波,云晓春,等. 一种新的情感词汇语义倾向计算方法[J].计算机研究与发展,2009,46(10):1713-1720.
|
[12] |
Yuen R W M, Chan T Y W, Lai T B Y. Morpheme-based derivation of bipolar semantic orientation of Chinese words[C]//Proccedings of the 20th International Conference of Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 2004: 1008 - 1014.
|
[13] |
张靖,金浩. 汉语词语情感倾向自动判断研究[J]. 计算机工程, 2010, 36(23): 194-196.
|
[14] |
Yang Shen. Emotion mining research on Micro-blog[C]//2009 1st IEEE Symposium on Web Society(SWS 2009). Lanzhou: Lanzhou University,2009.
|
[15] |
朱嫣岚,闵锦,周雅倩,等. 基于HowNet的词汇语义倾向计算[J]. 中文信息学报, 2006, 20(1): 14-20.
|
[16] |
熊德兰,程菊明,田胜利. 基于HowNet的句子褒贬倾向性研究[J]. 计算机工程与应用, 2008, 44(22): 143- 144.
|
[17] |
李实,叶强,李一军. 中文网络客户评论的产品特征挖掘方法研究[J]. 管理科学学报, 2009, 12(2): 142-152.
|
[18] |
刘鸿宇,赵妍妍,秦兵,等. 评价对象抽取及其倾向性分析[J]. 中文信息学报, 2010, 24(1): 84-88.
|
[19] |
唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J].中文信息学报, 2007, 21(6):88 - 94.
|
[20] |
李寿山,黄居仁. 基于Stacking组合分类方法的中文情感分类研究[J]. 中文信息学报, 2010, 24(5): 56 - 61.
|
[21] |
吴迪. 汉语微博文本特征研究[D]. 长春:吉林大学, 2012.
|
/
〈 |
|
〉 |