摘要
近年来,关于短文本的文本挖掘逐渐变成了自然语言处理的热点之一。针对微博这种短文本,内容较少但语义却及其丰富,而且新词、错字较多等特征,本文提出一种基于规则的短文本识别算法,该算法分两步对短文本的观点句和情感倾向性进行识别。从NLPCC2012提供的评测数据的实验结果来看,本方法取得了一定的效果。
引文
[1]Tang D,Wei F,Qin B,Yang N,Liu T,Zhou M.Sentiment embeddings with applications to sentiment analysis[J].IEEE Transactions on Knowledge and Data Engineering,2016,28(2):496-509.
[2]Lou X,Chai Y,Zan H,et al.Research on micro-blog sentiment analysis[C]//Workshop on Chinese Lexical Semantics.Springer,Berlin,Heidelberg,2013:466-479.
[3]Jun Li and Maosong Sun,Experimental Study on Sentiment Classification of Chinese Review using Machine Learning Techniques,in Proceding of IEEE NLPKE 2007
[4]李军.中文评论的褒贬义分类实验研究,硕士论文[D].北京:清华大学,2008
[5]徐琳宏,林鸿飞,潘宇等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185.