基于规则的短文本识别算法

作者：段娜 ; 杨妍 ; 赵军民
关键词：情感分析 ; 情感词 ; 句法分析 ; 微博
中文刊名：WXXJ
机构：河南城建学院;
出版日期：2019-02-15
出版单位：计算机产品与流通
年：2019
基金：国家语委语言文字科研项目优秀成果后期资助计划“情感词语知识库、语料库建设及应用”(项目编号:HQ135-16)
语种：中文;
页：WXXJ201902161
页数：2
CN：02
ISSN：12-1276/TP
分类号：175-176

摘要

近年来,关于短文本的文本挖掘逐渐变成了自然语言处理的热点之一。针对微博这种短文本,内容较少但语义却及其丰富,而且新词、错字较多等特征,本文提出一种基于规则的短文本识别算法,该算法分两步对短文本的观点句和情感倾向性进行识别。从NLPCC2012提供的评测数据的实验结果来看,本方法取得了一定的效果。

引文

[1]Tang D,Wei F,Qin B,Yang N,Liu T,Zhou M.Sentiment embeddings with applications to sentiment analysis[J].IEEE Transactions on Knowledge and Data Engineering,2016,28(2):496-509.
    [2]Lou X,Chai Y,Zan H,et al.Research on micro-blog sentiment analysis[C]//Workshop on Chinese Lexical Semantics.Springer,Berlin,Heidelberg,2013:466-479.
    [3]Jun Li and Maosong Sun,Experimental Study on Sentiment Classification of Chinese Review using Machine Learning Techniques,in Proceding of IEEE NLPKE 2007
    [4]李军.中文评论的褒贬义分类实验研究,硕士论文[D].北京:清华大学,2008
    [5]徐琳宏,林鸿飞,潘宇等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185.