基于规则的短文本识别算法
详细信息    查看全文 | 推荐本文 |
  • 作者:段娜 ; 杨妍 ; 赵军民
  • 关键词:情感分析 ; 情感词 ; 句法分析 ; 微博
  • 中文刊名:WXXJ
  • 机构:河南城建学院;
  • 出版日期:2019-02-15
  • 出版单位:计算机产品与流通
  • 年:2019
  • 基金:国家语委语言文字科研项目优秀成果后期资助计划“情感词语知识库、语料库建设及应用”(项目编号:HQ135-16)
  • 语种:中文;
  • 页:WXXJ201902161
  • 页数:2
  • CN:02
  • ISSN:12-1276/TP
  • 分类号:175-176
摘要
近年来,关于短文本的文本挖掘逐渐变成了自然语言处理的热点之一。针对微博这种短文本,内容较少但语义却及其丰富,而且新词、错字较多等特征,本文提出一种基于规则的短文本识别算法,该算法分两步对短文本的观点句和情感倾向性进行识别。从NLPCC2012提供的评测数据的实验结果来看,本方法取得了一定的效果。
        
引文
[1]Tang D,Wei F,Qin B,Yang N,Liu T,Zhou M.Sentiment embeddings with applications to sentiment analysis[J].IEEE Transactions on Knowledge and Data Engineering,2016,28(2):496-509.
    [2]Lou X,Chai Y,Zan H,et al.Research on micro-blog sentiment analysis[C]//Workshop on Chinese Lexical Semantics.Springer,Berlin,Heidelberg,2013:466-479.
    [3]Jun Li and Maosong Sun,Experimental Study on Sentiment Classification of Chinese Review using Machine Learning Techniques,in Proceding of IEEE NLPKE 2007
    [4]李军.中文评论的褒贬义分类实验研究,硕士论文[D].北京:清华大学,2008
    [5]徐琳宏,林鸿飞,潘宇等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185.