基于SVM藏文文本分类的研究与实现
详细信息    查看全文 | 推荐本文 |
  • 作者:贾宏云 ; 群诺 ; 苏慧婧 ; 次仁罗增 ; 巴桑卓玛
  • 关键词:藏文文本分类 ; 支持向量机 ; Logistic回归
  • 中文刊名:DZRU
  • 英文刊名:Electronic Technology & Software Engineering
  • 机构:西藏大学信息科学技术学院;
  • 出版日期:2018-05-02 17:52
  • 出版单位:电子技术与软件工程
  • 年:2018
  • 期:No.131
  • 基金:西藏自治区科技计划重大科技专项(ZDZX2017000136);; 西藏大学“珠峰学者人才发展支持计划”项目;西藏大学研究生“高水平人才培养计划”项目(2016-GSP-028)
  • 语种:中文;
  • 页:DZRU201809120
  • 页数:3
  • CN:09
  • ISSN:10-1108/TP
  • 分类号:160-162
摘要
利用SVM(支持向量机)技术对复杂繁琐的汉文文本资源进行快速分类已经相当的成熟,但其在藏文文本分类中的应用还处于研究阶段,因此实验目的在于测试该方法是否在藏文文本分类中具有良好的性能。主要过程包括:文本向量空间模型化,获取SVM中核函数的参数并进行常用核函数分类性能对比,最后与Logistic回归分类器进行同等条件下的实验对比,验证了支持向量机模型在藏文文本分类中具有良好的分类效果。
        
引文
[1]熊浩勇.基于SVM的中文文本分类算法研究与实现[D].武汉理工大学,2008.
    [2]李航.统计学习方法[M].北京:清华大学出版社,2012.
    [3]崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013.
    [4]高定国,珠杰.藏文信息处理的原理与应用[M].成都:西南交通大学出版社,2015.
    [5]杨玉珍,刘培玉,朱振方,邱烨.应用特征项分布信息的信息增益改进方法研究[J].山东大学学报(理学版),2009.
    [6]杨杰明.文本分类中文本表示模型和特征选择算法研究[D].吉林大学,2013.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700