摘要
利用SVM(支持向量机)技术对复杂繁琐的汉文文本资源进行快速分类已经相当的成熟,但其在藏文文本分类中的应用还处于研究阶段,因此实验目的在于测试该方法是否在藏文文本分类中具有良好的性能。主要过程包括:文本向量空间模型化,获取SVM中核函数的参数并进行常用核函数分类性能对比,最后与Logistic回归分类器进行同等条件下的实验对比,验证了支持向量机模型在藏文文本分类中具有良好的分类效果。
引文
[1]熊浩勇.基于SVM的中文文本分类算法研究与实现[D].武汉理工大学,2008.
[2]李航.统计学习方法[M].北京:清华大学出版社,2012.
[3]崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013.
[4]高定国,珠杰.藏文信息处理的原理与应用[M].成都:西南交通大学出版社,2015.
[5]杨玉珍,刘培玉,朱振方,邱烨.应用特征项分布信息的信息增益改进方法研究[J].山东大学学报(理学版),2009.
[6]杨杰明.文本分类中文本表示模型和特征选择算法研究[D].吉林大学,2013.