基于SVM藏文文本分类的研究与实现

作者：贾宏云 ; 群诺 ; 苏慧婧 ; 次仁罗增 ; 巴桑卓玛
关键词：藏文文本分类 ; 支持向量机 ; Logistic回归
中文刊名：DZRU
英文刊名：Electronic Technology & Software Engineering
机构：西藏大学信息科学技术学院;
出版日期：2018-05-02 17:52
出版单位：电子技术与软件工程
年：2018
期：No.131
基金：西藏自治区科技计划重大科技专项(ZDZX2017000136);; 西藏大学“珠峰学者人才发展支持计划”项目;西藏大学研究生“高水平人才培养计划”项目(2016-GSP-028)
语种：中文;
页：DZRU201809120
页数：3
CN：09
ISSN：10-1108/TP
分类号：160-162

摘要

利用SVM(支持向量机)技术对复杂繁琐的汉文文本资源进行快速分类已经相当的成熟,但其在藏文文本分类中的应用还处于研究阶段,因此实验目的在于测试该方法是否在藏文文本分类中具有良好的性能。主要过程包括:文本向量空间模型化,获取SVM中核函数的参数并进行常用核函数分类性能对比,最后与Logistic回归分类器进行同等条件下的实验对比,验证了支持向量机模型在藏文文本分类中具有良好的分类效果。

引文

[1]熊浩勇.基于SVM的中文文本分类算法研究与实现[D].武汉理工大学,2008.
    [2]李航.统计学习方法[M].北京:清华大学出版社,2012.
    [3]崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013.
    [4]高定国,珠杰.藏文信息处理的原理与应用[M].成都:西南交通大学出版社,2015.
    [5]杨玉珍,刘培玉,朱振方,邱烨.应用特征项分布信息的信息增益改进方法研究[J].山东大学学报(理学版),2009.
    [6]杨杰明.文本分类中文本表示模型和特征选择算法研究[D].吉林大学,2013.

地址：北京市海淀区学院路29号邮编：100083

电话：办公室：(+86 10)66554848；文献借阅、咨询服务、科技查新：66554700