基于R语言对不平衡数据分类的研究
详细信息    查看全文 | 推荐本文 |
  • 作者:张灵婕 ; 尤添革
  • 关键词:不平衡数据 ; SMOTE算法 ; ROC曲线图 ; R语言
  • 中文刊名:FJDN
  • 英文刊名:Fujian Computer
  • 机构:福建农林大学计算机与信息学院;
  • 出版日期:2018-01-25
  • 出版单位:福建电脑
  • 年:2018
  • 期:v.34
  • 基金:福建省统计局课题KH(1700360)
  • 语种:中文;
  • 页:FJDN201801004
  • 页数:3
  • CN:01
  • ISSN:35-1115/TP
  • 分类号:14-15+36
摘要
在统计处理中,不平衡数据非常常见,但是不平衡数据的分类对统计的结果有很大影响,所以不平衡数据的分类是目前统计研究者非常关注的。以SMOTE算法为例,对不平衡数据在R语言统计软件的基础上予以简单实现,并利用ROC曲线图进行简要评估。
        
引文
[1]Jiawei Han,Micheline Kamber,Jian Pei著,范明等译.数据挖掘概念与技术[M],2012.
    [2]叶志飞,文益民,吕宝粮.不平衡分类问题研究综述[J].智能系统学报,2009.4(2):148-156.
    [3]程险峰,李军,李雄飞.一种基于欠采样的不平衡数据分类算法[J].计算机工程,2011.37(13):147-149.
    [4]孙渤禹,李鹏.面向失衡数据集分类问题的研究与应用[D].哈尔滨理工大学硕士学位论文
    [5]霍纬纲,高小霞.一种适用于多类不平衡数据集的模糊关联分类方法[J].控制与决策,2012.27(12):1833-1838.
    [6]杨明,尹军梅,吉根林.不平衡数据分类方法综述[J].南京师范大学学报(工程技术版),2008.8(4):7-12.
    [7]蒋国瑞,司学峰.基于代价敏感SVM的电信客户流失预测研究[J].计算机应用研究,2009.26(2):521-523.
    [8]王丽丽,苏德富.集成学习算法研究[D].广西大学硕士学位论文,2006.
    [9]邱晓红.多类别模糊补偿支持向量机新模型研究[J].计算机科学与探索,2009.3(3):330-336.
    [10]郭乔进,李立斌,李宁.一种用于不平衡数据分类的改进Ada Boost算法[J].计算机工程与应用,2008.44(21):217-221.
    [11]王和勇,樊泓坤,姚正安,李成安.不平衡数据集的分类方法研究[J].计算机应用研究,2008.25(5):1301-1303.
    [12]李永新.一种不平衡数据的分类方法[J].兰州理工大学学报,2008.34(3):87-90.
    [13]董燕杰.不平衡数据集分类的Random-SMOTE方法研究[D].大连理工大学硕士学位论文,2009
    [14]孟军.不平衡数据集分类算法的研究[D].南京理工大学硕士学位论文,2014

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700