摘要
在统计处理中,不平衡数据非常常见,但是不平衡数据的分类对统计的结果有很大影响,所以不平衡数据的分类是目前统计研究者非常关注的。以SMOTE算法为例,对不平衡数据在R语言统计软件的基础上予以简单实现,并利用ROC曲线图进行简要评估。
引文
[1]Jiawei Han,Micheline Kamber,Jian Pei著,范明等译.数据挖掘概念与技术[M],2012.
[2]叶志飞,文益民,吕宝粮.不平衡分类问题研究综述[J].智能系统学报,2009.4(2):148-156.
[3]程险峰,李军,李雄飞.一种基于欠采样的不平衡数据分类算法[J].计算机工程,2011.37(13):147-149.
[4]孙渤禹,李鹏.面向失衡数据集分类问题的研究与应用[D].哈尔滨理工大学硕士学位论文
[5]霍纬纲,高小霞.一种适用于多类不平衡数据集的模糊关联分类方法[J].控制与决策,2012.27(12):1833-1838.
[6]杨明,尹军梅,吉根林.不平衡数据分类方法综述[J].南京师范大学学报(工程技术版),2008.8(4):7-12.
[7]蒋国瑞,司学峰.基于代价敏感SVM的电信客户流失预测研究[J].计算机应用研究,2009.26(2):521-523.
[8]王丽丽,苏德富.集成学习算法研究[D].广西大学硕士学位论文,2006.
[9]邱晓红.多类别模糊补偿支持向量机新模型研究[J].计算机科学与探索,2009.3(3):330-336.
[10]郭乔进,李立斌,李宁.一种用于不平衡数据分类的改进Ada Boost算法[J].计算机工程与应用,2008.44(21):217-221.
[11]王和勇,樊泓坤,姚正安,李成安.不平衡数据集的分类方法研究[J].计算机应用研究,2008.25(5):1301-1303.
[12]李永新.一种不平衡数据的分类方法[J].兰州理工大学学报,2008.34(3):87-90.
[13]董燕杰.不平衡数据集分类的Random-SMOTE方法研究[D].大连理工大学硕士学位论文,2009
[14]孟军.不平衡数据集分类算法的研究[D].南京理工大学硕士学位论文,2014