基于概念层次树的数据挖掘算法及在CRM中的应用
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
数据挖掘指从大量的数据中发现潜在的,有用的知识的过程,是实现现代企业客户关系管理的重要手段之一。数据分类方法作为数据挖掘的一个重要方面,在统计、机器学习、神经网络、专家系统等领域中有着广泛的应用,如医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别等。
     现有数据分类方法有统计方法、决策树分类方法、神经网络方法、粗集法等。其中概念层次树作为一种统计类的数据分类方法在面向属性的归纳分类方法中起着重要作用。通过它对数据库中的数据进行分类可以帮助我们发现数据的特征,以更加容易理解的方式总结数据,并且依据面向概念的结构来组织数据。
     本文针对已有数据分类算法的不足,采用“变间隔分割初始区间”和“概念层次构建与概念提升同步”的方式“自底向上”地构建概念层次树,提出并实现了基于概念层次树的数据挖掘改进算法。
     改进算法针对数值型数据呈不均匀分布的情况,相比原算法有更好的效果。本论文对两种算法在实际数据库上进行测试,给出了数据分析结果,并给出了该改进算法在外贸企业客户关系管理中的应用实例。
Data mining which means a kind of process that reveals potential useful knowledge from massive, is one important technology in CRM of modem enterprises. Data classification, as an important aspect of research of DM, now has been successfully applied to medical diagnosis, weather prediction, credit approval, customer segmentation, fraud detection and so on.
    Many different techniques have been proposed for classification, including statistical approaches, neural networks, decision tree algorithm and rough sets. Conception Hierarchy Tree classifiers which is a statistical approach have played an important role in Attribute-Oriented Induction. It can help us discover the characteristics of data, make them more understandable and organized in concept-oriented structure.
    This dissertation, in the light of the limitations of existed methods, suggest an algorithm based on Conception Hierarchy Tree for data mining, constructing tree from bottom to top through the method of variedly dividing interval and realizing conception hierarchy construction and conception exaltation isochronously.
    Improved algorithm has showed great effects compared to original algorithm especially to numerical attributes with asymmetry distribution in database. This paper displays the result of two algorithms testing on actual data and offer an example in CRM of a foreign trade enterprise.
引文
[1] 吴林,基于数据仓库的数据挖掘技术的研究与实现数据分类的研究与实现,电子科技大学硕士论文,2001.3
    [2] 王曙光,数据挖掘技术研究及其在CRM中的应用,上海交通大学硕士论文,2002.2
    [3] 陈莉,数据挖掘与虚拟数据库,四川师范大学学报(自然科学版),1998(21),657-661
    [4] Paw lak Z, Rough sets approach to multi-attribute decision analysis[R], ICS Research Report36, Warsaw University of Technology, 1993
    [5] Holland J H, Adaptation in natural and artificial systems[M], AnnArbor: The University of Michigan Press, 1975
    [6] 谷文祥,殷明浩,数据挖掘中决策树加权模糊熵算法,计算技术与自动化,2002(21),120-123
    [7] 陈京民,数据仓库与数据挖掘技术,电子工业出版社,2002.8
    [8] 高洪深,决策支持系统(DSS):理论·方法·案例,清华大学出版社,2000
    [9] 中国人民大学统计系数据挖掘中心,建立数据挖掘为基础的客户关系管理体系,统计学与数据挖掘,2002(17),4-7
    [10] Jon Anton. The past, present and future of customer access centers [J]. International Journal of Service Industry Management, 2000,11 (2), 120-130
    [11] 田同生,中国CRM实战,机械工业出版社,2002.8
    
    
    [12] 客户关系管理 (CRM) 在网上营销展身手,www.hermes.com.cn,2000.8.15
    [13] 全球CRM服务市场在2006年将达到455亿美元,www.ctiforum.com,2002.4.23
    [14] 田同生,中国CRM实战,机械工业出版社,2002
    [15] 王涛,CRM在中国电信的应用,四川通信技术,2001(6),49-52
    [16] 蒋歆,CRM在电信业的应用和实施,世界电信,2002(4),31-34
    [17] 万岩,彭涛,张敏,分析型CRM在电信企业的应用,邮电企业管理,2002(3),49-51
    [18] 刘英,徐建新,潘云洪,商业银行实施客户关系管理的探讨,武汉理工大学学报·信息与管理工程版,2002(24),132-137
    [19] 宋炳方,银行客户培育与维护[M],经济管理出版社,2002.
    [20] 王广宇,CTI论坛:客户关系管理(CRM)及其在中国商业银行领域的应用,www.ctiforum.com,2001.7
    [21] 亚信科技,CTI论坛:亚信OmniCRM中国移动CRM全业务解决方案,www.ctiforum.com,2002.6
    [22] 刘红梅,杜国贞,制造业CRM应用关键:价值链与规模定制,www.e-works.net.cn,2003.5.1
    [23] 了解行业用户对CRM的态度,中国计算机用户,www.e-works.net.cn,2001.8
    [24] 邹帮山,主动数据挖掘在客户关系管理系统中的应用研究,北航经管学院
    
    硕士学位论文,2001
    [25] 谭铧,数据挖掘在客户关系管理中的应用研究,上海交通大学硕士论文,2002.1
    [26] 肖娟,利用数据挖掘管理客户关系,经济管理,2003.1,27-29
    [27] 胡小刚,数据挖掘中决策树分类算法的研究,华中师范大学计算机应用技术硕士论文,2002.12
    [28] 龙誉,分类知识发现的决策树算法研究,北京科技大学硕士毕业论文,2002.2
    [29] Hart J, Cai Y, Cercone N, Knowledge Discovery in Database in Database: An attribute oriented approach [A]. In: Proceedings of the 18th VLDB Conference[C]. Canada British Columbia: Vabcouver, 1992
    [30] 邵红全,赵茜,基于统计分析技术的属性数据挖掘,河北省科学院学报,2002(19),20-24
    [31] Y.Lu. Concept Hierarchies in Data Mining: Specification, Generation and Application. M.Sc. Thesis, Simon Fraser University, Canada, Juanuary 1998
    [32] 蒋嵘,李德毅,范建华,数值型数据的泛概念树的自动生成方法,计算机学报,2000.5,470-476
    [33] 陈文伟,智能决策技术,电子工业出版社,1998.6
    [34] 王大玲,于戈,鲍玉斌,王国仁,刘斌武,基于概念层次树的数据挖掘算法的研究与实现,计算机科学,200l(28),88-91
    [35] Han J, Fu Y. Dynamic generation and refinement of concept hierarchies for
    
    knowledge discovery in databases. In: Proceedings of the KDD'94, Seattle, WA, 1994, 157-168
    [36] 李涛涛,李世祥,一种数据库数值型字段概念化算法的介绍及讨论,微型电脑应用,1999(15),24-26
    [37] 刘胜军,杨学兵,蔡庆生,关系数据库中概念层次自动提取算法的研究,计算机应用研究,1999(12),15-17
    [38] 陈志,外贸型企业客户关系管理方案,系统建设,2003.1,21-23
    [39] 陈虎,数据库技术——SQL,北方交通大学出版社,2002.1
    [40] 樊金生,邸书灵,PowerBilder8.0实用教程,科学出版社,2003.1
    [41] (美)Claude Seidman,刘艺,王鲁军译,SQL Server 2000数据挖掘技术指南,机械工业出版社,2002.1

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700