基于数据挖掘技术的造林决策研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
扩大造林数量,提高造林质量,是我国林业生产的主要任务,特别是造林质量问题,已成为当前影响我国林业生产成效的主要问题。从技术的角度来看,提高造林质量需要按照适地适树的原则进行树种选择为基础。适地适树就是使造林树种的特性,主要是使生态学特性和造林地的立地条件相适应,以充分发挥生产潜力,达到该立地在当前技术经济条件下可能达到的高产水平。我国在长期的森林资源调查和统计中积累了大量数据,如何从大量的现有森林资源数据中发现造林地的地形、土壤、气候、植被等立地因子和适生树种之间的关系,指导造林决策工作的,已成为影响造林的质量的关键问题。数据挖掘技术作为现代计算机技术的一个重要发展方向,可以从大型数据集中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识过程。本文将数据挖掘技术应用到造林规划设计中,旨在提高造林决策的准确性和自动化水平,得到造林决策知识,为造林决策的研究提供新的理论、方法和技术。
     本文以森林资源二类调查和造林调查数据为基础数据,应用数据挖掘理论和方法,以SPSS Clementine Client软件为工具,对数据挖掘在造林决策中的应用进行了研究分析。
     本文主要完成了以下研究内容:1.结合数据挖掘技术和造林规划设计的具体流程,对造林决策数据挖掘的一般步骤进行了研究与分析;2.在分析了造林决策需求的基础上,研究了具体数据挖掘技术在造林决策中的应用方式;3.通过数据挖掘技术中决策树分类技术对房山区油松人工林的生长与相关立地因子之间的关系进行了分析,进行油松生长适宜性的预测,并对不同数据预处理方式产生的结果进行了比较;4.运用数据挖掘技术中的关联规则技术研究了造林施工作业技术措施之间的联系。
     本研究的主要创新点有以下4个方面:
     1.在造林规划设计中运用数据挖掘技术,结合造林规划设计的具体流程和数据挖掘的技术特点,将造林决策知识分为适地适树知识和造林作业设计知识;
     2.提出了造林决策数据挖掘的一般步骤;
     3.通过数据挖掘中的决策树分类技术,对一定立地条件下树木生长的适宜性进行了预测;
     4.采用关联规则数据挖掘技术对造林作业设计进行了研究,发现造林技术措施之间的联系。
     林业信息化已经进入知识阶段,通过知识进行决策,本研究是数据挖掘技术与造林决策研究的一次有益尝试,通过适地适树知识与造林作业设计知识的发现,为造林规划设计提供了决策支持。
The main task of forestry production is the quantity enlargement of afforestation and imrpovement of its quality. Especially, afforestation quality has become the priority which currently influences the effects of forestry production. Species selection, based on the principle-Matching Tree Species with Site, is the basis of the improvement of afforestation quality from the perspective of technique. The principle-Matching Tree Species with Site means that taking the advantage of different characteristics of tree species, mainly the ecological characteristics, to match the site conditions, in order to reach the as high production as possible under existing economic conditions. Mass data has been accumulated in the longtime forest resources investigation and statistics in China. Therefore, how to find out the relationship between the site factors (eg. Terrain, Soil condition, Climate and Vegetation) and the matching species from these mass data to guide the silviculture decision has become a key, which influences the afforestation quality. As one of the important development directions in modern computer technologies, Data Mining can dig out the knowledege process that is implicit, unknown but useful to decisions from a lot of data.
     In the paper, Data Mining was applicated in the afforestation planning and design. The purpose was to raise the accuracy and automation of silviculture decision, gather the knowledge and provide the new theory , method and technology for silviculture decision.
     Based on the data aquired by the forest resources management survey and afforestation survey, on the method of Data Mining and on the tool of SPSS Clementine Client software, the paper did the research and analysis of the application of Data Mining to silviculture decision.
     The main aspects done in this paper are as followings:
     (1)General steps of Data Mining of silviculture decision were studied and analyzed, combining the specific flow of Data Mining and afforestation planning and design;
     (2)The specific method of Data Mining applied in silviculture decision was studied, based on the analysis of silviculture decision demanding;
     (3)The analysis of the relationship between chinese pine growth and relevant site factors in Fangshan District was done, using Data Mining. Growth suitable of chinese pine was predicted and results generated by different data preprocessing were compared;
     (4)Relationship of afforestation constrction operation technologies were studied by the application of Data Mining Association Rules technology.
     The research innovations are as followings:
     (1)Data Mining was used in afforestation planning and design. Combining the specific flow of afforestation planning and design and features of Data Mining, silviculture decision knowledge was devided in to Matching Tree Species with Site and afforestation design;
     (2)General steps of silviculture decision data mining was proposed;
     (3)The tree growth suitable under certain site condition was predicted according to the Decision Tree Classification technology of Data Mining;
     (4)Data Mining Association Rules technology was studied applied in afforestation design, and relationship between different measures was found out.
     Forestry information has stepped into the knowledge stage, in which decision is made by knowledge. This study was a beneficial attempt of Data Mining and silviculture decision. Decision of afforestation planning and design was provided by the knowledge discovery of Matching Tree Species with Site and afforestation design.
引文
[1]北京市房山区志编纂委员会. 北京市房山区志[M]. 北京: 北京出版社, 1999
    [2]程锡礼, 殷国新. 数据挖掘零售企业提升竞争力的利器[J]. 江苏商论, 2003,(12):25-26
    [3]迟庆云. 决策树分类算法及其应用[J]. 枣庄学院学报, 2005,(22):29-31
    [4]陈文伟, 黄金才, 赵新昱. 数据挖掘技术[M]. 北京: 北京工业大学出版社, 2002
    [5]陈昌鹏, 吴保国. 林业数据仓库的设计[J]. 农业网络信息, 2004,(4):30-32
    [6]陈昌鹏, 吴保国, 贾永刚, 等. 数据挖掘技术在森林资源信息管理中的应用[J]. 河北林果研究, 2004,19(2):149-153
    [7]邓尚民, 韩靖. Clementine 在电子商务环境中的数据挖掘应用[J]. 现代图书情报技术, 2007,(10):62-64
    [8]杜纲, 林义旭, 于泓. 造林方案的优化及其计算机辅助系统[J]. 信息系统工程, 1994,7(1):31-35
    [9]冯仲科, 余新晓. 3S 技术及其应用[M]. 北京: 中国林业出版社, 2000
    [10]冯仲科, 臧淑英, 姚山. 基于广义 3S 技术的森林资源经营管理系统建设[J]. 测绘工程, 2006,15(2):1-6
    [11]冯仲科, 姚山, 刘永霞, 等. 从林业信息数据采集到森林知识获取[J]. 北京林业大学学报, 2007,29(2):1-7
    [12]冯健文, 林璇, 陈启买. 决策树在银行特约商户分析中的应用研究[J]. 计算机工程与设计, 2006,27(24):4723-4728
    [13]福建省林业厅主编. 造林与更新[M]. 福州: 福建科学技术出版社, 1986
    [14]方晓平, 刘爽. 最优化理论与方法在人工造林规划中的应用[J]. 长沙铁道学院学报, 1999,17(3):33-38
    [15]桂现才, 彭宏, 王小华. C4.5 算法在保险客户流失分析中的应用[J]. 计算机工程与应用, 2005,41(17):197-199
    [16]国家林业局. 国家森林资源连续清查技术规定[M]. 北京: 国家林业局森林资源管理司, 2004
    [17]高正红, 沈学利. Apriori 算法在超市决策中的应用[J]. 长春工程学院学报(自然科学版), 2007,8(1):63-66
    [18]巩帅. 交通流量数据的分类规则挖掘[J]. 计算机工程与应用, 2006,(6):219-220
    [19]河北省林业厅. 实用工程造林[M]. 北京: 中国林业出版社, 1990
    [20]胡勇, 胡玲. 基于C4.5算法在水利水电建筑工程专业成绩分析中的应用[J]. 高等建筑教育, 2006,14(5):108-111
    [21]胡林. 基于知识发现技术的林火研究-以北京市房山区为例[D]. 北京: 北京林业大学博士学位论文, 2005
    [22]胡红玲, 张怀清. 退耕还林造林决策支持系统开发[J]. 林业科学, 2004,42(S1):120-126
    [23] 胡 波 , 吴 保 国 , 陆 道 调 . 基 于 ASP.NET 的 造 林 专 家 系 统 [J]. 林 业 调 查 规 划 , 2005,30(1):20-23
    [24]黄月琼, 周元满, 刘素青. 人工神经网络约束模型在造林规划上的应用研究[J]. 江西农业大学学报(自然科学版), 2002,24(3):360-362
    [25]亢新刚. 森林资源经营管理[M]. 北京: 中国林业出版社, 2004
    [26]康志雄, 汪奎宏, 彭华正, 等. 浙江省营林技术决策咨询系统[J]. 浙江林业科技, 2001,21(5):1-5
    [27] 李 福 双 , 邵 秀 杰 , 王 玉 华 , 等 . 适 地 适 树 模 糊 决 策 的 探 讨 [J]. 林 业 科 技 , 1997,22(1):13-15
    [28]Lan H.Witten Eibe Frank 著,董淋等译. 数据挖掘实用机器学习技术(第2 版)[M]. 北京: 机械工业出版社, 2006
    [29]李慧, 余明. 基于决策树模型的湿地信息挖掘与结果分析[J]. 地球信息科学, 2007,9(2):60-64
    [30]龙志勇. 数据挖掘在电信行业客厂关系管理中的应用[J]. 信息网络, 2003,12(2):118-120
    [31]栾丽化, 吉根林. 决策树分类技术研究[J]. 计算机工程, 2004,30(9):94-96
    [32]梁循. 数据挖掘:建模、算法、应用和系统[J]. 计算机技术与发展, 2006,16(1):1-4
    [33]李志聪. 数据挖掘中的分类分析算法及其应用[J]. 哈尔滨师范大学自然科学学报, 2007,23(4):60-62
    [34]罗可, 林睦纲, 郗东妹. 数据挖掘中分类算法综述[J]. 计算机工程, 2005,31(1):3-5
    [35]刘素青, 周元满, 黄月琼. 造林地规划的神经网模型及其生产力预测[J]. 东北林业大学学报, 2004,32(1):58-60
    [36]刘永霞. 北京山地油松林分生长过程数量化模拟研究[D]. 北京: 北京林业大学博士学位论文, 2007
    [37]李芸生, 张康健, 王蓝.计算机工程造林施工设计系统[J]. 西北林学院学报, 1990,5(2):52-57
    [38]罗森林, 成华, 顾毓清, 等. 数据挖掘在 2 型糖尿病数据处理中的应用[J]. 计算机工程与设计, 2004,25(11):1888-1892
    [39]毛国君, 段立娟, 王实, 等. 数据挖掘原理与算法[M]. 北京: 清华大学出版社, 2005
    [40]毛国君. 数据挖掘技术与关联规则挖掘算法研究[D]. 北京: 北京工业大学博士学位论文, 2003
    [41]孟飞翔, 帅立国, 姜昌金. 决策树在客户价值分析中的应用[J]. 计算机技术与发展, 2007,17(4):60-63
    [42] 梅 林 . 数 据 挖 掘 技 术 在 预 测 农 作 物 生 长 过 程 中 的 应 用 研 究 [J]. 甘 肃 科 技 , 2005,21(11):50-52
    [43]宁小斌, 王懿祥, 李思广. 森林资源经营管理技术体系初探[J]. 云南林业科技, 2003,(1):30-33
    [44]潘珩. 决策树技术在汽车销售中的应用研究[J]. 重庆工商大学学报(自然科学版), 2006,23(4):418-423
    [45]乔向杰, 陈功平. 数据挖掘中分类算法的可扩展性研究[J]. 信阳师范学院学报, 2006,(2):239-242
    [46]Richard J Roiger,Michael W Geatz 著, 翁敬农译. 数据挖掘教程[M]. 北京: 清华大学出版社, 2003
    [47]孙时轩. 造林学[M]. 北京: 中国林业出版社,1992
    [48] 苏 平 , 田 立 博 . 适 地 适 树 指 标 量 化 决 策 的 初 步 研 究 [J]. 东 北 林 业 大 学 学 报 ,1998,26(2):82-85
    [49]史忠植. 知识发现[M]. 北京: 清华大学出版社, 2002
    [50]宋晶, 卢理. 基于 Apriori 算法的分类挖掘[J]. 西华大学学报(自然科学版), 2007,26(2):11-14
    [51]沈国舫, 关玉秀, 周沛村.影响北京市西山地区油松人工林生长的立地因子[J]. 北京林学院学报, 1979,1(1):96-104
    [52]邵峰晶, 于忠清. 数据挖掘原理与算法[M]. 北京: 中国水利水电出版社, 2003
    [53]谭伟, 冯仲科 ,胡涌, 等. 基于组件 GIS 的造林决策支持系统的构建研究[J]. 浙江林学院学报, 2005,(1):77-81
    [54]谭伟, 冯仲科, 张雁, 等. 基于组件 GIS 的立地决策支持模型的研究[J]. 林业科学. 2006,42(S1):106-110
    [55]谭伟. 基于组件 GIS 的造林决策支持模型的研究[D]. 北京: 北京林业大学博士学位论文, 2005
    [56] 唐 海 兵 , 秦 怀 青 . 利 用 决 策 树 改 进 基 于 特 征 的 入 侵 检 测 系 统 [J]. 微 机 发 展 , 2005,15(4):102-105
    [57]佟利君, 吴昊, 赫崇帅, 等. 人工林计算机管理系统[J]. 林业科技, 1998,23(2):25-27
    [58]王阗, 佘光辉. 决策树 C4.5 算法在森林资源二类调查中的应用[J]. 南京林业大学学报(自然科学版), 2007,31(3):115-118
    [59]王阗, 彭世揆, 佘光辉. Apriori 算法在森林资源二类调查数据分析中的应用[J]. 南京林业大学学报(自然科学版), 2006,30(3):63-66
    [60]王阗. 信息度优先算法及在森林资源统计分析中的应用[D]. 南京: 南京林业大学博士学位论文, 2007
    [61]王斌会. 数据挖掘技术及其应用现状[J]. 统计决策, 2006,(5):122-123
    [62]王员根, 李爱凤. 关联规则挖掘在学分制教学管理中的应用[J]. 中山大学学报论丛, 2007,2(27):165-167
    [63]王晓国, 黄韶坤, 朱炜, 等.应用 C4.5 算法构造客户分类决策树的方法[J]. 计算机工程, 2003,29(14):89-91
    [64]王萍. 基于数据挖掘技术的消费者行为研究[D]. 吉林: 吉林大学博士学位论文, 2004
    [65]江明华, 何中市. Apriori 算法在篮球比赛常用技术动作挖掘中的应用[J]. 计算机应用, 2007,(27):390-393
    [66]吴达胜, 范雪华, 应志辉.空间数据挖掘技术在森林资源信息管理中的应用研究[J]. 浙江林业科技, 2004,24(3):69-71
    [67]吴达胜, 范雪华, 姜真杰. 分布式数据挖掘在森林资源信息管理中的应用[J]. 福建林学院学报, 2004,24(4):340-343
    [68] 吴保 国, 丁全 龙 , 胡 波. 基 于 Web 的 造 林 专 家咨 询 系 统研 究 [J]. 林 业 科 学 , 2006,42(S1):85-89
    [69]吴永平, 张瑜, 林辉. ViewGIS 在造林设计中的应用[J]. 株洲师范高等专科学校学报, 2007,12(2):51-55
    [70]吴承祯, 洪伟. 用遗传算法改进约束条件下造林规划设计的研究[J]. 林业科学, 1997,33(2):131-141
    [71]吴承祯, 洪伟. 模拟退火法优化约束条件下造林规划设计的研究[J]. 自然资源学报, 2000,15(1):86-90
    [72]吴志文. 论林业信息化对传统林业的改造[J]. 林业经济问题, 2003,23(1):59-62
    [73]吴东国, 谢宝元. 水源保护林造林设计分布式专家系统的实现[J]. 甘肃林业科技, 2004,29(1):54-57
    [74]武丽芬, 严学勇. 基于 Apriori 算法的数据挖掘在电信套餐制定中的应用[J]. 晋中学院学报, 2007,24(3):98-101
    [75]肖秋根, 王成友, 梁华, 等.C4.5 算法在列车轨道故障检测上的应用研究[J]. 计算机技术应用与发展, 2006,16(4):76-78
    [76]徐化成. 油松[M]. 北京: 中国林业出版社, 1990
    [77]徐爱俊, 方陆明, 唐丽华.“数字林业”及其若干关键技术分析与探讨[J]. 内蒙古林业调查设计, 2004,27(4):21-24
    [78]徐巍, 谭德荣, 张业鹏. 决策树在调查数据中的应用[J]. 山东理工大学学报(自然科学版), 2005,19(4):23-26
    [79]徐丽娜, 潘开灵, 张志清, 等.基于关联规则的质量信息挖掘应用研究[J]. 华中师范大学学报(自然科学版), 2007,41(2):186-189
    [80]杨毅, 周汝良, 李靖, 等. 基于 GIS 的营林信息系统的研究与开发[J]. 林业资源管理, 2003,(2):50-53
    [81]杨亮, 周娅. C4.5 改进算法及其在客户价值分析上的应用[J]. 桂林电子工业学院学报, 2005,25(3):52-55
    [82]杨鹏, 陈红跃, 薛立. 适地适树研究进展[J]. 山西林业科技, 2003.9(S1):1-4
    [83]俞新妥, 林思祖. 计算机辅助造林设计系统[J]. 林业科学, 1986,22(4):337-345
    [84]岳小婷. 应用数据挖掘技术促进数字化校园建设[J]. 佳木斯大学学报(自然科学版), 2006,24(4):509-511.
    [85]岳小婷. 数据挖掘工具 CLEMENTINE 应用[J]. 牡丹江大学学报, 2007,16(4):103-105.
    [86]阎明印, 蔡振江, 杨晶, 等. 适于专家系统的机器学习模型与过程[J]. 沈阳工业学院学报, 1997,16(1):59-62
    [87]张晓丽, 游先祥. 应用“3S”技术进行北京市森林立地分类和立地质量评价的研究[J]. 遥感学报, 1998,2(4):292-297
    [88]张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2003
    [89]张家旺, 韩光胜, 张伟. C5.0 算法在 RoboCup 传球训练中的应用研究[J]. 计算机仿真, 2006,23(4):132-134
    [90]张爽, 刘雪华, 靳强. 决策树学习方法应用于生境景观分类[J]. 清华大学学报(自然科学版), 2006,46(9):1564-1567
    [91]张怀清, 王韵晟, 陈永富, 等. 基于空间信息技术的适地适树网络系统研究[J]. 林业科学研究, 2002,(4):380-386
    [92]张昕源. 基于数据挖掘技术的中国上市公司财务危机预警分析[D]. 吉林: 吉林大学博士学位论文, 2004
    [93]张军, 陆守一. 从森林资源数据特点试论现代森林资源信息管理技术[J]. 林业资源管理, 2002,(2):64-68
    [94]张玉东, 赵贵春, 李清林, 等. 关于黑龙江省造林绿化信息系统的研究[J]. 林业科技情报, 2006,38(11):5-6
    [95]赵鹏祥, 李秀信, 李卫忠. 基于 MapGIS 的空间分析在林业中的应用[J]. 西北林学院学报, 2002,17(1):91-93
    [96]赵鹏祥, 王得祥. Maptitude-GIS 在造林规划设计中的应用[J]. 西北林学院学报, 1999,14(4):95-98
    [97]周根贵. 数据仓库与数据挖掘[M]. 浙江: 浙江大学出版社, 2004
    [98]周才英, 吴阔华. 关联规则挖掘技术在决策支持系统中的应用[J]. 江西理工大学学报, 2007,28(4):47-49
    [99] 卓 丽 霞 , 田 佳 . 基 于 C4.5 算 法 的 集 成 方 法 研 究 [J]. 重 庆 工 学 院 学 报 , 2006,20(11):108-110
    [100]章斌. 杉木混交林计算机辅助造林设计系统研究[J]. 华东森林经理, 2003,17(4):1-5
    [101]中华人民共和国林业部. 林业专业调查主要技术规定[M], 北京: 中国林业出版社, 1990
    [102]A Savasere, E Omiecinski, S Navathe. An efficient algorithm for mining association rules in large databases[J]. Proceedings of the 21st International Conference on Very Large Database, 1995,(12):432-443
    [103]Breiman L. Bagging Predicators[J]. Machine Learning, 1996,24(2):123-140
    [104]Benitez J, M Requena I Requena I.Are Artificial Neural Networks Black Boxes[J]. IEEE Transactions on Neural Networks, 1997,8(05):1156-1164
    [105]Chen MS, Yu P S, Yu P S. Data Mining: An Overview from a Database Perspective[J]. IEEE Transactions on Knowledge and Data Engineering, 1996,8(6):866-833
    [106]Chen Lei-da. Data mining methods,applications,tools[J]. Information Systems Management, 2000:17(4):65-70
    [107]C.Glymour, D.Madigan,D. Pregibon. Statistical Themes and Lessons for Data Mining[J]. Data Mining and Knowledge Discovery, 1997:1(1):11–28
    [108]Dietterich T. Machine learning research: four current directions[J]. AI Magazinge, 1997,18(4):97-136
    [109]D J.Hand, H Mannila, P.Smyth. Principles of Data Mining[M]. MIT Press, 2001
    [110]D.J.Hand. Data Mining:Statistics and More ? The American Statistician[J]. 1998,52(2):112–118
    [111]F H Grupc, M M Owrang. database mining[J]. Information Systems Management, 1995,12 (4):26-31
    [112]Fogel DB. System identification through simulated evolution:a machine learning approach to modeling[M]. America:Ginn Press, 1991
    [113]G Piatetsky-Shapiro. Knowledge Discovery in Databases[M]. AAAI/MIT Press, 1991
    [114]I. H. Witten, E. Frank. Data Mining : Practical Machine Learning Tools and Techniques with Java Implementations(Second Edition)[M]. Morgan Kaufmann, 2005
    [115]I.Rohert Groth. Data Mining: Building competitive advantange[M]. USA:Prentiee-Hall Ptr, 1999
    [116]Jiawei Han, Micheline Kamber. Data Mining:Concepts and Techniques[M]. MorganKaufmann Publishers, 2001
    [117]J R Quinlan. C4.5:Programs for Machine Learning[M]. San Francisco:Morgan Kaufmann, 1993.
    [118]Jin R, Agrawal G, Agrawal G. Shared Memory Parallelization of Data Mining Algorithms:Techniques,Programming Interface,and Performance[J]. IEEE Transaction on Knowledge and Data Mining, 2005,7(1):72-73
    [119]J. Han, R. B. Altman, V. Kumar. Emerging scientific applications in data mining[J]. Communications of the ACM, 2002,45(8):54–58
    [120]Kim H C, Pang S, Je H M. Constructing Support Vector Machine Ensemble[J]. Pattern Recognition, 2003,26(7):2757 - 2767
    [121]L Scott Tillett. Banks mine customer data[J]. Internet Week, 2000,831(19):45-46
    [122]Larry Stevens. It sharpens data mining's focus[J]. Internet Week, 2001,872(20):872:29-30
    [123]Mehmed Kantardzie. Data Mining:Concepts,Models,Methods and Algorithms[M]. IEEE Press, 2002。
    [124]M J Norton. Knowledge discovery in databases[J]. Library Trends, 1999:48(1):9-21
    [125]M.-S. Chen, J. Han,P. S. Yu. Data Mining: An Overview from a Database Perspective[J]. IEEE Transactions on Knowledge abd Data Engineering, 1996,8(6):866–883
    [126]Mehta M ,Agrawal R , Rissanen J. SLIQ:A Fast and Scalable Classifier for Data Mining [M]. US:IBM Almaden Research Center, 1996
    [127]Murthy S, Salzberg S, Salzberg S. A system for induction of oblique decesion trees[J]. Journal of Artificial Intelligence Research, 1994,(2):1-32
    [128]N Melab. Data mining:A key contribntion to E-business[J]. Information & Commnnications Technology Law, 2001:10(3):309-318
    [129]Neena Buck. Eureka.Knowledge discovery[J]. Software Magazine, 2001,20(6):24-29
    [130]Okada R. A Method for Personalized Web Searching with Hierarchical Document Clustering[J]. Trans on Information System, 1998,39(39):368-399
    [131]Olivia Parr Rud. Data Mining Cookbook Modeling Data For Marketing ,Risk ,and Customer Relationship Management[M]. US:Wiley, 2001
    [132]P. Smyth, D.Pregibon, C.Faloutsos. Data-driven evolution of data mining algorithms[J]. Communications of the ACM, 2002,45(8):33–37.
    [133]Quinlan J R. Simplifying Decision Trees[J]. International Journal of Marr Machine Studies, 1987,27(3):221-234
    [134]Ruggieri S. Efficient C4 5[J]. IEEE Transactions on Knowledge and Data Engineering, 2001,14(2): 438-444
    [135]R Agrawal, T Imielinski, A Swami. Mining association rules between sets of items in large databases[J]. Proceedings of the ACM SIGMOD Conference on Management of data, 1993,(5):207-216
    [136]R L Scheier. Finding pearls in an ocean of data[J]. Computerworld, 2001:35(30):49-50
    [137]Rastogi R , Shim K. PUBLIC:A Decision Tree Classifier that Integrates Building andPruning[M]. Murray Hill :Bell Laboratorie, 1998.
    [138]R.L.Grossman, C.Kamath, P.Kegelmeyer. Data Mining for Scientific and Engineering Applications[M]. Kluwer Academic Publishers, 2001
    [139]R.L.Grossman, M.F.Hornick, G.Meyer.Data mining standards initiatives[J]. Communications of the ACM, 2002,45(8):59–61
    [140]Schapire R E. The Strength of Weak Learnability[J]. Machine Learning, 1990,5 (2):197-227
    [141]S.Papadimitriou, A.Brockwell, C.Faloutsos. Adaptive, unsupervised stream mining[J]. VLDB Journal, 2004,13(3):222-239
    [142]T.Hastie, R.Tibshirani, J. H. Friedman. The Elements of Statistical Learning:Data Mining, Inference, Prediction[M]. New York:Springer, 2001
    [143]TJEN-SIEN LIM, YU-SHAN SHIH, YU-SHAN SHIH. A Comparison of Prediction Accuracy,Complexity,and Training Time of Thirty-Three Old and New Classification Algorithms[J]. Machine Learning, 2000,(40):203-228
    [144]TayF.E.H, Shen L. A modified Chi2 algorithm for discretization[J]. IEEE Transactionson Knowledge and Data Engineering. 2002,14(3):666-670
    [145]U.M.Fayyad, G.G.Grinstein, A.Wierse. Information Visualization in Data Mining and Knowledge Discovery[M]. Morgan Kaufmann Publishers, San Francisco,CA, 2001.
    [146]V.S.Verykios, E. Bertino, I.N.Fovino. State-of-the-art in privacy preserving data mining[J]. SIGMOD Record, 2004,33(1):50–57
    [147]X.Wu, P.S.Yu, G.Piatetsky-Shapiro. Data Mining: How Research Meets Practical Development[J]. Knowledge and Information Systems, 2003,5(2):248–261
    [148]Y L Chen, C L Hsu and S C Chou. Constructing a multi-valued and multi-labeled decision tree[J] .Expert Systems with Applications, 2003,25(2):199–209
    [149]Zhi-Hua Zhou, Yuan Jiang. Medical diagnosis with C4.5 rule preceded by artificial neural network ensemble[J]. Information Technology in Biomedicine, IEEE Transactions on, 2003,1(1):37-42

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700