专利信息检索系统的推送与数据挖掘应用研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文研究专利信息检索系统的推送与数据挖掘的应用问题,目的是在当今网络信息资源迅速膨胀的情况下,改变用户传统的通过主动搜索来获取信息的方式,主动向其推送需要的信息,从而提高用户获取信息的效率与准确性;通过数据挖掘算法的应用,结合企业需求提供智能分析服务。
     本文首先介绍了专利信息、推送技术和数据挖掘的概念、研究现状;接着描述了信息推送的特征、工作流程、发展方向等等,以及数据挖掘的功能分类;然后通过介绍与推送有关的高级检索功能,给出了系统推送功能的设计与实现;最后通过数据挖掘算法在系统中作一些应用,主要包括:购物篮分析、用户流失分析、用户价值度分析,以及一些核心算法的实现,包括:Apriori关联规则算法和ID3分类算法。结合用户流失分析,深入分析探讨了ID3算法,构造出决策树,给出了实验结果,最后对本文的工作做了总结,并提出今后需要进一步研究和改进的方向。
This paper researches on information push in a patent information service system. Its purpose is to change the traditional manner of capturing information by users active searching in nowadays situation of network resource speedy expanding. It provides information to the users by data mining algorithm. As a result, the efficiency and accuracy of catching information will be increased.
     The paper begins with the concept of patent, push and data mining, it describes push’s features, workflow etc. Then it described the design and realization of information push in the patent information service system and higher search. At last, using data mining algorithm to do some application, including: shopping carts analysis, user loss analysis, users’value degrees analysis, and the realization of some core algorithms. At the last part of paper is the conclusion of this design and future works.
引文
[1] http://www.patent.com.cn/ 中国专利信息网
    [2] http://www.cnpat.com.cn/ 中国专利信息中心
    [3] 王培凤.Push 技术与图书馆信息推送服务[J].科技情报开发与经济,2005,15(10):1.
    [4] Martin-Flatin J P. push vs. Pull in Web-based Network Management [J], Proc, 6th IFIP/IEEE international Symposium on integrated Network Management(IM'99). 1999:3-18.
    [5] 赵志荣.个性化搜索引擎的研究、设计与实现[D].四川大学,2002.
    [6] 黄彦.基于高校人力资源的数据挖掘技术研究[D].天津大学,2004.
    [7] Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].机械工业出版社,2001.8:1-78.
    [8] 崔倩.图书馆个性化信息服务及应用[J].图书馆学刊,2005,5:1.
    [9] 曾维宏,陈铁军,孟丽等.基于 push 技术的主动信息服务系统设计与实现[J].计算机工程与设计,2005, 26(11):2.
    [10] 李期位,王文生,周振亚.基于 RSS 的农业信息智能推送技术的研究与实现[J].农业网络信息,2006,4:1.
    [11] 叶新英 , 曹玲 .RSS 技术及其应用探析 [J]. 科技情报开发与经济,2005,15(21):1.
    [12] 庞海涛.RSS 技术及其在新闻发布网站的应用[J].武汉理工大学.
    [13] 杨汉妮.基于网络环境的 RSS 信息推送服务[J].武汉理工大学图书馆.
    [14] 彭路,胡越明.Push 技术及其在 Internet 上的应用[J]. 计算机应用研究,1999, 9.
    [15] 史忠植.知识发现.清华大学出版社[M],2002.
    [16] 蔡伟杰,张晓辉,朱建秋.关联规则挖掘综述.计算机工程[J],2001.
    [17] Alex Berson,Stephen Smith, Kurt Thearling(贺奇、郑岩、魏藜等译).构建面向 CRM 的数据挖掘应用[M].人民邮电出版社,2001.
    [18] 杜孝平,马秀莉,唐世渭,牧之内,显文.快速关联规则挖掘算法[J].计算机工程与应用.2002,11.
    [19] 王清毅,张波,蔡庆生.目前数据挖掘算法的评价[J].小型微型计算机系统,2000,1.
    [20] 田金兰,李奔.用决策树方法挖掘保险业务数据中的投资风险规则[J].小型微型计算机系统,2000,5.
    [21] 陆丽娜,陈亚萍,魏恒义,杨麦顺.挖掘关联规则中 Apriori 算法的研究[J].小型微型计算机系统.2000,4.
    [22] 铁 治 欣 , 陈 奇 , 俞 瑞 钊 . 关 联 规 则 采 掘 综 述 [J]. 计 算 机 应 用 研究,2000,2(3).
    [23] 吴剑霞.信息推送技术的原理及在图书馆的应用[J].科技情报开发与经济,2004, 14(3).
    [24] 马明霞,朱秀平,陈存业.智能信息推拉(IIPP)技术在图书馆信息服务中的应用[J].现代情报,2005, 6.
    [25] 吴艳,刘建波.电子邮件自动处理的用户模型设计[J].沈阳化工学院学报,2005,19(4) :289-291.
    [26] 邵兵家,于同奎等.客户关系管理:理论与实践[M].清华大学出版社,2005.
    [27] CHEN Ming syan. Data mining: An overview from a database perspectives[J].IEEE Transaction On Knowledge and Data Engineering, 1996, 8(6):866-883.
    [28] 林天峰,王咏.Oracle 程序设计[M].科技出版社,2003.
    [29] Michael Abbey, Michael J. Corey, lan Abramson. Oracle8i 初学者指南[M].机械工业出版社,2002.
    [30] Bruce Eckel 著,候捷译.Java 编程思想(第 2 版)[M].机械工业出版社,2002.
    [31] 严寒冰等.电信业 CRM 中客户挽留流程分析与实践[J].重庆大学,2006.
    [32] 吴桐水,贺亮.基于决策树的航空公司客户流失分析[J].商场现代化,2006,488.
    [33] 叶进,张向利,张润莲.基于数据挖掘的移动客户流失分析系统[J].计算机应用,2005,2.
    [34] 王红,李晓晖,基于数据挖掘的航空公司客户信息分析[J].计算机工程,2005,31.
    [35] 扶东,李兵,薛劲松,朱云龙,赖翔宇.CRM 中客户关系分析评价方法研究[J].中国科学院沈阳自动化研究所,2003.
    [36] 魏沁华.基于数据挖掘的电力客户利润贡献度分析[J].电力需求侧管理,2006,8(2).
    [37] 盛昭瀚,柳炳祥.客户流失危机分析的决策树方法[J].管理科学学报,2005,8(2).
    [38] 徐远纯,盛昭瀚,柳炳祥.一种基于决策树的客户流失危机分析方法[J].计算机与现代化,2004,8.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700