Web信息获取技术研究与实现
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
WWW已经发展为拥有近一亿用户和大约400万站点,3亿页面的巨大分
    布式信息空间,且其信息量仍以指数形式在飞速增长。但由于它上面的信息具
    有开放性、动态性和异构性使得人们很难快速地从WWW上获得所需信息。搜
    索引擎的出现使人们从大量信息资源的集合中找到与给定查询请求相关的、数
    目恰当的资源子集成为可能。本论文的主要工作是对搜索引擎技术进行研究并
    对中文搜索引擎加以设计和实现。
     本文首先对搜索引擎的发展现状进行了介绍,对搜索引擎的工作原理及关
    键技术进行了分析,然后说明了中文搜索引擎的设计与实现并介绍了实现中用
    到的相关技术。
     本文的主体是使用Java语言和多线程技术对搜索引擎进行设计与实现,在
    实现网页数据库时采用了JDBC技术,同时对中文信息处理也进行了一定的研
    究。
     本文最后总结了完成的工作,以及日后可以改进和完善的地方。
WWW has developed into a gigantic distributed cyberspace, having
     almost a hundred million users and nearly 4000 thousand sites, with three
     hundred million webpages. And at the same time, the information is
     increasing rapidly in exponential rate. But due to its attributes of
     openness, dynamic and inhomogeneousness, it is difficult to get the
     specific information from the net quickly. It is Search Enging that makes
     it possible to find the pretty number of resource subsets related to the
     given query. The main work of this thesis is to study the Search Engine
     Technique and to design and implement one search engine for Chinese.
     In this thesis, the present situation of search engine is
     introduced firstly. And then, the working theory and key techniques are
     analyzed. In the end, the design and implementation of search engine
     together with the pertinent technology are explained.
     Java language and multi-hread technique are used to plan and
     develop the search engine. JDBC technique is adopted in accessing the
     webpages database. Moreover, the research of manipulating Chinese
     information is carried out in this thesis.
     In conclusion, the work having been done and being to be perfected
     are put forward.
引文
1. Philip Heller Simon Roberts著,邱仲越 等译 JAVA高级开发指南 电 子工业出版社
    2. Jeffrey Richter 著 郑全战等译 Windows高级编程技术 清华大学出版社
    3. Andrew S.Tanenbaum 著 熊桂喜等译 计算机网络(第三版)清华 大学出版社
    4. 李新明 李艺 多现成技术 小型微型计算机系统 1998,2
    5. 骆斌 费翔林 多现成技术的研究与应用 计算机研究与发展2000,4
    6. Ashton Hobbs著 丁一青 吴静译 JDBC数据库编程 清华大学出版社
    7. 严威 赵政 开发中文搜索引擎汉语处理的关键技术 计算机工程 1999,6
    8. 皱海山 吴勇 中文搜索引擎中的中文信息处理技术 计算机应用 2000,12
    9. 张晓辉 邵华等 WWW上的信息发现与搜索引擎技术 小型微型计算机系 统 1998,19
    10. 罗东川 Java语言与DataBase之间的接口----JDBC 计算机系统应用 1998,3
    11. 刘江 应用JDBC进行数据库编程 计算机系统应用 1998,10
    12. 刘甫迎 等著 数据库原理及应用 (ORACLE) 重庆大学出版社
    13. 陈智明 等著 ORACLE数据库应用基础 电子工业出版社

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700