搜索引擎现状与发展研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
搜索引擎是WWW上出现最早的网络二次信息组织工具,也是WWW上最有效的信息检索工具。搜索引擎经历了近十年的发展,它一方面极大地改善了人们在网络上进行信息搜索的手段,另一方面由于种种原因在信息收录完备性、检全率、检准率、检索功能和用户检索界面等方面还存在许多不足之处。
     本文首先回顾了搜索引擎的发展历程,说明了搜索引擎的基本工作原理、类型与功能。在我们建立的搜索引擎评价指标体系基础上,对搜索引擎进行重新评价。得出搜索引擎现存的最主要问题是:信息完备性差、检准率不高、检索界面不够友好。
     本文集中解决如何提高搜索引擎信息收录完备性与。改善搜索引擎检索功能这两个问题。综合运用协作式搜索和分布式检索,通过移动Agents技术来实现搜索引擎之间的信息共享。针对当前搜索引擎将关键词检索和分类主题检索分离的缺陷,借鉴关键词检索、概念词检索和分类主题检索一体化的思想,阐述了一体化的实现对于提高搜索引擎检准率和检全率以及改善检索界面友好性的作用与意义。
The study revolves around the search engine, which is the earliest and the most efficient tool for information organization and retrieval on the Internet. The methods of searching information on the Internet world have been improved greatly by search engine. However, for some reasons, search engine does not collect information perfectly, and provides unsatisfied recall ratio, precision ratio, retrieval function and the interface.
    The article looks back on the course of the development of search engine, and illustrates the way by which search engine works, and explains its categories and functions. The article studies the traditional evaluation system, including coverage, recall ratio, precision ratio, response time, and the friendship of the interface.
    Then, it explains the major difference happened to the search engine on the Internet. On the base of the new principles, the article evaluates the search engine again,, and makes the conclusion that the major problems of the present search engines are poor coverage, low precision ratio, and relatively unfriendly interface.
    We focus on how to better the coverage and how to improve the functions of search engine. We suggest that search engine should comprehensively use the collaborative search robots and the distributive retrieval system to make the information shared. In order to remove the defects of the retrieval function of the present search engine, the paper make use of the idea that the keyword retrieval, the subject retrieval and the classification retrieval should be integrated, and expounds the importance of the idea to improve the recall ratio, the precision ratio and the friendship of the interface of search engine.
引文
引言
    [1] 顾俊峰.基于移动Agent的信息搜索技术,上海交通大学博士学位论文,2001.6,P2-5。
    1 搜索引擎的发展现状
    [1].符绍宏等.因特网信息资源检索与利用,北京:清华大学出版社,2000.6,P27.
    [2].储荷婷等.Internet网络信息检索:原理 工具 技巧,北京:清华大学出版社,1999.10,P14-17.
    [3].徐亚先.搜索引擎功能概述与研究热点,情报科学,2001 No.3,Vol.19,P269.
    [4].蔡栋.第二代搜索引擎模式探析,情报理论与实践,2001 No.3,Vol.24,P223,P223-225。
    [5].姜恩波.搜索引擎的信息过滤技术,现代图书情报技术,2001 NO.3,P33。
    [6].宋学清,张中秋.信息组织导论,北京:中国致公出版社,2001.4,P242。
    [7].搜索在线.搜索引擎的技术发展历程,2002年3月29日11:25,http://city.sohu.com/35/08/news148310835.shtml.
    [8].张建刚.因特网环境下的信息组织与检索技术,北京大学硕士学位论文,1998.6,P4-5。
    [9].王斌.垂直门户及垂直门户信息服务模式可行性研究,图书情报工作,2001.No.1,P27,48-49。
    [10].李广建等.元搜索引擎及其主要技术,情报科学,2002 No.2,Vol.21,P175-179。
    [11].杨桂珍.多元搜索引擎,情报理论与实践,2001 No.4,Vol.24,P308。
    
    
    相关网站:
    1. http://www. google. com/
    2. http://www. hotlinks. com/
    3. http://www. ask. com
    4. http://www. invisibleweb. com/
    5. http://cn. yahoo. com/
    18. http://dir. sohu. com/
    2 搜索引擎的工作原理、类型与功能
    [1].宋聚平,王永成.搜索引擎中信息存储结构的改进,情报科学,2001 No.5,Vol.20,P514-518.
    [2].顾俊峰.基于移动Agent的信息搜索技术,上海交通大学博士学位论文,2001.6,P15-16,19。
    [3].潘有能.一个自动分词分类系统的实现,情报科学,2002 No,1,Vol.21,P38-41。
    [4].储荷婷等.Internet网络信息检索:原理 工具 技巧,北京:清华大学出版杜,1999.10,P17-19。
    [5].搜索引擎9238.关于搜索引擎的统计数字,2002.1,http://www. search-chinese. com/9238/meiri/7.htm
    [6]. http://www. compass. edu. cn/
    [7]. http://city. sohu. com/
    3 搜索引擎的评价和主要问题
    [1].赖茂生等编著.计算机情报检索,北京:北京大学出版社,1993.3,P260-265。
    [2].徐建华等.国外六个著名搜索引擎的特征和评价,现代图书情报技术,2001.No.1,P49。
    [3].搜索引擎9238。关于搜索引擎的统计数字,2002.1,http://www. search-chinese. com/9238/meiri/7. htm
    [4].韩圣龙.网络信息检索工具评价指标,2001 Vol.20 No. 4, P472-474.
    
    
    [5]. H. Vernon Leighton and Jaideep Srivastava. Precision among World Wide Web Search Services (Search Engines)'Alta Vista, Excite, Hotbot, Infoseek, Lycos. http://www. winona, msus. edu/library/webind2/webind2,.htm
    [6].段宇峰,王雯.检索引擎的评价和利用,现代图书情报技术,Vol.73,1999 No.3,P28-30。
    [7].徐建华.网络搜索引擎原理、特性分析及未来发展趋势,图书情报工作,2000 No.8,P37.
    4 搜索引擎的变革与发展
    [1].卢增祥.网络信息查询中的若干问题研究,清华大学博士学位论文,1999.5,P6-8,P73-75.
    [2].李广建等.元搜索引擎及其主要技术,情报科学,2002 Vol.20 No.2,P176-178.
    [3].谷斌.基于Web数据库技术的动态网页发布,情报科学,2002 Vol.20 No.3,P320-323。
    [4].周文荣.网上数据库检索,情报科学,2001 Vol.19 No.8,P867-869.
    [5].谢芦青.Web期刊库CGI程序访问,情报理论与实践,2001 Vol.24 No.1,P62,73-74.
    [6].姜恩波.搜索引擎的信息过滤技术,现代图书情报技术,2001 No.3,P33-35。
    [7].梅海燕.信息过滤问题的研究,现代图书情报技术,2002 No.2,P33-35。
    [8].王继成.基于元数据的Web信息检索技术研究,南京大学博士学位论文,2000.5。
    [9].王晔等.基于元数据的Web信息检索研究,情报学报,2001 Vol.20 No.3,P309-316。
    [10].徐建华等.国外六个著名搜索引擎的特征和评析,现代图书情报技术,2001 No.1,P48-51。
    
    
    [11].任瑞娟.中文WWW搜索引擎比较研究,大学图书馆学报,1999 No.5,P55-61。
    [12].韩圣龙.网络信息检索工具评价实验:中、英文搜索引擎检索评价实验,情报科学,2001 Vol.19 No.4,P430-434.
    [13].李创业等.全文检索中零输出和过量输出的分析与改进,情报理论与实践,2001 Vol.23 No.1,P10-11.
    [14].贾君枝.论网络环境下面向用户的信息检索模式,情报理论与实践,2000 Vol.23 No.2,P129-131。
    [15].陶跃华,孙茂松.搜索引擎中相关性反馈技术,情报理论与实践,2001 Vol.24 No.4,P295-297.
    [16].黄敏.自然语言处理与信息检索,人大报刊复印资料,2001 No.7,P11-14
    [17].周炯亮等.网上机器翻译及其发展新趋势,情报学报,2001 Vol.20 No.2,P207-211.
    [18].黄昆,符绍宏.自动分词技术及其在信息检索中的应用的研究,现代图书情报技术,2001 Vol.87 No.3,P26-27.
    [19].董慧等.网络信息资源开发与利用,武汉:武汉大学出版社,2001.8,P334-339,P343。
    [20].严亚兰.因特网多媒体信息检索探析,图书情报工作,2001 No.6,P40-42。
    21.黄晓倩.多媒体信息检索中的关键技术,图书情报工作,2001 No.10,P52-55.
    [22].徐建华.一种新型的多媒体检索技术:基于内容的检索,情报学报,2000 Vol.19 No.4,P411-416.
    [23].陈立娜.因特网上的图像搜索引擎,情报理论与实践,2001 Vol.24 No.4,P301-304。
    [24].顾俊峰.基于Agent的信息搜索技术,上海交通大学博士学位论文,2000.5,P35-36,31-32。
    [25].潘谦红.分布式信息检索的研究与应用,中国科学院博士学位论文,1999.5,P46-47。
    
    
    [26].张琪玉.关键词检索、概念检索与分类浏览检索一体化,《网络信息检索工具发展的方向与提高竞争力的途径》,深圳巨灵信息技术研究所2001年4月刊印[PLM65-68].

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700