面向主题的多Agent搜索系统
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着网络容量的不断增长,信息更新的不断加快,人们想快速地检索到符合自己要求的信息变得越来越困难。信息冗余、主题参杂等问题都影响了人们检索信息的效率。在解决这些问题的过程中,利用面向主题的技术提高信息检索的效率,是人们一直在研究的热点。本论文从面向主题信息检索的角度出发,研究了在信息检索过程中利用本体、知识库以及多Agent等技术来提高人们检索信息的效率。任何信息检索的过程都包含了用户根据自己的主题对信息进行分类的思想,如何满足用户的这种主题性检索才是信息检索亟需解决的问题。除了我们通常利用各种技术、算法来提高搜索引擎的查准率和查全率以外,我们还可以借助许多其他的方法来实现这个目的。本论文就介绍了一种结合了本体、知识库及多Agent技术的面向主题的检索方法。
     本论文的主要工作包括三个方面的内容。
     (1)找出符合用户检索意图的主题。在面向主题检索的过程中,弄清楚什么是主题是首要的问题。本论文中主题的涵义是指从用户角度出发的、对信息具有语义上的鉴别能力的概念。正是出于对语义的理解和利用,我们才考虑借助本体及知识库来解决对主题的描述及划分工作。搜索引擎不但要明白用户的主题,更要能通过一定的学习以达到对主题的“自我识别”。
     (2)把用户的主题有效地收集起来形成知识库。知识库在解决我们的面向主题的信息检索的问题起到了很大的作用。我们依据知识库对一个主题的“定性”来判断如何对用户提供的主题进行适当的“分解”,由多Agent系统来执行分解后的信息检索过程以及检索后的结果整理过程。
     (3)协作式搜索,提高检索的效率。为了更好的利用现有的搜索引擎的搜索能力以及它们对网页的分析能力,我们利用多Agent系统来进行同步检索,对同一个任务进行不同的检索,再去除其中的冗余信息,将这样的结果提供给用户,给用户带来便利。
     本论文中最终是为了实现在手机领域的具有主题性的信息检索。为了实现这样一个过程,我们设计了一个三层结构的搜索模型,分别用来处理用户检索词、主题分析以及协作式搜索。主题分析的工作主要依靠本体知识库来完成。为了构建一个适合本系统的、简单的本体知识库,我们借助网页分类相关技术来确定我们的关键词列表,并以这些关键词为初始原语组织了一个简单的手机本体。多Agent在本论文中的应用只是传统的多Agent系统的一个很小的部分,因为在本论文中我们只是借助利用多Agent系统来实现对一个检索任务的多引擎搜索和结果的无冗余汇总。
As the consistently growing capacity of network and the speeding-up update of information, it’s more and more difficult for people to find out the wanted information quickly. Problems such as redundant information, mixed-up topic and so on affect the searching efficiency. During the process of dealing with the problems, a hot topic is take advantage of the topic oriented technology to improve information searching efficiency. This thesis from the aspect of topic oriented information searching area, studies how to take advantage of self, knowledge base and multi-Agent to improve the efficiency. Whatever information searching, it contains the process of user classifies the information based on his/her topic, thus how to meet the requirement of user’s topic searching is the critical problem of information searching. Besides the normal technology and algorithm which improves the efficiency of search engine’s accuracy and coverage, we can use other methods to approve this objective. This thesis introduces a method combined with self, knowledge base and multi-Agent to search information based on topic.
     Find out the topic which meets the user’s searching purpose. During the process of topic oriented information searching, find out what’s the proper topic is the critical problem. The topic mentioned in this thesis is the concept which from user’s aspect and with the semantic identification capacity of information. It’s just from the semantic understanding, that we consider take advantage of self and knowledge base to describe and classify topic. Search engine should not only understand user’s topic, but also automatically identify the topic through self-study.
     Collect user’s topics effectively and form knowledge base. Knowledge plays an important role when solving problems of topic oriented information searching. We justify a problem according to knowledge, and then separate the problem, and then multi- Agent system will execute and searching the organized result.
     Cooperative search and improve the efficiency of searching. To take better advantage of current search engine’s searching capability and the web analysis capability; we use multi-Agent system to search simultaneously. A task is searched from different aspect, filtered out the redundant information, and the result is convenient for end users.
     The purpose of this thesis is to implement topic oriented information searching on mobile area. To achieve the goal we design a three-tier searching model for user searching word, topic analysis and cooperative search. Topic analysis depends on self knowledge base. To construct a proper and simple knowledge base suitable for this system, we us web classification related technology to set up a list of key words, and use these key words to form a simple mobile self. Multi-Agent used in this thesis is a small part of traditional one, because we just use it to implement a multi-Agent search engine for searching tasks and a summary without redundant information.
引文
[1] http://www.pconline.com.cn/news/nw/0704/993503.html
    [2]苗长芬,冯伟华.面向主题Crawler的设计与实现,平原大学学报,2005.6,Vol.22,No.3,110-112
    [3]潘春华,武港山.面向主题的网页信息收集系统的设计与实现[J],小型微型计算机系统,2003(12)2150-2154
    [4]姜合,王小柱,董祥军.一种面向主题的智能查询方法,计算机应用与软件,2004.8,Vol.21 No.8,38-40
    [5] Krishna B,Monika R H. Improved algorithms for topic distillation in a hyperlinked environment[A],Proc of ACM SIGIR’98 Conf on Research and Development in Information Retrieval [C].Melbourne:SIGIR ,1998. 221—229.
    [6]余晨,顾毓清.面向主题的WWW信息挖掘系统,计算机科学,2003Vol.30-No.2,158-160
    [7]聂哲.基于网页的面向主题搜索引擎的设计与实现[J],计算机工程与设计,2003 Vol24 No.2,60-62
    [8]郎小伟,王申康.基于Lucene的全文检索系统研究与开发,计算机工程,2006.2,Vol.32 No.4,94-97
    [9]王继成,邹涛,杨小江等.基于Internet的信息资源发现技术与实现,计算机研究与发展,Vol. 36,No. 11,Nov. 1999,1369-1374
    [10]罗彬,周俊.基于语义We b的知识库系统模型实验研究,图书馆学研究,2007.6,39-44
    [11] Bing Liu,Chee Wee Chin,Hwee Tou Ng.Mining Topic-Specific Concepts and Definitions on the Web,WWW 2003, May 20-24, 2003
    [12]陈江平,李平湘.一种面向主题的基于多层次空间概念关系的关联规则挖掘算法,遥感学报,2006.5,Vol.10 No.3,289-293
    [13]郭勇.基于语义的Web文本分析技术,计算机工程,2007.6,Vol.33 No.11,190-192
    [14]王世进,周炳海,陶丽华,奚立峰.Agent通信语言综述,计算机工程与应用,2005.2,32-38
    [15]李小将,刘争元,樊天晴.基于用户兴趣的Web信息检索智能代理,指挥技术学院学报,Vol. 11,No. 5, Oct. 2000,79-84
    [16]王旭.互联网发展史,个人电脑,2007.3,183-189
    [17]毛新军,赵建民,王怀民.多agent系统的抽象合作模型,计算机研究与发展,2004. Vo1.41 No.5 787-795
    [18]汤晓松,胡桂武,张欣.浅谈面向主题的搜索引擎,保险职业学院学报,2005,Vol.2,45-48
    [19]张力平.英国电信的21CN,现代通信,2005.3,64
    [20] Georg Gottlob,Christoph Koch.Logic-based Web Information Extraction,Department of Computer Science
    [21]Desmond J. Higham.Google PageRank as mean playing time for pinball on the reverse web,Applied Mathematics Letters 18 (2005) 1359–1362
    [22]中国互联网络发展状况统计报告,2007.1
    [23]中国互联网络发展状况统计报告,2007.7
    [24]中国互联网络发展状况统计报告,2008.1
    [25]黄意珊,王潜平.基于知识库的启发式智能搜索引擎的设计,计算机工程与设计,2007.5,Vol.28 No.9,2134-2137
    [26]刘洁清,吴京慧.面向主题的个人实时搜索引擎的设计与实现,现代图书情报技术,2006,Vol.15,40-43
    [27] Hersovici M ,Jacovi M ,Marek Y, et. The shark-search algorithm—an application:tailored Web site mapping[J].Computer Networks and ISDN System ,1998,3O:102—118
    [28]王津涛,兰皓.面向主题元搜索引擎的设计与实现,计算机工程,2005.4,Vol.31,No.7,168-170
    [29]周浦城,洪炳镕等.基于多Agent的并行Q-学习算法[J],小型微型计算机系统,2006 Vol27 -No.9, 1704-1707
    [30]王伟平,王斌,陈松乔,陈建二.网页智能搜索多Agent系统结构及相关技术[J],计算机工程,2002.3, Vol 28 No.3, 38-40
    [31]李富萍,曾建潮.基于多Agent的搜索引擎设计研究,计算机应用,2004.12,Vol.24,203-205
    [32]韩婕,向阳.本体构建研究综述,计算机应用与软件, 2007.9,Vol.24 No.9,21-23
    [33]王建一,刘礴.基于本体的源代码重构知识库,解放军理工大学学报,2007.2,Vol.8 No.1,34-38
    [34]袁新娣,邱桃荣,徐新爱.基于本体的教学领域知识库建模研究,计算机工程与设计,2007.7,Vol.28 No.13,3277-3279
    [35]罗晨光,山川,王珊.基于本体的古籍知识库建设初探,现代图书情报技,
    [36]罗燕琪,陈雷霆.专家系统中知识表示法研究,电子计算机,2001,151(8):28-31
    [37]王巍,贺建军.基于数据库技术的气流干燥专家系统知识库的建立,自动化与仪表,2007.3,9-12
    [38]徐洁磐,马玉书,范明.知识库系统导论,科学出版社
    [39]闫洪森,张野等.基于本体的知识库的构建方法,情报科学,2007.9.Vol 25 No. 9
    [40]宋聚平,王永成,尹中航等.面向主题的网页搜索系统,上海交通大学学报,2003.3,Vol.37 No.3,401-403
    [41] SHEN Jie,SUN Rong-shuang,et.Topic-Oriented Search Model Based on Multi-Agent,International Conference on Computational Intelligence and Security,2007.12:276-280
    [42]袁磊,张浩等.基于本体化知识模型的知识库构建模式研究[J],计算机工程与应用,2006.30,65-68
    [43]刘贵全,陈小平等.一个基于Agent的协作式学习系统[J],中国科学技术大学学报,2000(2)113-118
    [44] Jettrfings N R.Controlling cooperative problem solving in industrial multi-agent systems using joint intentions[J],Artif InteH ,1995,75:195—24。
    [45]李树青.基于面向主题和面向分类相结合的搜索引擎,情报杂志,2005,Vol.10,69-72
    [46] Chiasen Chung,Charles L.A. Clarke.Topic-Oriented Collaborative Crawling[C], CIKM’02, November 4–9, 2002
    [47] Holger Bast,Ingmar Weber.Type Less, Find More:Fast Autocompletion Search with a Succinct Index,SIGIR’06, August 6–11, 2006,
    [48]刘彦保,王文发,王文东.基于聚类分析策略的Web文本挖掘方法,延安大学学报:自然科学版,2007,Vol.26 No.4,22-25
    [49]马巍,孔繁胜,阎薇.检索词上下文相关提问扩展算法,大连铁道学院学报,2004.12,Vol.25 No.4,63-67
    [50]董丕彦,马巍.检索词模糊聚类基础上的上下文相关提问扩展算法,情报科学,2004.8,Vol.22 No.8,967-970
    [51]于江德,樊孝忠,汪涛,顾益军.本体论在Web信息检索中的应用,微电子学与计算机,2006,Vol.23 No.4,160-162
    [52]王弼佐,王茜,李鹏.基于Ontology的多主体知识检索模型,情报杂志,2006,No.6,76-78
    [53]吴淑雷,桂占吉,邢海花.基于OWL的试题本体知识库构建研究,海南师范大学学报(自然科学版),2007.6,Vol.20,No.8,129-132
    [54]冯桂尔.基于本体的教育资源探究,电脑知识与技术:学术交流,2007,Vol.3, 1425-1426,1448
    [55]徐丽平,姜利群,赵亮.基于本体的知识管理系统研究,电脑应用技术,2007,No.69,1-4
    [56]袁方,王涛.基于本体的推理机研究,计算机工程与应用,2006.09,158-161
    [57]邵坚,刘宗田,蔡智明,孙智勇.基于Web的多Agent协作搜索构架研究,小型微型计算机系统,2001.3,Vol.22 No.3,363-365
    [58] Thomas Russ,Andre Valente,Robert MacGregor,William Swartout.Practical Experiences in Trading Off Ontology Usability and Reusability,Information Sciences Institute
    [59]余以胜,张玉峰.基于本体论的知识库系统研究,情报杂志,2003.7,No.7,
    [60] F Baader,I Horrocks,U. Saltier.Description Logics as Ontology Languages for the Semantic Web[C]。Festschrift in Honor of Jorg Siekmann,Lecture Notes in Artificial Intelligence,Springer-Verlag,2003。
    [61]吴强,刘宗田,强宇.基于本体的知识库推理研究,计算机应用研究,2005
    [62]张鼐.本体在语义Web中的应用研究,情报科学,2007.8,Vol.25 No.8,1241-1244
    [63] Xu Jin—xi.Solving the Word Mismatch Problem Through Automatic Text Analysis.Computer and Information Science Department,University of Massachusetts.Amherst. U.S.A.May1997[EB/OL].
    [64] Kone M T,A Shimazu A.T Nakajima. The state of the art in agent communication language es.Knowledge and Information Systems,2000;2:259~284
    [65]魏晓斌,周盛宗.Agent通信机制探讨,计算机工程与应用,2002,Vol.38 No.5,66-70
    [66]李薇,张凤鸣.多Agent技术研究与应用,微计算机信息,2006,Vol.22 No.8-3,293-295
    [67]王伟平,王斌,陈松乔,陈建二.Web智能搜索多Agent系统结构及相关技术,计算机工程,2002.3,Vol.28 No.3,38-40
    [68]蔡建超,郭一平,王亮.基于Lucene.Net校园网搜索引擎的设计与实现,计算机技术与发展,2006.11,Vo1.16 No.11,73-76

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700