网络信息组织中主题组织法性能优化研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
新的网络信息环境不仅为信息的存取和获取提供了新的渠道,也在很大程度上改变着人们信息存取的思维与方式。在网络信息环境中,人们面临着网上数字化信息的急剧增加与用户对信息的特定需求之间的矛盾,信息组织的任务异常艰巨。将知识组织和情报检索语言的思想及原理运用到网络环境中,能使网络信息组织和检索的效率大大提高。主题组织法历来是检索语言的重要组成部分之一,应用前景十分广阔,尤其是在网络信息组织和检索领域,这与其固有的性能优势是分不开的。然而,在主题组织法的概念、类型和应用模式等发生改变的同时,其性能也在随之而改变。性能上固有的优势和积极的调整是主题组织法在网络环境下生命力不断进发的真正原因,它决定了主题组织法的不可替代性。同时,性能上的不足和缺陷更是主题组织法寻求突破的关键,找出其性能改进的切入点,对主题组织法的未来发展具有深远的意义。
     本文从网络环境下主题组织法的应用现状入手,较系统、深入地探讨了网络环境对主题组织法性能的影响及主题组织法性能的发展,在进行了一系列主题组织法性能测度实验的基础上,总结了目前主题组织法性能上存在的优势和不足,并结合考察实践对当前网络信息环境下主题组织法的性能优化措施提出了实施原则及应当注意的问题。
     全文共分为5个部分:
     1.网络信息组织概述。网络信息资源数量急剧增加,信息组织的重要性越来越突出。然而网络环境下的信息组织已经超出了传统的非网络信息资源管理方式的覆盖范围,传统的文献组织理论和方法面临着挑战。将主题组织法运用到网络信息组织当中来,是知识组织和情报检索语言的思想及原理移植到网络环境下的成果之一。
     2.网络信息组织中主题组织法发展现状。在网络信息组织中,对主题组织法理论和实践的发展而言,机遇与挑战并存。主题组织法在网络信息组织中的发展现状主要表现在以下两方面:首先,传统主题法的标题法、叙词法和关键词仍然在网络信息组织中发挥作用,其性能也大为提高;其次,主题组织法在网络环境下又有新突破,例如:检索语言一体化原理广泛使用,词表技术不断发展且类型趋向多样化。
     3.网络环境下主题组织法性能研究。通过对比传统情报检索语言的基本性能、传统主题组织法的性能等,分析了在概念、类型和应用模式等发生改变的情况下,网络信息主题组织法性能的所受到的影响及其变化。
     4.网络信息主题组织法性能测评实验。通过一系列的检索实验和实际上网考察,分别对网络信息组织中的搜索引擎的关键词组织法、网络联机受控词表、网络数据库中的主题组织法和一体化医学语言系统的性能进行了测度,总结了各自的性能优势和存在的不足。
     5.网络信息主题组织法性能优化的措施、原则及应当注意的问题。在考察主题组织法网络信息检索性能的基础上,总结了多种性能优化措施。结合实际检索及操作的实践,提出了主题组织法性能优化的原则。最后提出了主题组织法性能优化过程中应当注意的一些问题。
The new network information environment has not only offered the new channel for access and obtaining of information, also changes the thoughts and way that people's information organization and retrieval to a great extent. In the network information environment, people are faced with the conflict between rapid increase of online digitized information and the users' specific demands for information, so the task of the information organization is unusually arduous. The application of the thought and principle of knowledge organization and information retrieval language in the network environment can make the efficiency of network information organization and retrieval improved greatly. Because the subject language has always been one of the important components of information retrieval language, its prospect is to be very wide, especially in the network information organization and retrieval, and this can not go without its inherent performance advantage. However, while the concept, type and mode of using of
    subject organization technique changed, its performance has been changing with it too. The inherent advantage and positive adjustment on performance are true reasons of subject organization technique's constantly progress, and it has also determined the unsubstitutability of the subject organization technique. Meanwhile, deficiency and defect of performance is the breakthrough point of subject organization technique too. Find out these breakthrough points of its performance, far-reaching for future development of the subject organization technique.
    This paper is started with current application, situation of the subject organization technique in the new network information environment, and has discussed the impact of network environment on performance of subject organization technique and the development of subject organization technique's performance relatively systematically and deeply. Based on a series of performance evaluation experiment, it has also summarized advantage and deficiency existing on the performance of subject organization technique. Combined with the practice of investigation, the paper has put forward some optimize measures, principles and questions that should be noticed under the present network information environment.
    The paper is divided into 5 parts altogether:
    1.Summary of information organization of the network
    The quantity of information resources in the network increases sharply, and the importance of the information organization is more and more outstanding. But network information organization has gone beyond the scope of management style of nontraditional network information resources already, so traditional documentation organization theories and methods are faced with challenges. The application of subject organization technique in the network information organization is one of the achievements of the transplant of knowledge organization and information retrieval language thoughts and principles to network environment.
    2-Current situation of the development of subject organization technique in the network information organization
    In the network information organization, as to the development of subject organization technique's theory and practice, the opportunities and challenges coexist. The current situation of the development of subject organization technique in the network information organization displays in two following respects mainly: First of all, traditional subject headings, thesaurus and
    
    
    keywords yet work in the network information organization, and their performance is greatly improved too; Secondly, there are some new break-throughs under the network environment in the subject organization technique, for example: extensively use of integrative retrieval language principle, constant development and type diversification of word lists etc.
    3. Study of subject organization technique in the network environment
    In this part, it has also analyzed the influences and changes that subject organization technique performance has received in the network environment
引文
1.马张华.信息组织.北京:清华大学出版社,2001
    2.毕强,杨文祥.网络信息资源开发与利用.北京:科学出版社,2002
    3.张琪玉.情报语言学基础.武汉:武汉大学出版社,1997
    4.储荷婷,张晓林.Internet网络信息检索——原理工具技巧.北京:清华大学出版社,1999
    5.侯汉清,马张华.主题法导论.北京:北京大学出版社,1991
    6.张帆.分类语言与主题语言.武汉:华中师范大学出版社,1991
    7.兰开斯特著:侯汉清等译.情报检索词汇控制.上海:同济大学出版社,1992
    8.刘俊熙,王立义.信息检索,北京:北京图书馆出版社,2002
    9.黄如花.网络信息的检索与利用.武汉:武汉大学出版社,2002
    10.党跃武.信息组织论.图书情报工作,1997(3):12-16
    11.倪莉.信息组织研究述评.情报资料工作,2001(2):16-18
    12.臧国全.论网络信息组织.图书情报知识,2002(3):2-5
    13.刘静.论网络信息检索.图书情报工作,1999(1):42-44
    14.王知津.知识组织的研究范围及发展战略.中国图书馆学报,1998(4):3-8
    15.岳泉,谭华军等.网络环境下的信息组织研究.情报理论与实践,2002(2):99-101,94
    16.董慧,余传明.基于Internet的信息组织研究.情报学报,2001(1):54-60
    17.王忠,周士波.Internet英文搜索引擎评价.图书情报工作,1999(4):33-37
    18.康桂英.网络环境下的主题语言研究.图书情报工作,1999(11):27-29,52
    19.包冬梅.21世纪情报语言学研究面临的新课题.图书馆学刊,2001(3):50-52
    20.柏鹏英.传统信息组织方法在网络环境下的运用.情报资料工作,2002(5):54-56
    21.曹东,韩全惜等.运用情报检索语言理论与方法完善搜索引擎的功能.情报理论与实践,2000(1):58-61
    22.邹瑾.试论主题语言在网络信息检索中的应用.图书情报工作,2004(2):88-90,116
    23.贺亚锋.Web资源虚拟图书馆与搜索引擎的比较研究.情报学报,2000(6):574-577
    24.尚克聪,杨立英.网络环境下情报检索系统性能评价研究.图书馆情报工作,2002(1)68-71
    25.寇钧锋.论情报检索语言的自然语言化发展趋势.中国图书馆学报,1999(3):28-31
    26.张琪玉.网络信息检索用语言的发展趋势.图书馆杂志,2001(3):5-7,22
    27.章琳,张保明.WWW检索工具比较研究.情报学报,1998(4):273-280
    28.曹红兵.Internet网络检索工具的比较研究.情报杂志,1999(1):44-46
    29.张燕飞,邹瑾.网络信息检索中情报检索语言一体化原理应用的分析.情报学报,2004
    
    (2):163-167
    30.严峰.论现代信息技术条件下检索语言的应用及检索效率变化.中国图书馆学报,2001(6):60-63
    31.孙丽,陈通宝等.网上中文检索工具的比较研究,情报学报,1999(3):225-234
    32.曾民族.文本信息检索技术进展和性能评价框架.现代图书情报技术,1997(3):14-18
    33.洪漪.我国情报检索语言学科建设及今后的研究课题.情报业务研究,1993(1):47-49
    34.韩丽风,邓晓惠.SCI网络版评介.现代图书情报技术,1999(6):47-60
    35.赵丹群.超文本系统的检索能力评析.情报理论与实践,1999(2):78-80
    36.荣毅虹,梁战平.Web检索工具性能效果比较研究.情报科学,2001(1):87-91
    37.夏立新.情报检索理论和方法在改善搜索引擎搜索性能中的应用.情报科学,2001(7):759-762
    38.尚加宁,韩露盈.图书分类法性能的定量测评初探.情报理论与实践,1999(5):356-358
    39.张颖,周志农.因特网三大检索工具的比较研究.图书情报工作,1999(10):39-42
    40.张琪玉.网络信息检索工具增强关键词检索功能的措施.图书馆杂志,2001,(1):7-10
    41.邱君瑞.受控词表网络应用现状分析.情报科学,2001(11):1230-1232
    42.吴广印,胡亚莉.基于Internet的后控制全文检索系统的研究与综述.图书情报工作:2001(6):91-95
    43.包冬梅.传统图书情报技术在网络信息资源组织和检索中的应用.情报资料工作,2002(1):36-38
    44.韩圣龙.网络信息检索工具评价指标.情报学报,2001(4):471-477
    45.韩圣龙,赖茂生.网络信息检索工具评价实验(1)——英文网络检索工具评价实验.情报科学,2001(3):293-301
    46.韩圣龙,赖茂生.网络信息检索工具评价实验(Ⅱ)——英文网络检索工具评价实验.情报科学,2001(4):430-434
    47.胡琼.基于WWW的全文检索系统检索性能探讨.情报科学,2001(6):639-642
    48.胡德华,方平.一体化医学语言系统(UMLS)及其对我国情报检索语言的启示.情报学报,2000(2):158-163
    49.马张华,李玲.文本检索中的词汇控制研究.图书情报工作,2004(2):84-87
    50.周全明.全文检索后控制技术初探.北京图书馆学刊,1996(3):98-106
    51.司莉.网络信息资源组织与揭示及其优化研究[博士学位论文].武汉:武汉大学信息管理学院,2003:15-18
    52.臧国全.虚拟图书馆研究[博士学位论文].武汉:武汉大学信息管理学院,2003:127-129
    53.李蕾,王楠等.基于语义网络的概念检索研究与实现.情报学报,2000(5):525-531
    54.廖灵雯等.Web上多媒体数据库的建立与访问.现代通信,2000(2):19-21
    
    
    55.胡德华,方平.一体化医学语言系统[UMLS]及其对我国情报检索语言的启示.情报学报,2000(2):158-163
    56.蔡庆芳.受控语言与自然语言一体化研究[同等学历人员申请硕士学位论文].武汉:武汉大学信息管理学院,2003:48-55
    57.邹瑾.多媒体文献的现状、问题及对策.图书情报知识,2002(5):89-91
    58.黄碧云,方平.信息检索系统中情报语言的一体化.情报杂志,2002(3):49-50
    59.方平.试论一体化医学语言系统(UMLS)超级叙词表的特点.图书情报工作,1998(10):26-29
    60.第十三次中国互联网络发展状况调查(2004年1月)http://www.cnnic.net.cn/html/Dir/2004/02/03/2114.htm [2004-4-20]
    61.第十二次中国互联网络发展状况调查(2003年7月).http://www.cnnic.net.cn/develst/report.shtml.[2003-12-2]
    62.第十次中国互联网络发展状况调查(2002年7月)http://www.cnnic.net.cn/develst/20027/8.shtml.[2003-12-2]
    63.第十一次中国互联网络发展状况调查(2003年1月).http://www.cnnic.net.cn/develst/2003-1/7.shtml.[2003-12-2]
    64.雅虎中国.http://cn.yahoo.com/.[2003-12-6]
    65.Lycos中国.http://www.lycos.com.cn/.[2003-7-23]
    66.Google搜索引擎.http://www.google.com/.[2003-7-23]
    67.浙江大学图书馆信息检索课件.http://libweb.zju.edu.cn/02/.[2003-9-12]
    68.浙江大学图书馆信息检索课件.http://libweb.zju.edu.cn/02/lesson/teach/search/ch4/ch43.htm#432.[2003-9-11]
    69.百度搜索引擎.http://www.baidu.com.[2003-9-12]
    70.雅虎中国中文搜索帮助.http://help.yahoo.com/help/gb/ysearch/ysearch-01.html.[2004-1-6]
    71.Google搜索帮助.http://www.google.com/intl/zh-CN/help/basics.html.[2004-1-6]
    72.Google搜索帮助.http://www.google.com/intl/zh-CN/help/refinesearch.html.[2004-1-6]
    73.Google特色.http://www.google.com/intl/zh-CN/features.html.[2004-1-7]
    74. Padmini Srinivasan.Query Expansion And Medline.Information Processing & Management, Vol.32, No.4, pp.431-443, 1996
    75. Rila Mandala, Takenobu Tokunaga, Hozumi Tanaka.Query expansion using heterogeneous thesauri. Information Processing and Management, Vol. 36, pp.361-378, 2000
    76. Ashwin Rao, Allan Lu, Ed Meier, Salahuddin Ahmed, Daniel Pliske. Query processing in TREC-6. Information Processing and Management, Vol.36 , pp.179-186, 2000
    77. Proquest Research Library.http://proquest.umi.com/.[2003-5-20]
    78. U.S. National Library of Medicine. http://www.nlm.nih.gov.[2003-7-22]
    
    
    79. Thesauri: service and other resources, http:I/www.loc.gov/library/libarch-thesauri.html. [2003-12-5]
    80. Thesaurus for Graphic Materials Ⅰ: Subject Terms (TGM Ⅰ): http://www.loc.gov/lexico/servlet/lexico?usr=pub-14:0&op=frames&db=TGM_Ⅰ.[2003-12-5]
    81. Controlled vocabularies, thesauri and classification systems available in the WWW. DC Subject:http://www.lub.lu.se/metadata/subject-help.html.[2003-9-11]
    82. http://starfire2. compass.edu.cn:8080.[2003-10-22]
    83. Re: Stop Word Lists.http://www.hit.uib.no/corpora/1996-3/0065.html.[2003-9-11]
    84. PubMed Help. http://www.ncbi.nlm.nih.gov/entrez/query/static/help/pmhelp.html. [2003-12-11]
    85. UNESCO Thesaurus. http://www.uicc.ac.uk/unesco/.[2004-1-5]
    86. ASIS Thesaurus of Information Science. http://www.asis.org/Publications/Thesaurus/tnhome. htm.[2004-1-5]
    87. UMLS Applications. http://www.nlm.nih.gov/research/umls/umlsapps.html.[2003-5-20]
    88. National Center for Biotechnoiogy Information. http://www.ncbi. nlm. nih. gov/pubs/factsheets/umlsmeta.html. [2003-5-20]
    89. SECTION 2: METATHESAURUS DRAFT. http://www.nlm.nih.gov/research/umls/Meta2_2004 AA_Draft.html. [2004-4-10]
    90. National Library of Medcine. http://www.nlm.nih.gov/research/umls/META2..HTML#s22.[2004-4-10]
    91. UMLS KNOWLEDGE SOURCES 14th Edition-November Release 2003 ACDOCUMENTATION http://www. nlm. nih. gov/research/umls/UMLSDOC. HTML#012. [2003-5-20]
    92. PubMed Help.http://www.ncbi.nlm.nih.gov/entrez/query/static/help/pmhelp.html #A utomatic TermMapping. [2003-7-15]
    93. http://www.altavista.com
    94. http://www.yahoo.com
    95. http://www.hotbot.com
    96. http://www.infoseek. com
    97. http://www.sohu.com
    98. http://www.google.com
    99. http://www.goyoyo.com

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700