我国深层网络信息资源的获取及保存策略研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
深层网络信息资源在网络资源中占有重要的位置。本文通过研究我国深层网络信息资源获取与保存的现状,总结出我国在深网资源的获取及保存方面的不足之处,为今后我国深网获取及保存工作提出了科学建议,这对我们挖掘中文深网资源,促进经济社会发展具有重要意义。
     本文以深层网络资源为研究对象,介绍了深层网络的分类和重要意义,概括了国内外在深层网络资源方面的研究现状,阐述了对深层网络信息资源进行获取与保存的必要性,随后,重点分析了我国在深层网络资源获取与保存的现状,总结出了五方面不足之处:(1)搜索引擎智能化不足;(2)在线数据库遵循的协议参差不齐;(3)有关深层网络信息资源的著作权立法缺失;(4)有关深层网络信息资源的呈缴制度不完善;(5)深层网络信息资源现有保存模式各有利弊。
     更从国外在深层网络方面已获得经验入手,结合我国现实情况,提出我国深层网络获取与保存方面的改进策略:(1)努力改进Spider,制造更智能的蜘蛛;(2)积极推广OAI协议;(3)推进数字信息时代著作权法律制度的完善;(4)建立深层网络信息资源网络呈缴制度;(5)利用虚拟化存储对深层网络资源进行保存。这样可缓解我国深层网络信息资源目前在获取与保存方面遇到的困难,将深层网络资源纳入可控范围。
     文章结尾对未来我国深层网络信息资源工作做出展望,指出应针对深层网络资源集成模式工作,网络信息资源保存的加大资金投入工作,与相关技术部门或者公司的合作工作;建立网络资源控制保障体系工作;提高公众对深网资源认知水平工作几方面来重点展开。
The deep web plays an important role in network resources. This paper through the research on the preservation of the deep web resources situation in China, Summary the faults of the acquisition and preservation of deep web resources, and raise some suggestions. This is very important for the social development.
     This paper's research object is the deep web research, then we analysis the classification and the significance of the Deep Web, and next we summarized the research status of the deep web resources at home and abroad. It is very necessary to get and save the deep web resource. In the view of our country's situation, we point out five shortages:(1) The search engine lack intelligence;(2) The online database's agreements are not uniform;(3) The deep web resources is lack of copyright legislation;(4) The deposit system of deep web is imperfect;(5) The save modes of deep web is incompletion.
     Combined with the domestic and foreign experiences, this paper point out the Improvement methods of get and save the deep web resource:(1) improve Spider, Create more intelligent spider,(2) promote the OAI protocol;(3) we should strive to urge the Perfection of copyright laws in the digital age,(4) To establish the deep web resource legal deposit system;(5) The virtualization to save the deep web resources etc. Only in this way can we make the deep web resources into manageable, and mobilize individuals to actively, Change the situation of shortage in deep web resource conservation finally.
     In the end of this paper, we make the outlook of the deep web in our country, we should make the following work in the future:the integration patterns of deep web optimization; Increase the capital to save the network resources; Cooperate with technology department and corporations; To establish a national deep web resources conservation organization as soon as possible; Enhance the people's awareness of save the deep web resource.
引文
①袁靓Deep Web信息集成关键技术的研究[D].[硕士学位论文].湖南,中南大学.2008
    ②袁柳,李战怀,陈世亮.基于本体的deep web数据标注[J],软件学报,2008(2):237-245
    ③百度百科.阿拉丁计划[2012-4-10]http://baike.baidu.com/view/2086291.htm
    ①百度百科.搜索引擎[2012-4-22]http://baike.baidu.com/view/1 154.htm?wtp=tt
    ①谢尔曼.看不见的网站——Internet专业信息检索指南[M].辽宁科学技术出版社,2003:47-59
    ~② Mary Ellen Bates. Tapping Into the Brains of the web[J].Information Today,2004,27(6):23
    ①杨增辉.基于主题的Hidden web信息获取研究[D].西安理工大学.2008
    ②石玉平.深层网络信息资源的集成模式研究[J].情报杂志,2010(3):157-161
    ③百度百科OAI[2012-4-20].http://baike.baidu.com/view/555113.htm
    ①赵俊玲.守护e时代的记忆——网络信息资源保存研究[M].北京图书馆出版社.2007:110
    ①谢尔曼.看不见的网站Internet专业信息检索指南[M].辽宁科学技术出版社,2003
    ①谢尔曼.看不见的网站Internet专业信息检索指南[M].辽宁科学技术出版社,2003
    ①陈涛.深层网络信息资源分析与获取策略研究.[D].[硕士学位论文].长春:东北师范大学.2005:40-45
    ①赵俊玲.守护e时代的记忆——网络信息资源保存研究[M].北京图书馆出版社.2003:43
    ①向菁,吴振新.网络信息资源保存发展现状与趋势分析[J].中国图书馆学学报,2009,3(180):34-41
    ①李希明,张鲁,陈琦.关于影响网络信息资源获取的因素及对策思考[J].情报杂志,2002(3):34-37
    ①百度百科.OAI.[2012-4-20]http://baike. baidu. com/view/555113. htm
    ①吴永臻,河北大学学报(哲学社会科学版)1998(6):134-140
    ①老好人.云存储优缺点分析.[2012-4-20]http://blog.39.net/laohaoren599/a_7371380.html
    ①石玉平.深层网络信息资源的集成模式研究[J].情报杂志,2010(3):157-161
    [1]连天奎.国外电子出版物呈缴制度概况及立法借鉴的几个问题[J].现代情报,2007(3):7-9
    [2]赵俊玲.守护e时代的记忆——网络信息资源保存研究[M].北京图书馆出版社.2007
    [3]陈涛.深层网络信息资源分析与获取策略研究[D].[硕十学位论文].长春:东北师范大学.2005:40-45
    [4]单杰.网络环境下著作权合理适用制度初探[J].重庆邮电大学学报(社会科学版),2007(3):55-59
    [5]林子英,普翔.著作权法中合理使用制度的局限——从一起著作权案件适用法律问题谈起[J].电子知识产权,2006(1):50-52
    [6]世界各国图书馆资源库.[2012-4-15]http://www. nlc. gov. cn/old/nav/nlibs/index. htm
    [7]王少辉.试论信息时代我国出版物呈缴制度的完善[J].武汉大学学报,
    2007(1):116-120.
    [8]王运显.国外电子出版物呈缴制度及对我国的启示[J].现代情报,2007(3):7-9
    [9]马海群等.数字信息资源的国家宏观规划与管理[M].北京:知识产权出版社,2010
    [10]刘家真.维护数字信息长期存取的技术策略.情报学报,1999(增刊):161-165
    [11]谢尔曼.看不见的网站Internet专业信息检索指南[M].马费成,蔡东宏等译.沈阳:辽宁科学技术出版社,2003
    [12]卷冬冬deep web信息集成系统关键技术研究[D].[硕士学位论文].苏州大学,2006
    [13]马费成,张婷.看不见的网站与学科信息门户的比较分析[J].情报理论与实践,2004(4):298-301
    [14]陈红勤.埋藏的web财宝——隐形网络的搜索利用[J].现代情报,2005(7):157-159
    [15]陈涛,顾红.隐形web资源获取策略分析[J].图书馆研究与工作,2008(1):29-32
    [16]石玉平.深层网络信息资源的集成模式研究[J].情报杂志,2010(3):157-161
    [17]彭华.隐形网络研究综述[J].图书馆学刊,2007(4):122-124
    [18]黄晓东Invisible Web研究综述[J].情报科学,2004,22(9):1145-1148
    [19]陈红勤.我国隐蔽网络研究文献计量学分析[J].情报杂志,2008(5):48-51
    [20]吴志强,严贝妮.从隐蔽网络到国际互联网信息资源控制计划[J].图书情报工作,
    2004(3):82-85
    [21]郑东东,赵朋朋,崔志民Deep Web爬虫研究与设计.清华大学学报,2001(11):1986-1902
    [22]CNNIC《第29次中国互联网络发展状况统计报告》.2012
    [23]马费成.获取看不见的网站信息资源的有效途径[J].情报理论与实践,2004(4):408-411
    [24]赵志宏,黄蕾,刘峰Deep Web搜索技术进展综述[J].山东大学学报,2009(2):15-20
    [25林超.面向deep web的对象检索关键技术研究[D].[硕士学位论文].苏州:苏州大学,2008
    [26]曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008(5):122-26
    [27]陈红勤.隐蔽网络及其应对策略[J].情报理论与实践,2008,31(6)
    [28]刘雅晴.隐蔽网络及其资源检索策略研究[J].情报科学,2006(5):713-16
    [29]周旭,赵耀,刘海博deep web资源集成研究[J].计算机与信息技术,2007,(35):273-274
    [30]王权良.数字图书馆OAI数据资源整合系统的研究与实现[D].[硕士学位论文].北京:北京交通大学,2007
    [31]周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005(9):1966-1969
    [32]娄卓男,吴志强.近几年国外隐蔽网络研究概述[J].图书馆情报工作,2004,48(1)
    [33]鞠彦辉,许燕Deep web信息资源开发策略研究[J].现代情报,2008(1):77-80
    [34]邢春艳.隐蔽网络研究刍议[J].图书馆学刊,2005(6):114-116
    [35]詹青,崔宾阁.基于网格的Deep web数据集成系统研究[J].计算机与信息技术,2009(2):78-80
    [36]Pace Andrew K. Black white and shades of gray literature on the web[J].Computers in Libraries,2002(4):44-46
    [37]Chris Sherman, Gary Price. The Invisible Web:Uncovering Sources search Engines Can't see[J].Library Trends,2003:82~284
    [38]仲华Deep Web模式获取技术研究与应用[D].[硕十学位论文].苏州:苏州大学,2007
    [39]Michael.K. Bergman. Deep Web:Surfacing Hidden Value[EB]
    [40]肖秀珍,深网内容和美国Bright Planet深网分析[J].情报探索,2007(1):20-21
    [41]Young Jr., Terrence. E. The invisible web[J].Book Report,2002(5/6):30-32
    [42]高元文.网络环境下知识产权保护体系的新思路[J].现代情报,2004(1):158-163
    [43]邢美园,陈益君.学科信息门户建设中深层网页资源采集的方法与策略[J].情报资料工作,2005(6):53-56
    [44]陈家翠,联邦检索机制及其存在的问题[J].图书情报工作,2006(6):87-103
    [45]吃玩网中Deep Web数据集成研究[D].[硕十学位论文].山东:山东大学,2008
    [46]陈涛,王良春.深层网络搜索工具介绍和性能分析[J].图书馆工作,2007(3):21-24
    [47]梁焕平.隐蔽网络及其检索策略研究[J].情报科学,2004(7)
    [48]Bright Planet white paper. Bright Planet Corporation,2004(1)
    [49]陈力,郝守真,王志庚.网络信息资源的采集与保存——国家图书馆的WICP和ODBN项目介绍[J].国家图书馆学刊,2004(1):2-6
    [50]王琦,刘晓,李瑞芬.在线数据库建设现状研究[J].情报科学,2008(3):476-480
    [51]乔爱丽.深网信息资源及其在图书馆信息服务中的应用[J].图书馆学研究,2010,(1):70-72
    [52]Paul Pedley. The invisible web:searching the hidden parts of the internet[M].London:Stone House Court,2001.33-36
    [53]Anne Clyde. The invisible web[J].Teacher Libranan,2002,(4):47-49
    [54]Walter Minkel. the invisible web:How to find the hidden resources that most search tools skip over[J].School Library Journal,2002:12~13
    [55]赵岩.深层网络信息资源集成模式的类型与选择[D].[硕士学位论文].河南,郑州大学,2011
    [56]Smith C B. Getting to Know the invisible Web(Deep web Search-ing).School Library Journal,2001
    [57]胡双双,秦杰.搜索引擎技术及其发展趋势[J].福建电脑,2008(6):32-33
    [58]陈丽君.深层网网络爬虫设计[J].计算机与信息技术:83-84
    [59]赵朋朋,崔志明,高岭.关于中国Deep Web的规模、分布和结构[J].小型微型计算机系统,2007(10):1799-1802
    [60]Gwen M Gregory. Uncovering the invisible web[J].Information today,2001(1 1):49
    [61]苏云.搜索引擎Google检索技巧研究[J].甘肃科技,2005(2):69-71
    [62]王上,于海等Deep Web垂直搜索引擎设计与实现[J].计算机研究与发展,2009(46增刊):359-365
    [63]杨靖韬,陈会果.对网络爬虫技术的研究[J].科技创业月刊,2010(10):170-171
    [64]王芳.基于主题的Deep web搜索引擎研究与探索[D],[硕士学位论文].陕西,长安大学,2008
    [65]解勇,周东.网络环境下的存储技术与设备选择[J].中国计量学院学报,2003(3):228-230
    [66]苏晓珂,张勇敢,黄青松Deep Web查询接口的复杂模式匹配[J].石河子大学学报,2007(1):123-124
    [67]方锦平.隐形网络及其信息资源的获取途径[J].现代情报,2008,5(5):76-78
    [68]Steve L, Lee G C. Accessibility of Information on the web[J]. Nature,1999:107~109
    [69]王惠仙.网络数据库的知识产权保护问题[J].情报杂志,2001(7):3-4
    [70]郭少友.基于通用搜索引擎的深层网络表面化方法研究[J].现代图书情报技术,2010,(2):24-30
    [71]杨巨蜂,史广腰,赵玉娟等.基于规则集Deep Web信息检索[J].计算机工程.2008,7(13):51-53
    [72]焦玉英,符绍宏,何绍华.信息检索[M].武汉:武汉大学出版社,2001
    [73]刘家真.缴存本制度的扩展与电子出版物的采集[J].中国图书馆学报,2000(6):51-54
    [74]马费成,裴雷.网络信息资源的分布规律[J].情报科学,2003(11):1121-1124
    [75]Galanag M. Digital preservation—some policy and legal issues[OL].
    [76]王少辉.试论信息时代我国出版物呈缴制度的完善[J].武汉大学学报,2007(1):166-168
    [77]姜冬云.数字图书馆建设中的知识产权保护[J].图书馆学研究,2007(1):86-88
    [78]林子英,普翔.著作权法中合理使用制度的局限——从一起著作权案件适用法律问题谈起[J].电子知识产权,2006(1):50-52
    [79]王运显.国外电子出版物呈缴制度及对我国的启示[J].现代情报,2007(1):166-168
    [80]郭瑞华.数字信息长期存取策略[J].情报理论与实践,2002(2):133-135
    [81]颜晓栋.保存数字信息技术方案选择与评价[J].档案管理,2003(1):23-24
    [82]中国电信网络安全实验室.云计算安全技术与应用[M].北京:电子工业出版社,2012
    [83]Michael. K. Bergman. The Deep Web:Surfacing Hidden Value [EB]. [2012-4-15] http://www. press, umich. edu/jep/07-01/bergman. html

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700