基于元数据的生态数据管理和信息共享
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着生态学研究的问题趋于复杂化和综合化,研究对象的时空尺度越来越大,现代生态学的发展面临着巨大的挑战。如何生产或获取规范化的数据资源,如何存储和高效管理海量数据资源,如何实现生态数据的规范化管理和信息共享,是生态学研究者当前亟待解决的问题。
     当前生态科学数据管理和信息共享中存在的主要问题是:数据管理水平参差不齐,数据采集自动化与手工输入之间的矛盾,数据更新的周期较长,利用效率低,数据格式和标准不统一,共享观念淡薄,元数据的缺乏和不规范等。上述问题的存在使数据用户难以发现和获取所需的数据,严重制约着科学研究和学术交流活动的开展。
     本文以数据集为单位,对国家重点野外科学观测研究站—会同杉木林生态站的历史数据进行整理,并以元数据理论及生态数据元数据国家标准为基础,结合W_eb数据库技术和Java编程语言,开发出基于元数据的生态数据管理系统和信息共享平台,并取得了以下主要结论:
     1.元数据是关于数据的数据,对于促进数据的管理、共享和使用起着重要的作用。适当的元数据能够帮助生态数据生产者及生态数据用户快速发现所需数据,了解其内容和限制,评估其可用性,从而获取和使用这些数据。元数据是规范生态科学数据管理和实现信息共享的关键。
     2.基于现行的生态元数据国家标准《生态科学数据元数据》,按照“元数据子集—元数据实体—元数据元素”的三层模式,确定了关系类型数据集元数据的UML模型,共包括7个模块:分别是标识信息模块、场地信息模块、方法信息模块、数据质量信息模块、项目信息模块、分发信息模块和实体信息模块。
     3.生态科学数据管理是一项基础性工作。基于元数据的生态数据管理系统不仅可以有效地解决Eco-DBMS运行中存在的问题,而且能够实现在网络环境下远程填报数据和元数据,从整体上提高了数据的管理水平,实现数据管理的科学化和规范化。
     4.在基于元数据的生态数据管理系统的基础上开发出信息共享平台,并将数据集的元数据发布在信息共享平台中,不仅实现了元数据和其他信息的共享,还实现了跨平台访问和元数据的分类检索和浏览。
     5.在技术层面上实现了数据共享,建立了生态科学数据共享平台。本文在数据管理和信息共享的基础上,将元数据库和数据库进行链接,在信息共享平台中初步实现了数据实体申请和下载。
As issues of ecological study tend to complicated and comprehensive, temporal and spatial scale of disquisitive object becoming larger and larger, the development of modern ecology is facing enormous challenges. Therefore, how to produce and obtain standardized data resources, how to store and manage massive data resources efficiently, and how to achieve the goal of ecological data management standardization and information sharing are current problems that must be solved urgently by ecological researchers.
     Main problems exist in current ecological scientific data management and information sharing was:data management level varies greatly, contradiction between automatic data collection and manual data entry, data update cycle is long and use of low efficiency, data formats and standards reunification, have a weak concept of sharing, the lack of metadata and not standardized, and so on. The existence of these issues caused users found it difficult to obtain data and seriously restrict scientific research and academic exchange activities.
     Based on data sets for the units, the field of scientific observations of key national research stations-in Chinese fir forest ecology at the historical data to organize, and metadata of ecological data and metadata based on national standards, the combination of Web database technology and Java programming language, developed based on metadata ecological data management system and information-sharing platform, and has achieved the following major conclusions:
     1. Metadata is data about data. It plays an important role in promoting data management and sharing. Appropriate metadata can help the ecological data producers and ecological data users to find data quickly that they needed to understand its content and restrictions, to assess their availability and thus access to and use of such data. Metadata is the key point for standardizing data management and achieving information sharing.
     2. Based on current national ecological metadata standards "metadata for ecological data", according to the "metadata subset—metadata entities—metadata elements" of the three-tier model to determine metadata UML model for relational datasets, including a total of seven modules: namely identification information module, site information module, method information module, quality information module, project information module, distribution information module and entity information module.
     3. Ecological scientific data management is a fundamental work. Metadata based ecological scientific data management can not only solve the problems exist in Eco-DBMS, but will also achieve the goal of remote data and metadata reporting in the network environment.
     4. Information sharing platform was developed on the basis of metadata based ecological data management, then metadata of datasets was published. Not only the goal of metadata and other information sharing was achieved, but also achieved a cross-platform access and the classification of metadata retrieval and browsing.
     5. The goal of data sharing was achieved at the technical level, and ecological scientific data sharing platform was also established. In this paper, database and meta-database were linked up on the basis of ecological data management and information sharing, the goal of data application and download was initially achieved in the information sharing platform.
引文
[1]摆万奇.土地利用和土地覆盖变化研究的目标与方法[J].资源科学,1999,(4).
    [2]杜欣明.信息生态学的学科建设与发展问题初探[J].现代情报,2006,(7):161~163.
    [3]周才平,何洪林,于贵瑞.生态信息科学的理论框架初探[J].资源科学,2002,24(1):77~81.
    [4]傅伯杰,牛 栋,于贵瑞.生态系统观测研究网络在地球系统科学中的作用[J].地理科学进展,2007,26(1):1~16.
    [5]牛栋,黄铁青,杨萍,等.中国生态系统研究网络(CERN)的建设与思考[J].政策与管理研究,2006,21(6):466-471.
    [6]肖笃宁.宏观生态学研究的特点与方法[J]_应用生态学报,1994,5(1):95~102.
    [7]William F. Hunt. Global Environment Change. Issues in Environmental Science and Technology:Volume 30, Issue 2,2004, Pages 289-290.
    [8]张人禾.气候观测系统及其相关的关键问题[J].应用气象学报,2006,17(6):705-710.
    [9]张克斌,杨晓辉.联合国全球千年生态系统评估--荒漠化状况评估概要[J].中国水土保持科学,2006,4(2):47-52.
    [10]Olivier Bernard. Global qualitative description of a class of nonlinear dynamical systems[J]. Artificial Intelligence:Volume 136, Issue 1,2002, Pages 29-59.
    [11]Quantitative description of soil organic matter dynamic—Areview of approaches with reference to rice-based cropping systems[J]. M.E. Shibu, c, P. A. Leffelaar, H. Van Keulen, Geoderma:Volume 137, Issues 1-2,2006, Pages 1-18.
    [12]赵其国,周生路,吴绍华,等.中国耕地资源变化及其可持续利用与保护对策[J].土壤学报,2006,43(4):662-672.
    [13]Long-Term Ecological Research[J]. James T. Callahan,BioScience, Vol.34, No.6. 1984, pp.363-367.
    [14]The long-term ecological research program[J]. Swanson F. J. and J. F. Franklin,1988. Eos 69(3):34.
    [15]刘 宁,时金芝.生态信息科学与数据资源管理[J].现代情报,2005,(3):166-170.
    [16]江 东.地理信息系统及其在全球变化研究中的应用[M].北京:气象出版社,2003.
    [17]Satellite remote sensing of the geographical distribution of suspended particle size in an energetic shelf sea[J]. D.G. Bowers,C.E. Binding and K.M. Elis,Estuarine, Coastal and Shelf Science:2007.
    [18]于贵瑞,牛栋,何洪林.生态系统管理、生态信息科学与数据资源管理[J].资源科学,2003,25(1):48-53.
    [19]邓湘雯,田大伦,康文星,等.会同森林生态系统定位研究数据管理系统的研建[J].中南林学院学报,2006,26(4):65-69.
    [20]沙丽清.生态环境科学研究中的数据管理[J].云南环境科学,1999,18(1):9-11.
    [21]A Model Information Management System for Ecological Research[J]. Rick C. Ingersoll; Tim R. Seastedt; Michael Hartman,BioScience, Vol.47, No.5.1997, pp. 310-316.
    [22]Metadata for geo-spatial data sharing:A comparative analysis[J]. Tschangho John Kim, The Annals of Regional Science, Vol 33,1999,pp.171-181.
    [23]孙九林,施慧中.科学数据管理与共享[M].北京:中国科学技术出版社,2002.
    [24]赵 军,陈 瑛,张庆平.生态学研究元数据的探讨与应用[J].农业系统科学与综合研究,2004,20(3):217-220.
    [25]Non-geospatial Metadata for the Ecological Sciences[J]. William K. Michener, James W. Brunt, John J. Helly, Thomas B. Kirchner, and Susan G. Stafford, Ecological Applications,7(1),1997, pp.330-342.
    [26]金更达,潘燕军,黄文峰.元数据设计应用相关研究综述[J].浙江档案,2005,(8):9-11.
    [27]孙凯.科技资源共享可行性分析及对策建议[J].西北大学学报(哲学社会科学版),2005,35(3):109-112.
    [28]王尚平.浅析消防信息化建设中存在的问题及对策[J].广东公安科技,2006,(2):56-58.
    [29]李芳芳.发达国家空间信息共享与服务及启示[J].国土资源信息化,2006,(4):45-48.
    [30]吴高艺.可持续发展系统的科学理论与评估方法研究[J].广西财经学院学报,2006,(19):322-326.
    [31]赵士洞.国际长期生态研究网络(TLTER)--背景、现状和前景[J].植物生态学报,2001,25(4):510-512.
    [32]赵士洞.美国长期生态研究计划:背景、进展和前景[J].地球科学进展,2004,19(5):840-844.
    [33]于贵瑞,梁飚.世界三大生态网——中国生态系统研究网络(CERN)[J].今日国土,2003,(7):28-30.
    [34]李希明,土丽艳,金 科.从信息孤岛的形成谈数字资源整合的作用[J].图书馆论坛,2003,23(6):121-123.
    [35]张 伟.建立数据仓库,消灭信息孤岛[J].内蒙古科技与经济,2006,(6):109-111.
    [36]李希明,梁蜀忠,苏春萍.浅谈信息孤岛的消除对策[J].情报杂志,2003,(3):61-62.
    [37]刘欲晓.我国企业的信息化建设研究[J].安徽农业科学,2007,35(4):1143~1146.
    [38]辜寄蓉.基于元数据的综合数据管理与信息共享[D].成都理工大学,2003.
    [39]Using Metadata to Enhance Web Information Gathering[J]. Jeonghee Yi, Neel Sundaresan, and Anita Huang, WebDB 2000, LNCS 1997,2001,pp.38-57.
    [40]Virtual database:Spatial analysis in a Web-based data management system for distributed ecological data[J].Marcel Frehner, Martin Brandli, Environmental Modelling & Software 21 (2006) 1544~1554.
    [41]Data and Metadata Collections for Scientific Application[J]. Arcot K.Rajasekar and Reagan W.Moore. HPCN Europe 2001, LNCS 2110, pp.72-80,2001.
    [42]郭明航,李够霞,从怀军.生态研究数据库系统的设计与开发[J].水土保持通报,2005,25(6):59~62.
    [43]孟凡荣.联邦地理数据委员会标准参考模型[J].国土资源情报,2002,(6):37-46.
    [44]陈永宝,黄传伟,潘文聪.基于虚拟GIS的县级小流域信息系统[J].中国水土保持科学,2004,2(3):58-60.
    [45]刘庆文,胡翔,周建林.生命科学网络信息资源及其获取[J].中华医学图书情报杂志,2003,12(4):48-52.
    [46]生态科学数据元数据[S].中国国家标准化管理委员会,北京:中国标准出版社,2007.
    [47]吴建中 主编.DC元数据[M].上海:上海科学技术文献出版社,2000.
    [48]陈艳红,盛子刚.DC元数据与网络信息检索(综述)[J].河北科技师范学院学报,2005,19(2):73~76.
    [49]周 宁,林 蓉,严亚兰.都柏林核心元数据研究的新进展[J].情报科学,2000,18(6):568~571.
    [50]王梦菊.DC元数据的应用及思考[J].现代情报,2005,(8):5-7.
    [51]龚健雅,高文秀.地理信息共享与互操作技术及标准[J].地理信息世界,2006,(3):18-27.
    [52]牛晓琳,季民,赵志刚.基于元数据和数据集管理的空间数据共享研究[J].测绘与空间地理信息,2006,29(3):19-22.
    [53]徐开明.地理空间框架数据的含义和作用[J].测绘与空间地理信息,2005,28(5):63-66.
    [54]Meta-information concepts for ecological data management[J]. William K. Michener, Ecological Informatics:Volume 1, Issue 1, January 2006, Pages 3-7.
    [55]Geospatial information standards. A comparative study of approaches in the standardisation of geospatial information[J]. Albrecht,Computers & Geosciences: Volume 25, Issue 1,1999, Pages 9-24.
    [56]林业科学数据库和数据共享技术标准与规范(第一辑)[M]林业科学数据中心编中国林业出版社2004.
    [57]林业科学数据库和数据共享技术标准与规范(第二辑)[M]林业科学数据中心编中国林业出版社2006.
    [58]Efficient and scalable filtering of graph-based metadata[J]. Haifeng Liu, Milenko Petrovic,and Hans Arno Jacobsena,Web Semantics:Science, Services and Agents on the World Wide Web:Volume 3, Issue 4,2005, pp.294-310.
    [59]Metadata standard interoperability:Application in the geographic information domain[J]. J. Nogueras Iso, F.J. Zarazaga-Soria, Computers, Environment and Urban Systems:Vol 28,2004, pp.611-634.
    [60]程变爱.试论资源描述框架—一种极具生命力的元数据携带工具[J].现代图书情报技术,2000,(6):62-64.
    [61]Callahan J T. Long-Term Ecological Research [J]. BioScience,1984,34(6):363-367.
    [62]Brown J H, Rough garden J. Ecology for a changing earth [J]. Bulletin of the Ecological Society of America,1990,173-188.
    [63]罗枫,王丹志,宋俊德.综合网管中基于模型驱动的元数据管理[J].武汉大学学报(理学版).2007,53(1):59-62.
    [64]Likens G E, Lambert K F. The Importance of Long-Term Data in Addressing Regional Environmental Issues[J]. Northeastern Naturalist,1998.5(2):127-136.
    [65]Daniel Higgins, Chad Berkley. Managing Heterogeneous Ecological Data Using morpho[J]. Proceedings of the 14th International Conference on Scientific and Statistical Database Management,2002.
    [66]Aaron M. Ellison, Leon J. Osterweil, Lori Clarke, etc. Analytic Webs Support the Synthesis of Ecological Data Sets[J]. Ecology,87(6),2006, pp.1345-1358.
    [67]施建平,林 岳,刘光崧.农业生态环境数据自动采集[J].土壤,1990.
    [68]赵军.生态网络数据管理系统动态研究[J].农业系统科学与综合研究,1995,11(3):222-224.
    [69]刘元波,唐万龙.中国生态系统研究网络(CERN)台站数据文档文件编码--以湖泊生态系统研究站为例[J].湖泊科学,1996,8(3):278-281.
    [70]沙丽清.生态环境科学研究中的数据管理[J].云南环境科学,1999,18(1):9-11.
    [71]苏文,郭学兵.CERN生态站动态监测数据库管理系统研究进展[J].资源科学,2002,24(1):94-95.
    [72]赵军.农业生态站科研数据管理信息系统[J].农业系统科学与综合研究,2000, 16(1):66-69.
    [73]程学慧,孙静萍,张成福.草原生态环境监测数据建库方法初探[J].生态与环境,2002,14(3):27-29.
    [74]佘济云,田大伦,沈翠新,等.会同生态定位研究站科研信息管理系统的研制[J].中南林学院学报,2003,23(1):40-44.
    [75]李爱霞,张景光,王新平,等.沙坡头站生态监测数据的质量控制与综合管理[J].中国沙漠,2005,25(2):287-292.
    [76]郭学兵,苏 文,于贵瑞.生态环境长期定位监测信息化管理研究[J].资源科学,2003,25(1):54-58.
    [77]赵军,陈瑛,张庆平.生态学研究元数据的探讨与应用[J].农业系统科学与综合研究,2004,20(3):217-220.
    [78]闫礼,吴炳方,马新辉,等.元数据在三峡工程生态与环境信息系统中的应用[J].世界科技研究与发展,2005,27(3):62-66.
    [79]黄慧,韩杏荣,夏自谦.林业生态工程项目信息元数据标准研究[J].北京林业大学学报(社会科学版),2005,4(1):64-68.
    [80]Chau-Chin Lin, John H. Porter, Sheng-Shan Lu. A metadata-based framework for Multilingual Ecological Information Management[J]. Taiwan J for Sci,2006,21(3): 377-382.
    [81]刘嘉 著.元数据导论[M].北京:华艺出版社,2002.
    [82]张晓林主编.元数据研究与应用[M].北京:北京图书馆出版社,2002.
    [83]黄崇轲,钱大都 等著.数字地质图—空间数据库—元数据[M].北京:地震出版社,2001.
    [84]Distributing non-MARC metadata:the CUGIR metadata sharing project[J]. Adam Chandler, Elaine L. Westbrooks.Library Collections, Acquisitions & Technical Services 26(2002)207-217.
    [85]Metadata and Cooperative Knowledge Management[J]. Matthias Jarke and Ralf Klamma. A. Banks Pidduck et al. (Eds.):CAISE 2002, LNCS 2348, pp.4-20,2002.
    [86]赵健.数字图书馆中的元数据研究[J].中国西部科技,2004,(1):69-70.
    [87]王志海,林友芳等译.数据仓库(第三版)[M].机械工业出版社,2003.
    [88]Internet Metadata and Library Cataloging[J]. Hakala J. International Cataloging and Bibliographic Control,1999,28(1):21-25.
    [89]The Information Repository:A Tool for Metadata Management [J]. Noushin Ashrafi. Journal of Database Management Vol.2 No.2,1995.
    [90]Metadata:A User's View. [J] Francis.P.Bretherton, Paul T.Singley. IEEE,1994, pp.166-176.
    [91]The Conceptual Schema and External Schemata of Metadatabases[J].Hans—J.Lenz. IEEE,1994, pp.160-172.
    [92]A Knowledge—Based System Approach for Scientific Data Analysis and the Notion of Metadata[J]. Epaminondas Kapetanios.
    [93]李冠宇,刘红星,李巍.异构数据的元数据管理[J].交通与计算机,2005,23(6):89-91.
    [94]肖珑,陈凌,冯项云,等.中文元数据标准框架及其应用[J].大学图书馆学报,2001,(5):29-35.
    [95]涂以平.网络环境下期刊资源建设现状及思考[J].科技情报开发与经济,2004,14(7):54-55.
    [96]Interactions in Microhabitat Use between Dipodomys Ordii and Onychomys Leucogaster[J]. Cindy Rebar, Walt Conley, Ecology,1983,64(5), pp.984-988.
    [97]罗昊.元数据在网络教育中的应用研究[J].情报科学,2004,22(1):59-62.
    [98]曹月华,赵士洞.世界环境与生态系统监测和研究网络[M].北京:科学出版社,1997.
    [99]中国生态系统研究网络数据目录[M].CERN科学委员会秘书处.北京:气象出版社,1998.
    [100]施建平,孙波,杨林章.养分循环研究数据管理概念模型的构建[J].应用生态学报,2003,14(11):1873-1878.
    [101]王浒,李琦,承继成.数字城市元数据服务体系的研究和实践[J].北京大学学报(自然科学版),2004,40(1):107-115.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700