利用深层网络爬虫的地表覆盖样本采集--以人造覆盖为例
详细信息    查看全文 | 下载全文 | 推荐本文 |
  • 作者:侯东阳陈斐陈军武昊胡菊菊
  • 会议时间:2014-10-11
  • 关键词:计算机网络 ; 地表覆盖样本 ; 信息采集 ; 网络爬虫
  • 作者单位:侯东阳,胡菊菊(中国矿业大学环境与测绘学院,江苏,徐州,221116;国家基础地理信息中心,北京,100036)陈斐(国家基础地理信息中心,北京,100036;中南大学,地球科学与信息物理学院,湖南,长沙,410083)陈军,武昊(国家基础地理信息中心,北京,100036)
  • 母体文献:中国地理信息科学2014学术年会论文集
  • 会议名称:中国地理信息科学2014学术年会
  • 会议地点:徐州
  • 主办单位:中国地理信息产业协会理论与方法工作委员会
  • 语种:chi
  • 分类号:TP3;G40
摘要
目前,地表覆盖样本采集主要是利用野外实地调查和目视解译高分辨率影像图等方法,其采集周期长且成本昂贵,导致地表覆盖数据产品验证困难,特别是大区域地表覆盖数据产品的验证。 针对以上问题,本文借鉴Foody提出的以网络志愿者图片信息为地表覆盖样本的思想,提出采用深层网络爬虫技术挖掘网络信息中海量的、以文本形式存在的地表覆盖要素数据,并验证了其作为地表覆盖样本的可能性。为此,本文基于JavaScript脚本引擎设计开发了面向人造覆盖类别的深层网络爬虫,并以辽宁、北京、天津、山东和上海为实验区域验证了全球30m地表覆盖2010基准年的人造覆盖类别数据产品。实验证明,利用深层网络爬虫采集的网络地表覆盖文本数据可以作为地表覆盖样本,其准确率与第三方单位完成的初步精度评估相当,其样本采集周期较短,平均1秒采集0.59个,并且成本低廉,为实现自动化、短周期化和低成本化的地表覆盖样本采集提供了新的途径。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700