摘要
目前,地表覆盖样本采集主要是利用野外实地调查和目视解译高分辨率影像图等方法,其采集周期长且成本昂贵,导致地表覆盖数据产品验证困难,特别是大区域地表覆盖数据产品的验证。 针对以上问题,本文借鉴Foody提出的以网络志愿者图片信息为地表覆盖样本的思想,提出采用深层网络爬虫技术挖掘网络信息中海量的、以文本形式存在的地表覆盖要素数据,并验证了其作为地表覆盖样本的可能性。为此,本文基于JavaScript脚本引擎设计开发了面向人造覆盖类别的深层网络爬虫,并以辽宁、北京、天津、山东和上海为实验区域验证了全球30m地表覆盖2010基准年的人造覆盖类别数据产品。实验证明,利用深层网络爬虫采集的网络地表覆盖文本数据可以作为地表覆盖样本,其准确率与第三方单位完成的初步精度评估相当,其样本采集周期较短,平均1秒采集0.59个,并且成本低廉,为实现自动化、短周期化和低成本化的地表覆盖样本采集提供了新的途径。