用户名: 密码: 验证码:
地理编码引擎的设计与实现
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着地理信息系统在我国信息化建设中的不断应用,信息资源整合与共享的需求越来越高,而非空间信息与空间信息整合是资源整合的重要组成部分,并且已经提出从这些隐含位置信息的非空间数据中提取出空间定位信息的需求。当前互联网中存在着海量的隐含地理位置的文本信息,如何将其转换成空间数据呢?
     地理编码就是解决这些问题的有效方法。地理编码引擎可从网页文本中挖掘出具有地理信息语义的内容,并将其转换成具有定位信息的有效地理信息。因此,地理编码引擎的研究有着深远的意义和巨大的应用前景。
     本文针对中文地理编码问题,提出了基于语义的地名地址、邮政编码、手机号码和身份证号码的识别与匹配的方法,并在模糊地名匹配上做出探索,采用挖掘上下文潜在定位信息的方法,提高了地址别名和不完整地名的识别率。本文对比了中文分词的常见算法,设计了基于中文语义分析的隐含地理信息识别和匹配引擎,建立了面向地理实体的基础地理参考数据库,开发了引擎原型应用系统,进行了互联网灾情新闻自动标绘和互联网房屋租赁信息搜索与定位的应用试验,取得了良好的效果。
With the continuous application of Geographic Information System in our information construction, the demand for integration and sharing of information resource is becoming higher, and the integration of non-spatial information and spatial information is an important component of resource integration, and the needs has been proposed that extracting the spatial location information from non-spatial data with implicit location information. There are vast amount of text with hidden geographic information in the internet, how to transform them to GIS data?
     Geocoding is an effective method to solve these problems. Geocoding engine can extract geographic information semantic content from a web page text, and convert it into valid location information with geographic information. Therefore, the study of geocoding engine has far-reaching significance and tremendous application prospects.
     According to the Chinese geocoding problem, this paper proposed recognition and matching method of semantic-based names address, zip code, telephone number, and made exploring on the fuzzy names matching, used the method mining potential location information in the context to improve the recognition rate of address aliases and incomplete names, Compared the common Chinese word segmentation algorithm, designed implicit geographic information identify and match engine based on Chinese semantic, set up basal geo-referenced databases face to geographic entity, and developed a prototype system, carried out a prototype system to mark disaster news and a prototype system to rental information search and location , achieved good results.
引文
[1]江洲,李琦.地理编码(Geocoding)的应用研究[J].地理与地理信息科学, 2003, 19(003):22-25.
    [2]薛明,肖学年.关于地理编码几个问题的思考[J].北京测绘, 2007, (2):54-56.
    [3]李琦,罗志清等.基于不规则网格的城市管理网格体系与地理编码[J].武汉大学学报·信息科学版, 2005, 30(5):408-410.
    [4]高昭良.城市地理空间字典——地理编码[J].城市勘测, 2008, 2(2):20-22.
    [5]张鹤,孔令彦.城市地址编码发展历史及现状分析[J].测绘通报, 2008, (007):58-60.
    [6]张家庆.空间信息支持下的电子政务及其展望[J].测绘科学, 2003, 28(1):21-23.
    [7]吴秀芹,张洪岩等. ArcGIS9地理信息系统应用与实践[M].清华大学出版社, 2008.
    [8]朱前飞. MapInfo中的地理编码及应用[J].四川测绘, 2001, 24(003):117-119.
    [9]章意锋,吴建平. Arcgis中地理编码方法的改进[J].测绘与空间地理信息, 2007, 30(3):710-713
    [10] Crosier, S. Geocoding in ArcGIS [M], ESRI. 2004.
    [11]江洲,李琦.空间信息融合与地理编码数据库的开发[J].计算机工程, 2004, 30(005):1-2.
    [12]刘湘南. GIS空间分析原理与方法[M].科学出版社. 2005.
    [13]郭会,宋关福等.地理编码系统设计与实现[J].计算机工程, 2009, 35(1):250-252.
    [14]康博. C#程序员参考手册[M].清华大学出版社, 2002.
    [15] Robinson, S. C#高级编程[M].清华大学出版社, 2005.
    [16] Petzold, C. C# Windows程序设计[M],北京大学出版社. 2002.
    [17]俞志翔.面向对象分析与设计[M].清华大学出版社, 2006.
    [18]陈平.软件设计师教程(第2版)[M].清华大学出版社, 2006.
    [19] O'Docherty, M.面向对象分析与设计[M],清华大学出版社. 2006.
    [20]张磊,张代远.中文分词算法解析[J].电脑知识与技术, 2009, 5(1):192-193.
    [21]王晓龙,王开铸.最少分词问题及其解法[J].科学通报, 1989, 34(013):1030-1032.
    [22]张华平,刘群.基于N—最短路径方法的中文词语粗分模型[J].中文信息学报, 2002, 16(005):1-7.
    [23]孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学, 2000, 2(002):74-83.
    [24]周新栋,王挺.基于N元语言模型的文本分类方法[J].计算机应用, 2005, 25(001):11-13.
    [25]赵福君,黄厚宽.基于期望的汉语分词模型的设计[J].哈尔滨船舶工程学院学报, 1990, 11(002):174-179.
    [26]刘群,张华平.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展, 2004, 41(008):1421-1429.
    [27] 9002-2007, C. Z.数字城市地理空间信息公共平台地名/地址分类、描述及编码规则(国家测绘局). 2008.
    [28]陈小琥(2005)基于Web方式的地理编码服务[D].
    [29]郭婧.地理信息Web服务研究与实践[D].郑州:中国解放军信息工程大学硕士论文,2007
    [30]洪莹.城市地名地址匹配方法研究及实验[D].辽宁:辽宁工程技术大学硕士论文,2009

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700