摘要
自然语言空间查询是智能信息检索在GIS领域的扩展。自然语言的自由灵活性在降低用户查询难度的同时,也对查询语句的规则匹配增加了难度。鉴于此,提出基于编辑距离的规则匹配模型。在词语层面,计算编辑相似度和语义相似度提供候选项,通过用户选择来建立未登录词与空间词库的匹配关系;在语句层面,应用编辑距离的思想来实现未登录句式的规则匹配。最后,开发了规则匹配工具,通过实验验证了模型的可行性。
Natural language spatial query is the expansion of intelligent information retrieval in GIS. The flexibility of natural language reduces the query difficulty for users,and meanwhile increases the rule matching difficulty of query sentences. Owing to this,a rule matching model was put forward based on levenshtein distance. In the word level,candidate words were provided through edit similarity and semantic similarity,which could establish the relation between unknown words and spatial thesaurus. In the sentence level,the idea of levenshtein distance was used to realize the rule matching of unknown sentence structure. Finally,a rule matching tool is developed,which verifies the feasibility of the model.
引文
[1]李滨.自然空间查询语言解译机制研究[D].郑州:信息工程大学,2009:15-16;7;120;37-38;84-85;120-122.
[2]马林兵,龚健雅.面向自然语言的空间数据库查询研究[J].计算机工程与应用,2003,39(22):16-19.
[3]丁振波.浅析智能信息检索系统中存在的问题及解决思路[J].科教文汇(中旬刊),2009(3):279.
[4]周碧英.基于自然语言的文本智能检索技术研究[D].西安:西北大学,2013:2.
[5]马林兵,龚健雅.空间信息自然语言查询接口的研究与应用[J].武汉大学学报:信息科学版,2003,28(3):301-305.
[6]马晓娜,杨承磊.自然语言查询系统中的句法分析与算法实现[J].山东建筑工程学院学报,2005(1):76-81.
[7]邓敏,黄雪萍,刘慧敏,等.利用自然语言空间关系的空间查询方法研究[J].武汉大学学报:信息科学版,2011,36(9):1089-1093.
[8]杜清运,任福.空间信息的自然语言表达模型[J].武汉大学学报:信息科学版,2014,39(6):682-688.
[9]明小娜,龙毅,钱程扬,等.基于受限自然语言的GIS命令解析方法[J].地球信息科学学报,2009,11(2):183-188.
[10]PANG YAO,LONG YI,QIAN CHENYANG,et al.Research in a Chinese Word Segmentation Method Based on Spatial Information Query of GIS[C]∥Geoinformatics 2008 and Joint Conference on GIS and Built Environment.Proceedings of SPIE.Riga,Latvia,2008,7143:71430I-1-8.
[11]马竹根.一种自然语言理解中语法分析的算法设计和实现[J].计算机时代,2005(10):8-10.
[12]胡婕,李跃新.数据库受限汉语自然语言查询的分词研究与实现[J].湖北大学学报:自然科学版,2005(4):331-335.
[13]胡晓军.数据库自然语言查询接口探讨[J].福建电脑,2006(5):78-79.
[14]国家语委语言文字应用研究所计算语言学研究室.信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20.
[15]LEVENSHTEIN V.Binary Codes Capable of Correcting Deletions,Insertions,and Reversals[J].Soviet Physics Doklady,1966,10(8):707-710.
[16]黄林晟,邓志鸿,唐世渭,等.基于编辑距离的中文组织机构名简称-全称匹配算法[J].山东大学学报:理学版,2012,47(5):43-48.
[17]袁晓峰.基于《知网》的词语相似度计算研究[J].成都大学学报:自然科学版,2011,30(4):339-341.