自然语言空间查询中应用编辑距离的规则匹配模型
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Research on Rule Matching in Natural Language Spatial Query Based on Levenshtein Distance
  • 作者:盖森 ; 刘建忠 ; 熊伟 ; 张心悦 ; 李江鹏
  • 英文作者:GE Sen;LIU Jianzhong;XIONG Wei;ZHANG Xinyue;LI Jiangpeng;Information Engineering University;61206 Troops;
  • 关键词:编辑距离 ; 规则匹配 ; 自然语言 ; 空间查询 ; 信息检索
  • 英文关键词:levenshtein distance;;rule matching;;natural language;;spatial query;;infromation retrieval
  • 中文刊名:JFJC
  • 英文刊名:Journal of Geomatics Science and Technology
  • 机构:信息工程大学;61206部队;
  • 出版日期:2016-01-08 11:20
  • 出版单位:测绘科学技术学报
  • 年:2015
  • 期:v.32
  • 基金:国家自然科学基金项目(41471337)
  • 语种:中文;
  • 页:JFJC201504018
  • 页数:6
  • CN:04
  • ISSN:41-1385/P
  • 分类号:89-94
摘要
自然语言空间查询是智能信息检索在GIS领域的扩展。自然语言的自由灵活性在降低用户查询难度的同时,也对查询语句的规则匹配增加了难度。鉴于此,提出基于编辑距离的规则匹配模型。在词语层面,计算编辑相似度和语义相似度提供候选项,通过用户选择来建立未登录词与空间词库的匹配关系;在语句层面,应用编辑距离的思想来实现未登录句式的规则匹配。最后,开发了规则匹配工具,通过实验验证了模型的可行性。
        Natural language spatial query is the expansion of intelligent information retrieval in GIS. The flexibility of natural language reduces the query difficulty for users,and meanwhile increases the rule matching difficulty of query sentences. Owing to this,a rule matching model was put forward based on levenshtein distance. In the word level,candidate words were provided through edit similarity and semantic similarity,which could establish the relation between unknown words and spatial thesaurus. In the sentence level,the idea of levenshtein distance was used to realize the rule matching of unknown sentence structure. Finally,a rule matching tool is developed,which verifies the feasibility of the model.
引文
[1]李滨.自然空间查询语言解译机制研究[D].郑州:信息工程大学,2009:15-16;7;120;37-38;84-85;120-122.
    [2]马林兵,龚健雅.面向自然语言的空间数据库查询研究[J].计算机工程与应用,2003,39(22):16-19.
    [3]丁振波.浅析智能信息检索系统中存在的问题及解决思路[J].科教文汇(中旬刊),2009(3):279.
    [4]周碧英.基于自然语言的文本智能检索技术研究[D].西安:西北大学,2013:2.
    [5]马林兵,龚健雅.空间信息自然语言查询接口的研究与应用[J].武汉大学学报:信息科学版,2003,28(3):301-305.
    [6]马晓娜,杨承磊.自然语言查询系统中的句法分析与算法实现[J].山东建筑工程学院学报,2005(1):76-81.
    [7]邓敏,黄雪萍,刘慧敏,等.利用自然语言空间关系的空间查询方法研究[J].武汉大学学报:信息科学版,2011,36(9):1089-1093.
    [8]杜清运,任福.空间信息的自然语言表达模型[J].武汉大学学报:信息科学版,2014,39(6):682-688.
    [9]明小娜,龙毅,钱程扬,等.基于受限自然语言的GIS命令解析方法[J].地球信息科学学报,2009,11(2):183-188.
    [10]PANG YAO,LONG YI,QIAN CHENYANG,et al.Research in a Chinese Word Segmentation Method Based on Spatial Information Query of GIS[C]∥Geoinformatics 2008 and Joint Conference on GIS and Built Environment.Proceedings of SPIE.Riga,Latvia,2008,7143:71430I-1-8.
    [11]马竹根.一种自然语言理解中语法分析的算法设计和实现[J].计算机时代,2005(10):8-10.
    [12]胡婕,李跃新.数据库受限汉语自然语言查询的分词研究与实现[J].湖北大学学报:自然科学版,2005(4):331-335.
    [13]胡晓军.数据库自然语言查询接口探讨[J].福建电脑,2006(5):78-79.
    [14]国家语委语言文字应用研究所计算语言学研究室.信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20.
    [15]LEVENSHTEIN V.Binary Codes Capable of Correcting Deletions,Insertions,and Reversals[J].Soviet Physics Doklady,1966,10(8):707-710.
    [16]黄林晟,邓志鸿,唐世渭,等.基于编辑距离的中文组织机构名简称-全称匹配算法[J].山东大学学报:理学版,2012,47(5):43-48.
    [17]袁晓峰.基于《知网》的词语相似度计算研究[J].成都大学学报:自然科学版,2011,30(4):339-341.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700