基于模糊匹配的Lucene检索应用
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Lucene retrieval application based on fuzzy matching
  • 作者:钱柯
  • 英文作者:QIAN Ke;Jiangsu University of Science and Technology Computer Science and Engineering Department;
  • 关键词:站内检索 ; Lucene ; 模糊匹配 ; 纠错
  • 英文关键词:search within the station;;Lucene;;fuzzy matching;;error correction
  • 中文刊名:GWDZ
  • 英文刊名:Electronic Design Engineering
  • 机构:江苏科技大学计算机科学与工程学院;
  • 出版日期:2018-01-05
  • 出版单位:电子设计工程
  • 年:2018
  • 期:v.26;No.375
  • 基金:江苏科技大学海洋装备研究院自培育项目(HZ2016004)
  • 语种:中文;
  • 页:GWDZ201801011
  • 页数:4
  • CN:01
  • ISSN:61-1477/TN
  • 分类号:58-61
摘要
随着大数据时代的到来,越来越多的站内搜索要求能够快速精准的查找到需要的内容。目前很多的站内搜索引擎是基于Lucene检索包来实现的,流行的solr检索服务器其底层也是基于Lucene检索包。然而普通的Lucene检索无法实现对用户输入的查询语句进行简单的纠错处理,这使得检索不够智能化。本文提出一种基于模糊匹配的Lucene检索,它能够对用户输入的查询语句进行简单的纠错处理,返回所有可能的检索结果,这使得Lucene检索能够更加精确及人性化,提高了检索的准确率。
        With the development of big data, more and more site-search need to search content quickly and exactly.now, many site searches are based on lucene package, The popular solr search server is also based on its underlying Lucene retrieval package.common lucene search cannot solve user' s inputting query in error correction processing, it makes search not intelligent enough. This paper presents a fuzzy matching based Lucene retrieval which can perform simple error correction on the user input query and return all possible search results, which makes the Lucene retrieval more precise and humanistic, and improves the retrieval accuracy.
引文
[1]马晖男,吴江宁,潘东华.一种基于同义词词典的模糊查询扩展方法[J].大连理工大学学报,2007(3):439-443.
    [2]周登朋,谢康林.Lucene搜索引擎[J].计算机工程,2007(18):95-96,118.
    [3]胡鹏飞.Lucene与中文分词技术的研究及应用[D].北京:北京交通大学,2010.
    [4]姜华.基于Lucene面向主题搜索引擎的研究与设计[D].上海:华东师范大学,2007.
    [5]柴洁.基于IKAnalyzer和Lucene的地理编码中文搜索引擎的研究与实现[J].城市勘测,2014(6):45-50.
    [6]刘平冰.基于Lucene的Web站内信息搜索系统[D].成都:电子科技大学,2005.
    [7]王庆文,裴彦纯,周建慧,等.一种本体与Lucene融合的工艺知识检索方法[J].制造业自动化,2015(23):151-156.
    [8]姜元爽,谭培,刘馨元,等.基于Lucene的垂直搜索引擎的设计与实现[J].福建电脑,2015(12):21-22.
    [9]罗宁,徐俊刚,郭洪韬.基于Lucene的中文分词模块的设计和实现[J].电子技术,2012(9):54-56.
    [10]胡长春.基于Lucene的中文自然语言搜索引擎[D].上海:上海交通大学,2009.
    [11]朱蓉.基于模糊理论的查询技术研究[J].计算机应用研究,2003(5):8-10,29.
    [12]李建华,王晓龙,王平,等.多特征的中文文本校对算法的研究[J].计算机工程与科学,2001(3):93.
    [13]张仰森.基于二元接续关系检查的字词级自动查错方法[J].中文信息学报,2001,15(3):36-43.
    [14]李永春,丁华福.Lucene的全文检索的研究与应用[J].计算机技术与发展,2010(2):12-15.
    [15]白晓玲.Lucene全文检索系统的实现及其索引性能的提高[J].情报探索,2010(1):116-118.
    [16]冯宇.基于模糊层次分析法的Lucene网页排序算法研究[J].计算机与现代化,2011(1):124-126.
    [17]周凤丽,林晓丽.基于Lucene的Web搜索引擎的研究和实现[J].计算机技术与发展,2012(1):140-142,160.
    [18]秦杰,宋金玉,张广星.基于Lucene的本地搜索引擎研究与实现[J].计算机科学,2014(S2):368-370,407.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700