数字式图书馆海量文献数据查询优化仿真
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Digital Library Mass Document Data Query Optimization Simulation
  • 作者:谢燕
  • 英文作者:XIE Yan;Bao ji University of Arts and Sciences;
  • 关键词:文献数据 ; 查询优化 ; 查询速度 ; 平均准确率 ; 查全率
  • 英文关键词:Literature data;;Query optimization;;Query speed;;Average accuracy rate;;Recall rate
  • 中文刊名:JSJZ
  • 英文刊名:Computer Simulation
  • 机构:宝鸡文理学院;
  • 出版日期:2019-06-15
  • 出版单位:计算机仿真
  • 年:2019
  • 期:v.36
  • 语种:中文;
  • 页:JSJZ201906088
  • 页数:4
  • CN:06
  • ISSN:11-3724/TP
  • 分类号:432-435
摘要
探究有效的海量文献数据查询优化方法,能够提高数据查询的运行速度,加快响应时间,增强查全率,在使用过程中具有重要的现实意义。为了解决查询海量数据时存在响应时间较长、运行速度较慢、准确率较低等问题,提出基于改进遗传算法的数据查询优化方法,利用稀疏表示哈希算法构建海量文献数据模型,获取抽象空间中文献和文本信息的特征表示,计算二者隐藏在语义空间的相关近似值,得到海量文献数据目标函数。运用梯度将目标函数转换成新的适应度函数,利用函数值变化机率优化适应度函数,将十进制实数编码加入遗传算法中,根据概率选取染色体具有最小函数值时,由该值获取最优查询结果。仿真结果证明,所提方法在保证较短的平均响应时间和平均查询速度的基础上,提高查询的平均准确率和查全率。
        The effective optimization method of massive literature data query can improve the speed of data query, accelerate response time and enhance recall rate. Therefore, this method has practical significance. In order to solve the problem about the long response time, slow running speed and low accuracy in querying massive data, this paper puts forward a method to optimize data query based on improved genetic algorithm. Firstly, the sparse representation hashing algorithm was used to construct the model of massive literature data and obtain characteristic representation of literature and text information in abstract space. Secondly, the correlation approximate values of the two hidden in the semantic space were calculated and the objective function of massive literature data was obtained. Moreover, the gradient was used to transform objective function into new fitness function. Meanwhile, the change probability of function was used to optimize the fitness function. Then, decimal real-number coding was added into the genetic algorithm. According to the probability, when the chosen chromosome had the minimum function value, the optimal query result could be obtained. Simulation results show that the proposed method can improve the average accuracy rate and recall rate of query based on the short average response time and average query speed.
引文
[1] 国爱民.大数据环境下图书馆文献资源建设模式的变革[J].黑龙江科学,2016,7(24):152-153.
    [2] 席璇方.大数据时代背景下高校图书馆文献采访模式的优化[J].宝鸡文理学院学报(社会科学版),2017,37(5):114-117.
    [3] 胡祖辉.学生成绩管理系统数据查询优化方法研究[J].软件导刊,2016,15(9):149-151.
    [4] 王德文,李静芳.变电设备状态监测大数据的查询优化方法[J].电力系统自动化,2017,41(2):165-172.
    [5] 徐德智,刘扬,Sarfraz Ahmed.基于Hadoop的RDF数据存储及查询优化[J].计算机应用研究,2017,34(2):477-480.
    [6] 樊红珍.基于神经网络的数据库优化查询方法研究[J].电脑知识与技术,2017,13(4):1-3.
    [7] 陈芬,唐彦.基于杂交变异粒子群优化算法的数据库查询优化[J].淮海工学院学报:自然科学版,2016,25(4):8-11.
    [8] 王晓英.海量冗余数据干扰下数据库中数据优化检索方法[J].华侨大学学报(自然版),2016,37(6):758-761.
    [9] 刘哲.大型数据库需求信息实时查询优化仿真[J].计算机仿真,2017,34(1):427-430.
    [10] 王秋琳,宋立华,闫丽飞,等.一种非结构化数据查询优化存储系统设计[J].电子设计工程,2017,25(13):16-20.
    [11] 朱明,王志瑞.基于Hbase的大数据查询优化[J].智能计算机与应用,2017,7(4):59-61.
    [12] 郭玲.基于本地敏感信息过滤的大数据查询优化算法研究[J].广东技术师范学院学报,2016,37(11):47-52.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700