大数据驱动下情报研究知识库构建的关键技术及实现
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Key Technologies and Their implementation of Intelligence Analysis Knowledge Base Driven by Big Data
  • 作者:宋小康 ; 何劲 ; 王曰芬
  • 英文作者:Song Xiaokang;
  • 关键词:大数据 ; 情报研究知识库 ; 文本语义空间 ; 知识地图 ; 自然语言处理 ; 深度学习
  • 英文关键词:big data;;intelligence analysis knowledge base;;text semantic space;;knowledge map;;natural language processing;;deep learning
  • 中文刊名:QBLL
  • 英文刊名:Information Studies:Theory & Application
  • 机构:南京理工大学经济管理学院;江苏省社会公共安全科技协同创新中心;
  • 出版日期:2019-01-30
  • 出版单位:情报理论与实践
  • 年:2019
  • 期:v.42;No.300
  • 基金:国家社会科学基金重大招标项目“面向知识创新服务的数据科学理论与方法研究”的成果之一,项目编号:16ZDA224
  • 语种:中文;
  • 页:QBLL201901006
  • 页数:7
  • CN:01
  • ISSN:11-1762/G3
  • 分类号:38-44
摘要
[目的/意义]情报研究知识库的构建不仅需要依赖现有的知识库构建方法与技术来实现,而且需要针对情报研究目标对关键技术进行扩展与创新。[方法/过程]文章利用自然语言处理和深度学习的方法,探究情报研究知识库构建中用于文本知识抽取和组织的文本语义空间技术以及用于专家定位的专家知识地图技术。[结果/结论]文章提出包含文本集、特征词贡献集和特征词语义关联集的文本语义空间,以及包含领域术语关联和专家合作关联的专家知识地图,详细阐述具体步骤并以石墨烯领域数据进行实现。
        [Purpose/significance]The construction of intelligence analysis knowledge base needs to not only rely on the existing knowledge base construction methods and technologies,but also expand and innovate the key technologies in specific to the information research target. [Method/process] Using the methods of natural language processing and deep learning,this paper explores the text semantic space technology for text knowledge extraction and organization and expert knowledge map technology for expert positioning in the construction of intelligence analysis knowledge base. [Result/conclusion] The paper puts forward the text semantic space including text set,term contribution set and term semantic association set,as well as expert knowledge map including domain terminology association and expert cooperation association. The specific steps are described in detail and experiment is conducted by using graphene field data.
引文
[1]李广建,化柏林.大数据分析与情报分析关系辨析[J].中国图书馆学报,2014(5):14-22.
    [2]赖茂生.新环境、新范式、新方法、新能力——新时代情报学发展的思考[J].情报理论与实践,2017,40(12):1-5.
    [3]苏新宁.大数据时代情报学与情报工作的回归[J].情报学报,2017,36(4):331-337.
    [4]胡耀娟,金娟,张卉,等.石墨烯的制备、功能化及在化学中的应用[J].物理化学学报,2010,26(8):2073-2086.
    [5] 2017年中国石墨烯行业发展现状及企业竞争格局分析[EB/OL].[2018-04-12]. http://www. chyxx. com/industry/201707/544405. html.
    [6]彭彦淇.石墨烯专利与论文的引文分析及比较研究[D].南京:南京大学,2016.
    [7]邓珞华.图书情报数学[M].长春:东北师范大学出版社,1983.
    [8]邱均平,王菲菲.数字文献资源语义化计量本体的提出与构建[J].情报学报,2014(10):1012-1021.
    [9] SALTON G,WONG A,YANG C S. A vector space model for automatic indexing[J]. Communications of the ACM,1975,18(11):613-620.
    [10]路永和,李焰锋.改进TF-IDF算法的文本特征项权值计算方法[J].图书情报工作,2013,57(3):90-95.
    [11]黄承慧,印鉴,侯昉.一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J].计算机学报,2011,34(5):856-864.
    [12]吴志祥,王昊,王雪颖,等.基于奇异值分解的专利术语层次关系解析研究[J].情报学报,2017,36(5):473-483.
    [13]武永亮,赵书良,李长镜,等.基于TF-IDF和余弦相似度的文本分类方法[J].中文信息学报,2017,31(5):138-145.
    [14]李兰彬.面向专题情报服务的领域知识库构建平台研究[D].南京:南京理工大学,2015.
    [15]邱均平,王菲菲.数字文献资源语义化计量本体的提出与构建[J].情报学报,2014(10):1012-1021.
    [16]郭璇,吴文辉,肖治庭,等.基于深度学习和公开来源信息的反恐情报挖掘[J].情报理论与实践,2017,40(9):135-139.
    [17] RONG X. Word2vec parameter learning explained[EB/OL].[2018-05-03]. https://arxiv. org/pdf/1411. 2738. pdf.
    [18] BROOKES B C. The foundations of information science:Part I,philosophical aspects[J]. Journal of Information Science,1980,2(5):125-133.
    [19]王曰芬,邵鹏,王新昊,包昌火.情报研究中知识地图的应用探索[J].图书情报工作,2006(12):83-87.
    [20]夏立新,王忠义,张进.图书馆专家知识地图的XTM构建方法研究[J].中国图书馆学报,2009,35(2):47-52.
    [21]付允,牛文元,汪云林,等.科学学领域作者合作网络分析——以《科研管理》(2004—2008)为例[J].科研管理,2009,30(3):41-46.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700