政府公开信息自动标引的设计与实现
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Design and Implementation of Automatic Indexing of Government Public Information
  • 作者:江华丽 ; 曹祺 ; 陈刚
  • 英文作者:JIANG HuaLi;CAO Qi;CHEN Gang;School of Cyber Science and Engineering, Wuhan University;Greysh Group Co., Ltd.;
  • 关键词:政府信息公开 ; 文本挖掘 ; 自动化标引
  • 英文关键词:Government Information Disclosure;;Text Mining;;Automated Indexing
  • 中文刊名:SZTG
  • 英文刊名:Digital Library Forum
  • 机构:武汉大学国家网络安全学院;灰觋集团有限公司;
  • 出版日期:2019-01-25
  • 出版单位:数字图书馆论坛
  • 年:2019
  • 期:No.176
  • 语种:中文;
  • 页:SZTG201901007
  • 页数:7
  • CN:01
  • ISSN:11-5359/G2
  • 分类号:45-51
摘要
目前政府信息公开主要依据《中华人民共和国政府信息公开条例》,但站在用户视角,需要根据不同的使用场景进行适配,因此对公文进行自动化标引具有重要意义。本文基于自然语言处理技术,通过词频、词性和词义的实验和分析,提炼公文标题中的范式,对国务院1969—2018年的4 388条公文进行自动化标引。其中以地域关键词和行业关键词为例进行标引,标引后提炼相关关键词可以供相关渠道进行搜索和二次加工。本文主要处理标题的标引,尚未对全文进行标引。
        At present, government information disclosure is mainly based on the "Regulations on the Openness of Government Information of the People's Republic of China", but from the perspective of users, it needs to be adapted according to different usage scenarios. Therefore, it is of great significance to automate indexing of official documents. Based on natural language processing technology, this paper refines the paradigm in the official document title through the experiment and analysis of word frequency, part of speech and word meaning, and automatically indexes 4 388 official documents of the State Council from 1969 to 2018. In the case of regional keywords and industry keywords as an example, the relevant keywords can be searched and secondary processed after indexing. This article mainly deals with the indexing of the title, and the full text has not been indexed.
引文
[1]中华人民共和国政府信息公开条例[J].中华人民共和国国务院公报,2007(15):15-18.
    [2]李盛.《中华人民共和国政府信息公开条例》的制定背景、主要内容及目录编制[J].电子政务,2008(5):21-26.
    [3]贾君枝,闫晓美,武晓宇.政府信息公开的自动标引的设计与实现[J].情报理论与实践,2012,35(2):109-113.
    [4]张新民,罗卫东.我国政府信息公开工作中的技术问题探析[J].图书情报工作,2008(8):58-61.
    [5]吴洁明,赵文丽.新闻出版行业标准碎片化标引的研究与实现[J].计算机工程与设计,2017,38(8):2281-2286.
    [6]邓雪琳.改革开放以来中国政府职能转变的测量——基于国务院政府工作报告(1978—2015)的文本分析[J].中国行政管理,2015(8):30-36.
    [7]朱晓峰,崔露方,陆敬筠.国内外政府信息公开研究的脉络、流派与趋势——基于WOS与CNKI期刊论文的计量与可视化[J].现代情报,2016,36(10):141-148.
    [8]王志刚.政府理念和经济增长:基于文本挖掘[J].经济社会体制比较,2016(6):5-6.
    [9]潘松.国务院公报中成语的运用[J].宿州学院学报,2011,26(1):54-57.
    [10]程大荣.从《国务院公报》看“意见”处理的规范化[J].档案学通讯,2015(1):35-38.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700