基于语义结构的科技论文抄袭检测
详细信息   全文下载|推荐本文 |
  • 出版年:2010
  • 作者:韩冰;林鸿飞
  • 单位1:大连理工大学计算机科学与工程系
  • 学历:硕士生
  • 语种:中文
  • 作者关键词:科技论文;抄袭检测;bootstrapping加权相似度
  • 起始页:517
  • 总页数:7
  • 经费资助:国家自然科学基金资助项目(编号:60373095,60673039,60973068)、国家社会科学基金(编号:08BTQ025)和国家863高科技计划资助项目(编号:2006AA01Z151)。
  • 刊名:情报学报
  • 是否内版:否
  • 刊频:双月刊
  • 创刊时间:1982
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会;中国科学技术信息研究所
  • 主编:武夷山
  • 地址:北京市复兴路15号
  • 邮编:100038
  • 电子信箱:qbxb@istic.ac.cn
  • 网址:http://www.cssti.org.cn
  • 卷:29
  • 期:3
  • 期刊索取号:P965.5066 547
  • 数据库收录:INSPEC(科学文摘);LISA(图书馆和信息科学文摘);РЖ(俄罗斯文摘杂志);中国科技论文与引文数据库(中国科学技术信息研究所);中文社会科学引文索引(南京大学);中国学术期刊文摘(中国科协);中国期刊全文数据库(同方);数字化期刊全文数据库(万方)
摘要
当前科技论文抄袭比较严重,但针对科技论文抄袭的自动检测的研究还不够。科技论文的抄袭检测是重复的表示形式之一,可按照改动的程度分为全文抄袭、章节抄袭、段落抄袭、句子抄袭、同义词替换抄袭、思想抄袭等几种表现形式。本文针对剽窃全部或全部原文,并加以删改或段落移动的情况,首先采用基于bootstrapping算法扩展科技论文的主题词,根据主题词的交集划分重复检测候选组;然后提出基于滑动窗口的加权相似度算法,并通过相似曲线图较为直观的表现计算结果,取得了较好的研究效果。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700