基于关键组件重组的OpenXML复合文档修复方法
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:OpenXML Compound Document Recovery Method Based on Recombination of Key Components
  • 作者:杨东煜 ; 王晓梅 ; 郑遥
  • 英文作者:YANG Dongyu;WANG Xiaomei;ZHENG Yao;Information Engineering University;
  • 关键词:OpenXML复合文档 ; 鲁棒性 ; 关键组件 ; 重组 ; 修复
  • 英文关键词:OpenXML compound document;;robustness;;key component;;recombination;;recovery
  • 中文刊名:XXGC
  • 英文刊名:Journal of Information Engineering University
  • 机构:信息工程大学;
  • 出版日期:2018-10-15
  • 出版单位:信息工程大学学报
  • 年:2018
  • 期:v.19;No.93
  • 基金:西南电子电信技术研究所资助项目(2014024)
  • 语种:中文;
  • 页:XXGC201805014
  • 页数:6
  • CN:05
  • ISSN:41-1196/N
  • 分类号:72-77
摘要
现代通信业务中,复合文档占据较大比重,由于文件传输过程中的解调误码和阻塞丢包等原因,接收的复合文档由于高误码常无法打开,无法获得其携带的有效内容。以OpenXML复合文档中的Word 2007文档为对象展开研究,利用文档自身的鲁棒性,提出一种基于关键组件重组的OpenXML复合文档修复方法,通过某些关键XML文件和关系文件重新构造复合文档,实现对破损复合文档承载信息的最大化获取。
        Compound documents occupy a large proportion in modern communication service.In the transmission of the documents,the received compound documents usually can't be opened because of the high bit error rate,so that it is unable to obtain the effective contents from them.To solve this problem,the paper selects the version of 2007 Word documents as objects for in-depth study.Based on the recombination of key components,a recovery method is proposed by using the robustness of the documents.The method presents an idea that OpenXML compound documents can be reconstructed through some key XML files and relational files,which achieves maximum acquisition of the information contained in the broken compound documents.
引文
[1] 李兵兵,王衍波,徐敏,等.一种Word 2007中可无源检测的信息隐藏方法[J].计算机技术与发展,2010,20(5):154-157.
    [2] FU Z,SUN X,LIU Y.Forensic investigation of OOXML format documents[J].Digital Investigation,2011,8(1):48-55.
    [3] LIU TY,TSAI WH.A new steganographic method for data hiding in microsoft word documents by a change tracking technique[J].IEEE Transactions on Information Forensics & Security,2007,2(1):24-30.
    [4] 阎芳,李元章,张全新,等.基于对象的OpenXML复合文档去重方法研究[J].计算机研究与发展,2015,52(7):1546-1557.
    [5] 张武.损坏或分片OOXML文档的文本内容恢复技术研究[D].杭州:杭州电子科技大学,2014.
    [6] 沙晶,钱伟.微软复合文档结构分析及文件恢复[J].中国司法鉴定,2011,59(6):59-61.
    [7] 洪先强,王晓梅,范亮,等.基于RTP协议的流媒体数据容错误别算法研究[J].信息工程大学学报,2017,18(6):108-112.
    [8] 程睿.基于OpenXML的docx文档的创建和修改工具[D].大连:大连理工大学,2013.
    [9] 李兵兵,王衍波,徐敏.基于ZIP文档格式的信息隐藏技术[J].计算机工程,2011,37(5):155-157.
    [10] 廖琪男.基于Word和PPT文档图像的信息隐藏[J].计算机工程,2010,36(10):163-164.
    [11] 王刚,刘立柱.ZIP文件压缩编码分析[J].微计算机信息,2006,22(15):283-285.
    [12] 许家铭,李晓东,金键,等.一种高效的多模式字符串匹配算法[J].计算机工程,2014,40(3):315-321.
    [13] T Lecroq.Experimental results on string matching algorithms[J].Software Practice & Experience,1996,25(7):727-765.
    [14] 李雪莹,刘宝旭,许榕生.字符串匹配技术研究[J].计算机工程,2004,30(22):24-26.
    [15] 吴燕玲,牛熠,陈显龙,等.SIP信令压缩的研究[J].计算机工程,2008,34(11):126-128.
    [16] Brown R D.Improved recovery and reconstruction of DEFLATEd files[J].Digital Investigation,2013,10(8):S21-S29.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700