用户名: 密码: 验证码:
金文操作平台及金文资料库系统的设计与实现
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
金文是汉字发展史上的一个重要阶段,由于历代的研究和发现,已经积累了大量的金文资料。如果能够在计算机中输入金文并对金文进行编辑,能够用计算机来管理所有的金文资料,将大大地为考古工作者和其他的用户提供便利。但是现有的计算机系统并不支持金文文字的操作,本文通过对现有系统及相关计算机技术的研究,建立了金文操作平台和金文资料库系统,使金文研究的计算机化成为可能,并为古籍数字化提供了一种新的思路。
     要建立金文操作平台,必须首先建立金文文字的字库,然后再编制输入法软件。汉字编码字符集所依托的体系结构,可以分为三种:国际标准化组织ISO的ISO/IEC2022所定义的体系结构,ISO/IEC 10646和Unicode所定义的体系结构,以及非ISO所定义的体系结构。本文通过对多种编码体系和字符显示技术的比较分析,作者选择了Unicode字符集和TRUETYPE字体技术来建立金文隶定字库和金文原篆字库,并通过剖析windows操作系统对多语言和输入法支持的内部机制,阐述了输入法实现的基本原理,基于系统提供的编程接口,开发了金文原篆输入法的原型系统。用户只需在写作窗口中输入原篆字的编码,在候选窗口中就会显示所有对应编码的原篆字,用户可以前后翻页,可以选择需要输入的原篆字,确认后被选择的原篆字就会输入编辑软件中。在输入法内部码表实现中,采用了哈希表与顺序查找相结合的方法,提高了字符的查找速度。
     金文资料包括文本、图片、拓片。根据金文资料的特征,作者提出了建立金文资料库的流程和建库方案。通过对金文资料分类整理,建立金文资料信息数据库,用MS Access建立数据库,以Visual C++6.0作为开发工具,并采用最新的数据库OLEDB接口,使得实现的管理系统检索快捷、浏览方便、操作简单。可以方便地根据器物名称、时代、出土年代、馆藏等符合条件的记录,并支持多个条件的组合模糊查询。而且,通过自带的金文隶定字库,可实现对任意原篆字的全文检索。对于查询结果,可以实现图片、文本的分屏显示,也可以进行全屏显示。另外,还可以根据分类来浏览所有的金文资料。系统有很好的输出功能,支持文本、图像的保存和打印。利用此系统,可以很好地帮助考古工作者提高效率,从根本上改变原有的研究方法。
     由于中国汉字发展经历了不同的时期,本文中的所有研究成果亦适用于其他文字系统,如甲骨文,或其他少数民族文字系统的建立。作为一个软件产品,作者编制实现的系统还有许多地方需要改进和完善,最后提出了还需考虑的问题。
As we known, the Chinese history is long. Our ancestors left many civilizations for us, including a large amount strange ancient words and books. The uses of Inscriptions on bronze (IOB) is an important phase of the development of the Chinese. Many experts and scholars engaged to research and discovery remnants of IOB and their achievements accumulated many IOB data. If the IOB can be directly handle by the edit software and all the IOB data can be managed with computer, it will provide great convenience for the work of the archaeologists who research IOB. Base on the research of some existing software systems and relative computer technology, this paper discussed to create an operation platform of IOB and build a computer manage system of the IOB data. The result made it possible to research IOB with computers and it also provided a new idea for the digitalization of the ancient books.
    In order to create an operation platform of IOB, at first we must to create a word library which decided the character's shape displaying on the screen or other output devices, then to program a input method editor (IME) software. The character set architecture of Chinese can be classified to three kinds: defined by ISO/IEC 2022 of ISO, defined by SO/IEC 10646 and Unicode and defined by no-ISO. Comparing three character code architectures and some character display technologies, the author selected the Unicode character code architecture and TrueType technology to create IOB word library. Moreover, through analyzing the kernel mechanism of the Windows OS supporting Multilanguage and IME, the author explained the basic principles of IME and developed a model system of IME of IOB based on the API provided by OS. If the user input the codes of IOB in the composition window, all the relative IOB will display in the candidate window. The user can page and select the IOB word which he need in the candidate window
    and the IOB word have been selected automatically will be input to the edit software. At the actualization of the inner code table, the hash table and the sort search are integrated to improve the speed of searching character.
    The IOB data include texts and images and rubbings. According the character of the IOB data, the author provided a process to build IOB data base and a method to create IOB database with MS Access 2000. Based on the database, the author implemented a manage system of all the IOB data with the new OLE API and Visual C++ 6.0. The user can search the data with combined keyword or any word of the text, browser and output any data which they need. The new manage system will facilitate the work of the archaeologists who research IOB with rapid search, convenient scan and easy operation.
    All the results of the paper can be applied to create other ancient words and minority words system. As a software product, something of the IOB system has to be improved and updated. At the end of the paper, the author gave some advices to finish the IOB system.
引文
[1] 吴镇烽.金文字库及金文资料全文检索系统建设立项申请书.陕西省考古所.2000.8
    [2] 金文字库及金文资料全文检索系统编制方案.西安大东国际数据股份有限公司.2001
    [3] 肖珑.互联网上的全文数据库与全文服务.大学图书馆学报.2000(3)
    [4] 杨朝霞.古籍数字资源述略.大学图书馆学报.2000(3)
    [5] 王晓波.大规模古籍电子化关键技术及实现.清华大学硕士研究生毕业论文.2000
    [6] 上海图书馆古籍数字化的初步尝试《图书馆杂志》刘祎 1997.4
    [7] 戴庆夏、许寿椿等.中国各民族文字与电脑信息处理.中央民族学院出版社.1991
    [8] 尼玛扎西,拥错,次仁罗布.一种基于《信息交换用藏文编码字符集》国际、国家标准的藏文windows平台的实现方案.西藏大学学报(汉文版)2001(1):39~52
    [9] 巩政,敖其尔等.windows环境下实现蒙文文字处理方法的研究与设计.内蒙古大学学报(自然科学版).1999(3):390~391
    [10] 钱培德,吕强,王悦.一个独立于windows多文种平台的本地化应用系统解决方案.计算机工程与科学.1999(6)
    [11] 张桂平,尹宝生等.新一代windows多文种处理平台——“环球使者”的设计与实现.中文信息学报.1998(2)
    [12] 王扶轮,徐向荣.自带中文环境的windows编程技术及实现—兼谈多内码汉字平台技术.华东冶金学院学报 1998(3):295~297
    [13] 数字化进程中的中华文明.http://book.people.com.cn/gb/paper18/hwz64895/htm
    [14] 中国数字图书馆的建设与起步.http://www.wxlib.j
    [15] Nadine Kano著,郑全战等译.Windows 95/NT 国际软件开发指南.清华大学出版社.1998年第1版
    [16] GB108030编码标准.http://www.founder.com.cn/fontweb/jishujl/aboutGB18030.htm
    [17] UNICODE组织网.http://www.unicode.org
    [18] ISO 2022,ISO 10646与非ISO的代码体系结构.http://www.unihan.com.cn//cjk/1.htm
    [19] Code Page代码页与ISO/IEC 10646和Unicode.http://www.unihan.com.cn//cjk/ana02.htm
    [20] GBK与CJK.http://www.unihan.com.cn//cjk/ana17.htm
    [21] UTF-8. http://www.unihan.com.cn//cjk/ana18.htm
    [22] UTF-16. http://www.unihan.com.cn//cjk/ana19.htm
    [23] 刘启文,曾大亮,江国星.在MS—windows环境下显示汉字的方法.微电子学与计算机 1995(4):55~56
    [24] 石永久.windows环境下矢量汉字的使用.计算机应用研究.1998(2):67~71
    [25] 王瑜,黄源,张福炎.windows中True Type字形数据的存取技术.小型微型计算机系统 1997(1):75~81
    [26] 闻申生.字形技术的现状和趋势—兼谈windows平台字型技术True Type.电子出版 1995(2)
    [27] 吕强等.True Type文件格式初探,计算机研究与发展.1995(11)
    [28] 汤子瀛等编著.计算机操作系统.西安电子科技大学出版社.1996年第1版
    [29] 屠祁、屠立德等.操作系统基础.清华大学出版社.2000年第3版
    [30] 张海藩.软件工程导论.清华大学出版社.1998年第3版
    
    
    [31] 马锦林.软件工程引论.南京大学出版社.1987年
    [32] 张龙祥编著.UML与系统分析设计.人民邮电出版社.2001年第1版
    [33] 邵维忠,杨芙清著.面向对象的系统分析.清华大学出版社.1998
    [34] Peter Cord,Edward Yourdon著.邵维忠等译.面向对象的分析.清华大学出版社.1998
    [35] Karl E.Wiegers著,陆丽娜等译.软件需求.机械工业出版社.2000年第1版
    [36] Meilir Page-Jones著.包晓露、赵晓玲等译.UML面向对象设计基础.人民邮电出版社.2001年第1版
    [37] Erich Gamma等著,李英军等译.设计模式可复用面向对象软件的基础.机械工业出版社.2000年第1版
    [38] 张冬慧.获取五笔字型编码表供windows生成码表文件程序.计算机时代1996(6):31~35
    [39] 罗烈雷.用中文windows创建自己的汉字输入方法.计算机系统应用1996(5):34~35
    [40] 付军,朱宏.在windows’95中自建汉字输入法.松辽学刊(自然科学版)1998(2):75~79
    [41] 陈柏润.为windows创建Unicode内码输入法.计算机应用1999(3):58~59
    [42] 高骏,张红军.增加中文windows输入法初探.郑州工业大学学报 1998(4):107~111
    [43] 曹建.使用windows 95输入法生成器创建中文输入法.电脑技术1998(6):21~22
    [44] 吴小岭.在Word中扩展windows 95的区位符号输入法.电脑技术1998(9):17~18
    [45] 于仁师,陈龙猛,李立健.给中文windows扩充汉字输入法的程序.电脑学习1997(4):22~24
    [46] 黄王乐.为中文windows增加汉字输入法的通用方法.广西师范大学学报(自然科学版)1997(3):41~44
    [47] 吕强,夏晓燕,朱巧明.试论windows 3.1中文平台上汉字输入法的实现.计算机研究与发展1995(11):16~22
    [48] 陈毅东,李绍滋,李堂秋.利用windows消息实现应用程序控制.计算机应用研究 2001年04期
    [49] 段红光,杨虹.windows消息处理的分析.数字通信.2000(1)
    [50] 吕孝乐,许辉,王彬.在windows中传递消息.应用科技2002年(2)
    [51] 钱少先.windows下消息循环及运行机制.安庆师范学院学报(自然科学版)1997(2)
    [52] 杨亮,阮晓星,魏晋鹏.windows消息驱动机制中的核心技术分析.计算机应用研究1997(5):12~14
    [53] 戴志远.windows的消息系统及多任务机制.计算机系统应用1995(7)
    [54] 张安琳,黄道颖,李潢琦.windows程序的基本框架和消息机制.电脑开发与应用2001(8)
    [55] 秦相林.windows的程序设计特点及编程方法.微机发展1997(3)
    [56] 任丽敏,任丽宇.在windows环境编程.天津理工学院学报.1998(1)
    [57] 张长中,肖梓祥.windows中鼠标、键盘消息的拦截与处理.信息工程学院学报.2000(1)
    [58] 侯俊杰.深入浅出Windows MFC程序设计.华中理工大学出版社.1998年第1版
    [59] Al Williams.MFC技术内幕.机械工业出版社.1999年5月第1版
    [60] 唐宏祥.基于单汉字标引技术中文全文检索系统研究与设计.西安交通大学硕士研究生毕业论文.2000
    [61] 张左梁.C/S应用系统设计的新概念和新技术.计算机科学.1997(1):81~83
    [62] Jeffrey Richter著,王建华等译.Windows核心编程.机械工业出版社,2000年
    [63] Jeffrey Richter著,郑全战等译.Windows NT高级编程技术.清华大学出版社.1992年
    [64] 张之超,刘毅慧等.Windows程序设计.人民邮电出版社.1998年11月第1版
    [65] 严蔚敏等编著.数据结构(C语言版).清华大学出版社.1997年第1版
    
    
    [66] 殷人昆等编著.数据结构(用面向对象方法和C++语言描述).清华大学出版社.1999年第1版:364~388
    [67] 傅清祥,王晓东编著.算法与数据结构.电子工业出版社.1998年
    [68] 常明华.数据库技术及开发教程.电子工业出版社.2000年3月第1版
    [69] 罗运模 崔灿斌.SQL server7.0应用基础及开发实例.北京航空航天大学出版社.1999年9月第1版
    [70] 宛延闿.工程数据库系统.清华大学出版社.1999年7月第1版
    [71] Joe Greene,Advanced Information.Oracle 8服务器技术精粹.清华大学出版社.1999年7月第1版
    [72] 王宪成.Informix-OnLine原理及实用管理技术.电子工业出版社.1999年4月第1版
    [73] 王玉红 商作辉 王雪怀 林孝工.INFORMIX关系数据库系统管理与软件设计.中国水利水电出版社.1999年4月第1版
    [74] 刘辰 高月秋.ORACLE数据库系统——管理与应用.人民邮电出版社.1999年3月第1版
    [75] David Austin.Oracle 8使用指南.电子工业出版社.1999年3月第1版
    [76] 门槛创作室.ACCESS实战入门.科学出版社.2000年1月第1版
    [77] 王晟.Access 2000中文版使用入门与程序设计初步.人民邮电出版社.1999年10月第1版
    [78] 朱永春 尹显俊等.Access2000中文版实例与疑难解答出版社.电子工业出版社.2000年4月第1版
    [79] 李昭原主编.数据库技术新进展.清华大学出版社.1997.5第1版
    [80] 马垣.关系数据库理论.清华大学出版社 广西科学技术出版社.1999年4月第1版
    [81] 王珊.数据库系统基础.中国铁道出版社.1998
    [82] 萨师煊,王珊编.数据库系统概论.高等教育出版社.1991年第2版
    [83] 郑章、程刚等编著.Visual C++6.0数据库开发技术.机械工业出版社.1999年第1版:1~33,184~237
    [84] Lyn Robison著,黄惠菊、张捷等译.轻松掌握用Visual C++6对数据库编程.1999年第1版
    [85] 陈新.ODBC的原理、结构和开发技术探讨.小型微型计算机系统.1997(2),44~49
    [86] 毛惊琼,朱尚凑.ODBC技术在windows下的应用.计算机系统应用.1998(1)
    [87] 潘爱民著.COM原理与应用.清华大学出版社.1999年第1版:10~33,415~437
    [88] Don Box著,潘爱民译.COM本质论.中国电力出版社.2001年第1版
    [89] Ash Rofail Yasser Shohoud.COM与COM+从入门到精通.电子工业出版社.2000年4月第
    [90] 王柏、王红熳等.分布计算环境.北京邮电大学出版社.2000年第1版:68~85 Brian Overland.C++语言命令详解(第二版).电子工业出版社.2000年3月第1版
    [91] 张素智,范承亚.复合条件查询在FoxPro for windows中的实现.郑州轻工业学院学报(自然科学版)1997(2)
    [92] 梅勇,王群生,徐秉铮.基于FoxPro for windows的汉语语料库系统的构造.华南理工大学学报(自然科学版).1998(1)
    [93] 杨琪,李乔.运用DLL技术开发高级windows程序.交通与计算机2000(5):47~51
    [94] 宛延闿.C++语言和面向对象程序设计(第二版).清华大学出版社.1998年3月第1版
    [95] 吕风翥著.C++语言基础教程.清华大学出版社.1999年第1版
    [96] 官章全,刘加明编著.Visual C++类库大全.电子工业出版社.1999
    
    
    [97] 李佑民.VC数据库编程中的打印控制.电脑技术信息.2000(1):43~44
    [98] Steve Holzne.Visual C++6.0高级编程.人民邮电出版社.2000年2月第1版
    [99] Clayton Walnum.C++高级参考手册.电子工业出版社.2000年1月第1版
    [100] 何东健,杨青.实用图像处理技术.陕西科技出版社.1998第1版
    [101] Marshall Brain Lance Lovette.MFC开发人员指南.机械工业出版社 西蒙与舒斯特国际出版公司.1999年2月第一版
    [102] 齐舒创作室.Visual C++6.0用户界面制作技术与应用实例.中国水利水电出版社.1999年3月第1版
    [103] Kate Gregory.Visual C++6开发使用手册.机械工业出版社 西蒙与舒斯特国际出版公司.1999年2月第1版
    [104] Richard C.Leinecker,Tom Archer.Windows98编程实用大全.中国水利水电出版社.1999年1月第1版
    [105] Chris H.Pappas,William H.Murray,□.Visual C++6参考大全.北京希望电脑公司.1999年1月第1版
    [106] Michael J.Young.Visual C++6从入门到精通.电子工业出版社.1999年1月第1版
    [107] 陈建春.Visual C++高级编程技术——开发实例剖析.电子工业出版社.1999年9月第1版
    [108] 王晖.精通Visual C++6.0.电子工业出版社.1999年9月第1版
    [109] 郑蕾,张甲.中国信息产业如何面对21世纪的挑战.情报学报.1997(2):133~138
    [110] 王源,全文检索处理技术研究Ⅰ:汉字全文检索技术.情报学报.1977(1):50~56
    [111] 李志清.中文信息的无标引检索技术.情报学报.1997(2):106~112
    [112] Microsoft Corporation.TrueType 1.0 Font Files Technical Specification Revision 1.66 November 1995
    [113] Microsoft Corp. TrueType Font File version 1.00.1993
    [114] Microsoft Corporation.Nadine Kano .Developing international software for Windows NT and Windows 95.MSDN.2000
    [115] Microsoft Corporation. The Component Object Model.MSDN.2000
    [116] Microsoft Corporation. Input Method Editor. MSDN library. 2000
    [117] Ronald J.Norman.Object-Oriented Systems Analysis and Design(影印版).清华大学出版社.2000
    [118] Timothy Budd A.Classic Data Structures in C++.New York:Addison-Welseley Pubishing Company, Inc., 1994

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700