汉字字形描述技术研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着Internet的发展和普及,越来越多的网络版汉语工具书在网络上为汉语学习者提供查询服务。这些网络版工具书经常要显示汉字的笔顺和各种汉字部件(包括偏旁、部首),由于汉字数量很大,目前的计算机标准汉字字符集中既没有把汉字基本部件字形全部包括进来,也没有把每个汉字的笔画分解形式包括进来。在浏览器中显示汉字笔顺和各种部件时,往往采用Flash动画或图片方式来实现。采用Flash动画来演示汉字的动态书写过程,是一种较好的表现汉字笔顺的方式,但制作Flash动画的工作量巨大,而且这些Flash动画往往只能以一种固定的方式来显示。因而它不是一种好的解决办法。
     本文通过研究汉字字形描述和字形绘制技术,开发一个能在网络上自动绘制汉字笔顺和汉字部件的软件。给用户提供一个方便的查询、显示汉字笔顺、部件的方法。
     首先,文中介绍了GDI+技术和它的新特色。利用GDI+的路径技术和汉字楷体GB_2312、仿宋两个TrueType字库的特征(以笔画为单位来描述每个汉字的字形的,即一个封闭图形对应一个笔画轮廓),把一个汉字的笔画轮廓信息添加到一个GDI+的路径中。路径对象相当于一个汉字,路径可以包含许多子路径,子路径相当于一个笔画。通过对路径和子路径的控制最终完成汉字笔画的绘制。
     其次,本文介绍了COM组件技术。为了实现程序共享,构造一个能在网络环境中调用的组件是一个很好的方法。应用此组件只需要在服务器端注册并进行必要的配置就可以使用,组件对客户来说是透明的。组件将用户需要用到的功能以接口形式提供,而把具体的功能包含在组件内部。根据需要设计了一个接口,三个基本函数的功能分别是显示汉字笔顺、修改汉字笔顺和显示汉字部件。
     最后,由于楷体GB_2312、仿宋字库中保存的笔画并没有完全按照汉字笔顺序列存储,需要以交互方式调整笔画数据。系统中使用ACCESS数据库来存储调整信息。文中对使用ADO数据对象访问数据库的有关技术进行了必要的叙述。
     综上所述,本文对目前计算机采用的主要汉字字形描述技术进行了分析和研究,设计实现了汉字笔画、部件自动查询、绘制系统,并对系统开发过程中遇到的相关技术问题及解决方案进行了详细说明,最后给出了进一步工作的展望。
Along with the development and popularization of Internet, moreand more Chinese language online tools provide querying services tolearners of the Chinese. These network's book, often indicate the order ofstrokes of Chinese characters and various components (including theradicals) of Chinese characters. Due to the number of Chinese charactersis large. At present, the set of Chinese Standard Characters neither includeall the basic components and glyph nor each of the decomposition ofstrokes of Chinese characters. Flash animation or photographs are oftenused to display strokes and the various components in the browser. Flashanimation display the process of writing Chinese characters in dynamicprocess, it's a good way to perform the order of writing Chinesecharacters. However, the production of flash animation is a hugeworkload. Flash animation can only display the strokes in the fixed way.It was not a good solution.
     This paper studies the Chinese character glyph describing techniqueand glyph drawing technique; develop software that can draw the order ofstroke of Chinese character. This software provides users a convenientmethod to find the right order of strokes of Chinese characters anddisplay arbitrary parts of Chinese character.
     First, this paper introduces the GDI+ technology and its newfeatures. Basing on GDI+ Path technology and the feature of two Fonttypes (Fang song and Kai, these two fonts describe the strokes of eachChinese character for the glyph. A stroke is a closed contour graphs), theinformation of strokes of Chinese characters be added to a contour path toGDI+. One Chinese character equivalent to a Path Object, one path can contain many sub-path equivalents to a stroke. By the control of Path andsub-path, complete the drawing of strokes of Chinese character.
     Secondly, this paper introduces the COM technology. In order tosharing the software, COM is a very good idea. We only need to registerthe Component and configure the server. The Component is transparent tothe customer. Component interface used to satisfy users needs, and thespecific functions contained in the internal components. According to theneeds, we designed one interface, including three basic functions; theywere displaying the order of strokes of Chinese characters, modifyingorder of strokes of Chinese characters, and displaying Chinese characterscomponents.
     Finally, because the Font types: Fang song and Kai strokes failed topreserve the sequence order of strokes of Chinese characters, and we canadjust the order of strokes basing the requiring. In the software we useAccess database to keeping adjustments information. This paperdescribed ADO data access technology.
     Thus, purposely and experimentally this paper studies the Chineseglyph description technique, the study summarize the problems that existin the development process and prospects further work.
引文
1.朱德熙.汉语简介[EB/OL].:http://zdie.net/,2007-3-21:
    2.GF3001-1997.信息处理用GB13000.1字符集汉字部件规范[S].国家语言文字工作委员会,1997-12-01发布,1998-05-01实施:
    3.林民,宋柔.基于结构描述的汉字字形相似度计算[A].见:第三届学生计算语言学研讨会论文集[C].2006-8:
    4. Cui-xia Weng, Ru-yng Chang. Taiwan's NDAP Language Archives Project:From bronze inscription texts to Austronesian field recording[EB/OL].: http://emeld.org/workshop/2003/ruyng-paper.doc, 2007-3-21.
    5.盛金彪.表意文字描述序列[EB/OL].:http://www.pkucn.com,2007-3-21.
    6.孙星明,殷建平,陈火旺等.汉字的数学表达式研究[J].计算机研究与发展,2002(39):707-711.
    7.罗刚,孙星明.汉字数学表达式开发平台的设计与实现[J].计算机工程与应用,2005(5):113-116
    8.盛金标.字符描述语言(CDL—Charaeter Description Language)说明文档[EB/OL].:http://www.pkucn.com/viewthread.php?tid=153085, 2007-3-21.
    9. Candy L. K. Yiu, Wai Wong, Chinese Character synthesis using METAPOST[In], Proceedings of the 2003 Annual Meeting[C]. 2003:85-93.
    10.刘宏申,陈小平.GDI+及多格式图像的转换[J].微机发展,2004,14(11):40-42.
    11.周鸣扬,曾洁玫等编著.GDI+程序设计实例[M].北京:中国水利水电出版社.2004-5:26-27.
    12.陈本峰,苏琦.Windows GDI+的研究与应用[J].计算机应用研究,2003,3:56-59.
    13.任哲等编著.MFC Windows应用程序设计[M].北京:清华大学出版社,2004:239-249.
    14.舒忠梅,胡金柱.TrueType字体中文指令化技术剖析[J].软件时空,1988:57-59.
    15.吕强,史磊,杨季文.TrueType字体文件格式初探[J].计算机研究与发展,1995(32):23-31.
    16.王瑜,黄源,张福炎.Windows中TrueType字型数据的存取技术[J].小型微型计算机系统,1997(18):75-81.
    17.肖明,胡金柱,赵慧等.字形技术及OpenType字体文件格式研究[J].中文信息学报,1999(13):53-60.
    18.冯正全.COM原理概述[J].成都信息工程学院学报,2004,19(3):398-402.
    19.潘爱民.com原理与应用[M].北京:清华大学出版社,2000.
    20.李建军.基于COM/DCOM的组件技术研究与应用[D].上海:同济大学,2006:
    21.孔梦荣,郑秋生,杜献峰.COM组件技术探究[J].中原工学院学报,2004,15(2):22-23,70.
    22.张昭玉.COM组件接口的设计与实现[J].襄樊学院学报.2005.26(2):67-70.
    23.杨峰.VC知识库在线杂志-COM组件设计与应用(二)(三)(四)(五)[EB/OL].:http://www.vckbase.com/vckbase/default.aspx, 2007-3-15:
    24.方舟(责任编辑).ATL简介[EB/OL].:http://www.yesky.com/SoftChannel/72342371928702976/20030809/1720378.shtml, 2007-3-15:
    25.洪锡军,邱浩波,李从心.ADO数据存取技术[J].计算机应用与软件,2002,19(5):18-20,55.
    26.谷震离.ADO访问SQL Server数据库技术分析及应用[J]计算机应用与软件,2004,21(12):31-32,77.
    27.张奋朝.ADO组件在数据库编程中的应用-VC++篇[J].滁州职业技术学院学报,2004,3(1):63-64.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700