基于拓扑学和统计学的无字库汉字智能造字研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
以文化和技术角度描述的无字库汉字智能造字理论研究已经取得了丰富的成果,设计开发的汉字智能造字软件系统成功地实现了汉字字符集GB18030-2005中规定的70244个汉字的智能造字实验。为研究汉字智能造字的内在规律性,本文采用了拓扑、统计等数学工具,对研究的汉字基元、汉字结构、汉字编码进行符号化,研究汉字基元理论、结构理论、编码理论和造字理论的合理性、严肃性和稳定性,从而丰富和完善智能造字理论。为了检验智能造字的效果,研究智能造字的降熵机理并对智能造字的信息化效率进行评价。
     下面介绍作者在论文研究期间所从事的主要工作以及取得的进展:
     1.汉字基元理论研究。(1)利用拓扑理论对汉字基元进行了数学描述:分析了汉字集合,汉字成分集合和汉字基元集合之间的关系;建立了汉字基元和数学拓扑基之间的关系,为汉字基元的中文命名提供了数学理论上的支撑。(2)建立了可选择汉字基元的数学描述理论,解决了如何在不同的汉字子集合上各自选择基元集而不互相冲突的问题;并说明了汉字基元集合的确定性问题。(3)进一步地,用层次分析法建立了从汉字集合中选择汉字基元的数学模型,解决了实际如何从汉字集合中选择汉字基元的数学问题。(4)汉字基元个数的稳定性。由于汉字基元具有组成的确定性以及实验获取的稳定性的两个特性,用统计模型的可线性化的一元非线性回归预测了汉字基元个数的稳定性。
     2.汉字结构理论研究。(1)利用拓扑理论对汉字结构进行了数学描述:利用现代拓扑学中商空间、同伦论等理论对汉字智能造字中具有不同拓扑特征的结构类分别进行了研究,形成一套对汉字结构的数学描述理论,从而实现了运用拓扑知识对汉字结构进行数学描述的目标。(2)汉字结构种类的稳定性:由于汉字结构具有定义的确定性和实验获取汉字结构种类的稳定性的两个特性,从汉字拼合方式的拓扑特性预测了汉字结构种类的稳定性。
     3.汉字编码理论研究。针对汉字智能造字中的编码包括结构编码和基元编码两个部分的特性,(1)从数学上描述了汉字智能造字编码,并说明了汉字智能造字编码是一种“结构+基元”特征的组合编码;(2)从数学理论上验证了智能造字中的汉字编码的机内码是单义可译码和即时码。对GB18030-2005中的全部70244个汉字在编码平台下都有编码且是唯一编码的实验结果,汉字编码理论从数学角度对智能造字中汉字机内码编码的完备性和唯一性予以了解释。
     4.汉字智能造字理论和系统模型研究。对汉字造字过程进行了数学描述:(1)从拓扑学的角度证明了可以造字的数学命题,解决了汉字造字的数学理论支撑的问题。(2)根据智能造字的理论思想建立了智能造字的数学模型,解决了智能造字的理论从定性描述向数学理论描述的转化问题。可造字的数学理论解释了汉字造字的可实现性,并进一步地建立了汉字智能造字的数学模型,造字实验结果也证实了本章提出的模型方法的可行性和有效性。
     5.汉字智能造字的降熵机理和信息熵计算。现有的中文信息系统均采用汉字字库方式,以汉字作为最小的处理单元,其静态平均信息熵为9.65比特/字符,是开销最大和效率最低的文字处理系统。在分析了现有汉字字库方式的汉字系统信息熵偏高的原因及其降熵机理的基础上,以汉字基元为汉字处理的单位进行了信息熵实验,得到信息熵是5.29比特/字符,达到与拼音文字相接近的水平,实验结果表明上述方案有效地降低了汉字的信息熵。
Research on intelligent Chinese character-making (ICC) without library has made the abundant achievement from the angle of the culture and technology. The designed software system of ICC realizes successfully the ICC experiment of 70244 characters which are specified in the Chinese character set of GB18030-2005. In order to research the inherent regularity of ICC, this paper is applied to symbolization of Chinese character prototypes, Chinese character structures and Chinese character code and researches the rationality, seriousness and stability of the Chinese character prototype theory, structure theory, code theory and ICC theory using the mathematical tools such as the topology and statistics. Therefore, it enriches and improves the ICC theory. In order to verify the effectiveness of ICC and research the entropy-dropping mechanism of ICC, the informatization efficiency evaluation of ICC is applied.
     The main work and achievement during the paper research period is as flows:
     1. Research on Chinese Character Prototype. (1) Using topological theory to describe the Chinese character prototypes: the relationship among the sets of Chinese characters, components and prototypes is analyzed; the relationship between the prototype and topological basis is established, supporting the Chinese naming of the prototype mathematical theoretically, providing the mathematic theory support for the Chinese naming of the Chinese character prototypes. (2) The mathematical theory of available to chose the prototypes is established, resolving the problem that how to choose prototype sets respectively in the different subsets of Chinese characters without causing any conflicts from each other. (3) Further, the mathematical model how to choose prototypes from the set of characters is established by using AHP (Analytic Hierarchy Process), resolving practically the mathematical problem that how to choose prototypes from the set of characters. (4) The stability of the prototypes. For the certain composition of the prototypes, and the asymptotic stability of the prototypes acquired in the experiment, using the exponential smoothing method in statistical models to predict the stability of the prototypes. The stability of the prototypes is predicted by using the nonlinear regression method that can be linearized in the statistical models.
     2. Research on Chinese character structures theory. (1) Using topological theory to describe the Chinese character structures: using quotient space and homotopy in modern topology to study on the structures’classes with different topological features in ICC, the mathematical descriptive theories for character structures are formed. The goal that the Chinese character is applied to mathematic description using the topology is achieved. (2) The stability of the structures. From the certain composition of the structures, the stability of the structures acquired in the experiment, and the topological properties of joining together way of characters to predict the stability of the structures.
     3. Research on Chinese character coding theory. As to the feature of the code of ICC including structure coding and prototype coding, (1) It states mathematically that the coding of ICC is a combinational coding with the feature“structure plus prototype”. (2) It also verifies that the internal code of characters of ICC is a unique decodable code and instantaneous code from the mathematic theory. For the code experiment result in which all the 70244 Chinese characters of the GB18030-2005 have their own codes under the code platform and these codes are unique, the Chinese code theory explains the completeness and uniqueness of the internal code for ICC.
     4. Research on the ICC theory and the system model. Mathematical description has made to show the process of making-character, Firstly, the mathematical theory which can make character is verified from the angle of topology and the problem of the mathematical theory support of Chinese character-making is resolved. Secondly, the mathematical model of ICC is set up according to the ICC theory and the transition from qualitative description to mathematic theory description of the Chinese character-making theory is resolved. The mathematical theory which can make the Chinese character explains the realizability of the Chinese character-making and the mathematical model of ICC is set up further. Besides, the character-making experiment result also verifies the feasibility and effectiveness of the model method proposed in this chapter.
     5. Research on the Chinese character entropy-reducing mechanism of ICC. The present Chinese information systems all adopt the Chinese character word library, a word processing system with the most expensive expenditure but the lowest efficiency in which the Chinese character is the smallest processing unit and the average static information entropy is 9.65 bit. On the basis of analysis and research on the reason that the Chinese character system information entropy of current Chinese character word library is on the high side and the entropy-reducing mechanism, the information entropy experiment is carried out by taking the Chinese character prototypes as the Chinese character processing units and gets the information entropy with 5.29 bit which is almost near to the alphabetic writing level. This experiment indicates that the above program reduces the Chinese character information entropy effectively.
引文
[1]朱巧明,李培峰,吴,等.中文信息处理技术教程[M].北京:清华大学出版社, 2005
    [2]许嘉璐.现状和设想——试论中文信息处理与现代汉语研究[J].中文信息学报, 2001, 15(2): 1-8
    [3]皮佑国,卢建平,刘明友.对中文信息处理中汉字字库的思考[J].现代学术研究杂志, 2008, (3): 68-70
    [4]尉迟治平,汤勤.论中文字符集、字库及输入法的研制[J].语言研究, 2006, (03): 63-66
    [5]张建国.方正GBK字库解决方案[J].中国传媒科技, 2003, (01): 54
    [6]景年社.字库技术及其应用概述(上)[J].印刷杂志, 2002, (09): 1-4
    [7]景年社.字库技术及其应用概述(下)[J].印刷杂志, 2002, (10): 5-8
    [8] GB2312,信息交换用汉字编码字符集基本集[S].北京:中国标准出版, 1980
    [9] GB/T12345-90,信息交换用汉字编码字符集辅助集[S].北京:中国标准出版, 1990
    [10] GBK-扩展的GB字符集标准[S].北京:中国标准出版, 1997
    [11] GB18030-2000,信息技术和信息交换用汉字编码字符集基本集扩充[S].北京:中国标准出版,2000.
    [12]马希文.计算机与汉字改革[J].语文建设, 1984,(05): 23-26
    [13]王永民,杨桃源.警觉拼音输入法对运用汉字能力的销蚀[N].光明日报, 2005年10月19日(9)
    [14] http://www.jfdaily.com/a/1286446.htm
    [15]陈传锋,董小玉,徐缨.汉字的字形结构特点及其认知规律与小学识字教学[J].贵州师范大学学报(自然科学版), 2002, 20(1): 92-96
    [16] http://news.gd.sina.com.cn/news/2009/0520/639.html
    [17] http://news.xinhuanet.com/edu/2010-08/20/c_12466703.htm
    [18]姜丹.信息论与编码[M].合肥:中国科学技术大学出版社,2001
    [19]冯志伟.汉字的信息量大不利于中文信息处理[J].语文建设, 1994, 3: 34-35
    [20]张仰森,曹元大,俞士汶.语言模型复杂度度量与汉语熵的估算[J].小型微型计算机系统, 2006, 27(10): 1931-1934
    [21]管会生.矢量汉字的快速组合造字[J].兰州大学学报(自然科学版), 1992,(01): 117-118
    [22]管会生.矢量汉字绘制软件[J].兰州大学学报(自然科学版), 1992,(S1): 49-55
    [23]焦虹,陈立健,孙家广.建立及管理矢量汉字库[J].中文信息, 1995,(04): 27-28
    [24]周浩华,蔡颖嘉.智能汉字库的研究[J].华南理工大学学报(自然科学版), 1992, (02): 1-7
    [25]周浩华.统一汉字库的研究[J].中文信息学报, 1993,(04): 1-7
    [26] Pak–Keung Lai, Dit–Yan Yeung, and Man–Chi Pong. A Heuristic Search Approach to Chinese Glyph Generation Using Hierarchical Character Composition[J]. Computer Processing of Oriental Languages, 1996, 10(3): 307-323
    [27]冯万仁,金连文.基于部件复用的分级汉字字库的构想与实现[J].计算机应用, 2006, 26(3): 714-717
    [28]张效成,吴迪.“实时造字”技术及软件系统开发研究[J].计算机应用. 2003, 23(2): 39-42
    [29]谢清俊.从缺字问题,谈汉字交换码的重新设计[C].汉字字码与数据库国际研讨会,京都及东京. 1996.10
    [30]皮佑国.汉字电子化中的拼部组字方法[p].中国专利: CN1558314,2004-12-29
    [31]梁添才,皮佑国,丘志文,等.基于简易网格的汉字结构识别方法[J].华中科技大学学报(自然科学版), 2008,(06): 40-42
    [32]王素利,皮佑国,梁添才,等.基于网格的上中下结构汉字的结构识别研究[J].湖南工业大学学报, 2007,(06): 99-100
    [33]王素利.基于认知机理的智能造字之结构描述研究[D].广州:华南理工大学, 2008
    [34]谌杨帆,皮佑国.无字库条件下汉字全包围结构识别方法研究[J].自动化技术与应用, 2009,(02): 78-80
    [35]谌杨帆.基于简易网格的汉字结构识别研究[D].广州:华南理工大学, 2009
    [36]丘志文.基于认知机理的汉字智能造字之汉字基元研究[D].广州:华南理工大学, 2008
    [37]汪剑.无字库汉字智能造字系统中的汉字基元研究[D].广州:华南理工大学, 2009
    [38]王锐.基于网格的无字库智能造字研究[D].广州:华南理工大学, 2007
    [39]皮佑国,牟总斌.在计算机中描述汉字的网格及其描述方法[p].中国专利: CN1558339,2004-12-29
    [40]梁添才.基于认知机理的汉字智能造字研究[D].华南理工大学, 2008
    [41] Pi Youguo, Liao Wenzhi, Liu Mingyou and Lu Jianping,“Theory of cognitive patternrecognition”, Vienna, Austria: I-Tech Education and Publishing, 2008: 432-462. ISBN: 978-3-902613-24-4
    [42]刘明友.认知模式识别理论及无字库智能造字研究[D].华南理工大学, 2010
    [43]杨乐.数学的作用[J].中国大学数学,2001(04): 4-6
    [44]林家翘,陈以鸿.谈谈应用数学的作用[J].自然杂志,1978(02): 103-106
    [45]王健吾.浅谈数学的作用[J].工科数学,1996(04): 138-141
    [46]张秀英.试论数学的作用与魅力[J].高等理科教育,2003(05): 4-6
    [47]何国龙.现代科学技术发展中数学的作用及相关问题[J].浙江师范大学学报(自然科学版), 2002,(04): 337-341
    [48]刑福义,吴振国.语言学概论[M].武汉:华中师范大学出版社,2002
    [49]周浩华.计算机汉字系统的设计与实现[M].广州:华南理工大学出版社,1992
    [50]黄伟嘉,敖群.汉字知识与汉字问题[M].商务印书馆,2009
    [51]张晓明.二十世纪汉字字形结构研究[M].语言教学与研究, 2004,(5): 75-80
    [52]吕叔湘.汉语文的特点和当前的语文问题,语文近著[M].上海:上海教育出版社, 1987
    [53]高更生.汉字研究[M].山东教育出版社,2001
    [54]张普.共和国的中文信息处理60年[J].语言文字应用, 2009,(03): 34-39
    [55]宗成庆,曹右琦,俞士汶.中文信息处理60年[J].语言文字应用, 2009, (04): 53-61
    [56]顾小凤.中文信息处理的研究现状[J].渤海大学学报(哲学社会科学版), 2007,(02): 54-57
    [57]王永成等著.中文信息处理技术及其基础[M].上海:上海交通大学出版社,1991
    [58]钱培德.计算机中文信息处理技术[M].成都:电子科技大学出版社,1992
    [59]陈小荷.中文信息处理概述[J].南京师范大学文学院学报, 2002,(01): 171-176
    [60]常平. 20世纪我国重大工程技术成就[M].广州:暨南大学出版社,2002: 29~41
    [61]左民安,王尽忠.汉字部首概论[J].宁夏大学学报(人文社会科学版), 1990, (04): 89-96
    [62]张书岩.《汉字部首表》的内容与应用[J].语文建设, 2009,(06): 60-62
    [63]许慎.说文解字[M].北京:中华书局,1963
    [64]许慎.说文解字叙[M].北京:中华书局,1983.314
    [65]郭书兰.汉字部首的演变[J].河南图书馆学刊, 1992,(01): 68-70
    [66]李大遂.简论偏旁和偏旁教学[J].暨南大学华文学院学报, 2002(01): 27-33
    [67]李行健,费锦昌.《信息处理用GB13000.1字符集部件规范》答客问——访谈录(7)[J].中学语文教学参考, 2002,(Z2) : 41-42
    [68]《新华字典》.北京:商务印书馆. 1987年3月北京第十次印刷
    [69]国家语言文字工作委员会.信息处理用GB13000.1字符集汉字部件规范[M].北京:语文出版社, 1998
    [70]张小衡.《信息处理用GB13000.1字符集汉字部件规范》在输入法应用中的难点讨论[J].中文信息学报, 2004(04): 60-66
    [71]陈燕.现代汉字部首法所用单字切分的研究[J].天津师范大学学报(社会科学版), 2006(4): 71-76
    [72]王述峰.试谈汉字部件的命名[J].语文建设, 1996(07): 11-13
    [73]苏培成.现代汉字学纲要(增订本)[M].北京:北京大学出版社,2001
    [74]黄伯荣,廖序东.现代汉语:增订三版[M].北京:高等教育出版社,2002
    [75]余克强.汉字层次结构方式、末级部件简析[J].三明高等专科学校学报. 2000(S3): 27-36
    [76]王宁.汉字构形学讲座[M].上海:上海教育出版社. 2002
    [77]王宁.汉字构形理据与现代汉字部件拆分[J].语文建设, 1997(3): 4-9
    [78]苏培成.现代汉字的部件切分[J].语言文字应用, 1995(03): 52-55
    [79]熊金城.点集拓扑学讲义(第三版)[M].北京:高等教育出版社, 2004: 30-153
    [80] Daverman R.J., Sher R.B. Handbook of Geometric Topology [M], North-Holland, 2001.
    [81] Elliott Pearl. Open Problems in Topology II [M], Elsevier, 2007
    [82] Armstrong M.A. Basic Topology (Springer) [M].World publishing corporation, 2008
    [83] Clark, A.Mindware. An introduction to the philosophy of cognitive science [M]. New York: Oxford University Press. 2001
    [84] Anderson, J.R. Cognitive Psychology and Its Implication [M]. Fourth Edition. New York: W.H. Freeman.1995
    [85] Anderson J.R.. Cognitive Psychology and Its Implication[M]. New York: Freeman 1990
    [86] Robert L.Solso, M.Kimberly MacLin, Otto H.MacLin. Cognitive Psychology[M]. Seventh Edition. BeiJing: Peking University Press, 2005: 104-139
    [87]方俊明.信息加工认知心理学的发展和面临的挑战[J].心理科学, 1998(21): 481-485
    [88] Jobe J.B. Cognitive psychology and self-reports: Models and methods [J]. Quality of Life Research. 2003, 12(3): 219-227
    [89] Edward E. Smith, and John Jonides. Working Memory: A View from Neuroimaging[J]. Cognitive Psychology, 1997(33): 5-42
    [90] Anthony D. Wagner. Working Memory Contributions to Human Learning and Remembering [J]. Neuron, 1999 (22): 19-22
    [91] Stanley J.Colcombe. The Role of Prototypes in the Mental Representation of Temporally Related Events [J]. Cognitive Psychology, 2000 (44): 67-103
    [92]易丹辉.统计预测——方法与应用[M].中国统计出版社,北京: 2001
    [93]徐国祥.统计预测和决策(第三版)[M].上海财经大学出版社.上海: 2008
    [94]廖永和.汉字偏旁笔画变化简说[J].云南教育(基础教育版), 1982,(06): 43-44
    [95]苏培成.现代汉字学纲要[M].北京大学出版社. 2001
    [96]周殿生.汉字结构中的信息和对外汉字教学[J].新疆大学学报(哲学人文社会科学版), 2008,(03): 136-138
    [97]周利璋.汉字偏旁形音义的历史演变[J].浙江师大学报(社会科学版), 1994,19(01): 33-37
    [98]高丽娅.整体认知汉字的偏旁、部首与结构[J].重庆教育学院学报. 2003, 16(4): 109-110
    [99]费锦昌.现代汉字部件探究[J].语言文字应用, 1996,(02): 20-26
    [100]苏培成.汉字的部件拆分[J].语文建设, 1997,(03): 10-13
    [101]国家语言文字工作委员会.信息处理用GB13000.1字符集汉字部件规范[M].北京:语文出版社. 1998
    [102]王宁.汉字构形理据与现代汉字部件拆分[J].语文建设, 1997(3): 4-9
    [103]《辞海》1999年版.上海:上海辞书出版社. 2001年2月28日第1版第1次
    [104]“信息处理用GB13000.1字符集汉字部件规范”通过审定[J].语言教学与研究. 1996(4): 155-157
    [105]柳泉.汉字结构的基本规律[J].青少年书法, 2004(3): 10-11
    [106]傅永和.汉字的结构[J].语文建设. 1991(9) : 10
    [107]张恩普.汉字结构与汉字拼写[J].东北师大学报(哲学社会科学版),1994(3): 79-81
    [108]甘锦秀.中国书法的学习与创作[J].湖南医科大学学报(社会科学版), 2009, (01), 173-174
    [109]孙继善.关于现行汉字结构的几个问题[J].前沿,1994, (10): 9-13
    [110]黄献.试论《说文解字》与汉字学体系的构建[J].中共贵州省委党校学报, 2009,(02): 123-125
    [111]彭万勇.关于对外汉字教学研究的思考和探索——兼论“字源理论”在对外汉字教学中的应用[J].现代教育论丛, 2009(02): 55-59
    [112]中国文字改革委员会、武汉大学.汉字结构及其构成成分的分析和统计[J].中国语文,1985(4): 82-85
    [113]傅永和. GB13000.1字符集汉字字序(笔画序)规范[M].上海教育出版社, 2000
    [114]张旺熹.从汉字部件到汉字结构[J].世界汉语教学. 1990(2): 112-120
    [115]陈伟琳,仉玉烛.汉字结构的数字描写法[J].信阳师范学院学报(哲学社会科学版),1997(04): 84-88
    [116]林可松.中小学写字课要重视间架结构原则教学[J].学科教育, 2004(08): 46-49
    [117]甘锦秀.中国书法的学习与创作[J].湖南医科大学学报(社会科学版), 2009(01): 173-174
    [118]韩伟.汉字结构类型古今研究综述[J].深圳教育学院学报,2002(1): 71-76
    [119]梁东汉.汉字的结构及其流变[M].上海:上海教育出版社,1959
    [120]沙宗元.百年来文字学通论性著作关于汉字结构研究的综述[C].安徽大学学报(哲学社会科学版),2004(3): 126-129
    [121]傅永和.汉字部件出现的结构部位[J].语言文字应用, 1992(1): 7-21
    [122]冯志伟.用上下文无关语法来描述汉字结构[J].语言科学. 2006(3): 14-23
    [123]裴亚军,冯志伟.用CFG文法研究汉字结构[J].中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集. 2007: 747-751
    [124] Suen C.Y, Xu Q., Lam L. Automatic recognition of handwritten data on cheques-fact or fiction[J]. Pattern Recognition Letters, 1999(20): 1287-1295
    [125] Li Z.C., Suen C.Y. The partition-combination method for recognition of handwritten characters [J]. Pattern Recognition Letters, 2000(21): 701-720
    [126] Liu K., Huang S., Suen C.Y. Identification of fork points on the skeletons of handwritten Chinese characters[J]. IEEE Trans on PAMI, 1999, 21(10): 1095-1100
    [127] Chen L.H., Lieh J. R. Handwritten character recognition using a 2-layer random graph model by relaxation matching [J]. Pattern Recognition, 1996, 29(11): 1847-1862
    [128] Chuang C.T., Tseng L.Y. A stroke extraction method for mufti-font Chinese characters based on the reduced special interval graph [J]. IEEE Trans on SMAC, 1995, 25(7): 1171 -1178
    [129] Liao C.W., Huang J.S. A transformation invariant matching algorithm for handwritten Chinese character recognition [J].Pattern Recognition, 1990, 23(11): 1176-1188
    [130] Zhao M. Two-dimensional extended attribute grammar method for the recognition of hand-printed Chinese characters [J]. Pattern Recognition, 1990, 23(7): 685-695
    [131]吴智标,夏莹,孙承鉴.手写印刷体汉字相关属性关系图启发式匹配法[J].计算机学报,1990, 13(3): 233-236
    [132]夏莹,张昕中.用于机器识别和学习的汉字表达式[J].自动化学报,1986, 12(3): 312-315
    [133] Jan C.A., Van der Lubbe. Information Theory [M]. English: Combridge University Press. 1997
    [134]卢永奇.信息编码与汉字处理原理[J].云南师范大学学报(自然科学版), 2004,(02): 24-27
    [135]傅小丽.浅析汉字编码的标准[J].晋中师范高等专科学校学报, 2003, (02) : 125-126
    [136]袁径三.浅说汉字编码[J].绍兴文理学院学报(自科版), 2005,(03) : 56-59
    [137]王树禾.图论[M].科学出版社,2004
    [138] Tutte W.T.. Graph theory [M]. China Machine Press, 2004
    [139]靳蕃,陈志.组合编码原理及应用[M].上海科学技术出版社,1995
    [140]岩垂好裕.信息传播与编码理论[M].科学出版社,2002
    [141]肖国镇,卿斯汉.编码理论[M].国防工业出版社,1993
    [142]卢开澄,卢华明.组合数学[M].清华大学出版社,2002
    [143]樊恽,刘宏伟.群与组合编码[M].武汉大学出版社,2002
    [144]刘连元.汉字拓扑结构分析(续)[J].电子出版. 1995, (7): 354-356
    [145] Chen Lin.The theory of topological structure and functional hierarchy and its relations to foundation s of cognitive science: A plenary talk [J]. In Proceedings of the Second International Conference on Cognitive Science. Tokyo: Japanese Cognitive Science Society. 1999: 16–22
    [146] Chen Lin.The topological approach to perceptual organization [J].Visual Cognition. 2005, 12(4): 553-637
    [147] Chen Lin, Wagenknecht, G. Topological Correction of Volumetric Binary Brain Segmentation Using A Multiscale Algorithm [J]. Biomedical Imaging: From Nano to Macro, 2007. ISBI 2007. 4th IEEE International Symposium on, 12-15 April 2007Page(s): 1308–1311
    [148] Chen Lin. Topological Structure in Visual Perception [J]. Science, New Seriec, Nov. 12, 1982 (vol 218, Issue 4573): 699-700
    [149] Chen Lin, Zhang Shaowu, Mandyam V. Srinivasan. Global perception in small brains: Topological pattern recognition in honey bees [J]. PNAS. May 27, 2003 (vol.100, no.11): 6884-6889
    [150]杨建军.科学研究方法概论[M].北京:国防工业出版社,2005
    [151]韩中庚.数学建模方法及其应用[M].北京:高等教育出版社,2005
    [152]雷功炎.数学模型讲义(第二版)[M].北京:北京大学出版社,2009
    [153]姜启源,谢金星,叶俊.数学模型(第三版)[M].北京:高等教育出版社,2003
    [154]叶其孝,姜启源.数学建模(第三版)[M].北京:机械工业出版社,2005
    [155]冯志伟.汉字的熵[J].语文建设, 1984(04): 12-17
    [156] Shannon C.E., and Weaver W., The mathematical theory of communication [M]. Urbana, 1949
    [157] Shannon C.E. Prediction and Entropy of printed English [J]. Bell System Technica Journal. January, 1951: 50-64
    [158] Barnard G.A. Statistical calculation of word entropies for four western languages [J]. IRE transactions on Information Theory. March, 1955: 49-53
    [159]张养森,曹元大,俞士汶.语言模型复杂度度量与汉语熵的估算[J].小型微型计算机系统,2006,(10): 1931-1934
    [160]吴喜之,现代贝叶斯统计学[M].北京:中国统计出版社,2000
    [161] http://www.people.com.cn
    [162] http://www.xinhuanet.com
    [163] http://www.gmw.cn
    [164] http://www.cyol.net/node/index.htm
    [165]傅祖芸.信息论基础[M].北京:电子工业出版社, 1989
    [166]黄萱菁,吴立德,郭以昆,等.现代汉语熵的计算及语言模型中稀疏事件的概率估计[J].电子学报, 2000,(08): 110-112
    [167]徐易.基于短文本的分类算法研究[D].上海交通大学硕士学位论文, 2010
    [168]李公宜,李海飙.汉字最高阶条件熵及其实验测定[J].上海交通大学学报, 1994(02): 113-120

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700