《蒙古语连接形式知识库》的建设
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文面向蒙古文信息处理的实际需要,以自动识别蒙古语连接形式为目的,运用计算语言学方法对蒙古语连接形式的结构、意义和功能等进行了研究。该项研究中,描述了蒙古语连接形式的结构、功能和位置等特征,开发了囊括蒙古语连接形式词法、句法和语义等特征的《蒙古语连接形式信息词典》,并在此基础上建设了《蒙古语连接形式规则库》。全文共五章。
     第一章提出了研究对象、选题的必要性和背景、研究方法与内容以及资料的选择等。分析关于蒙古语连接形式以往研究成果的基础上,阐明了我们对蒙古语连接形式的命名、定义、分类和范畴等一系列问题的看法。
     第二章在语料分析的基础上,阐述了蒙古语连接形式的结构、功能和位置等特征。文中把蒙古语连接形式分为组合结构的连接形式和照应结构的连接形式等两大类。从连接形式在句中所处的位置和连接形式本身与所连接成分的前后位置等两个方面对其进行了研究。分析连接形式功能时,归纳了连接形式在语料中出现的次数、前共现成分以及连接功能等内容。蒙古语连接形式表示并列、递进、选择、转折、假设、对立、进层、因果以及顺承等九种关系。
     第三章基于连接形式在语料中的具体应用情况和传统蒙古语言学研究成果,分析连接形式的结构和功能,运用特征结构的方法,以数据库文件形式开发了《蒙古语连接形式信息词典》,设置其属性字段并填写了相应的属性值。该词典的字段不是以语法特征为主,而是以语义特征为主。这正是与《蒙古语语法信息词典》的区别所在。
     第四章基于短语结构语法,运用产生式规则,以文本文件形式建设了《蒙古语连接形式规则库》。把蒙古语连接形式的规则分为组合结构连接形式的规则和照应结构连接形式的规则等两大类。
     第五章详细阐述了《蒙古语连接形式自动识别程序》的研制和实现过程,介绍了该程序的结构、来源、功能结构图以及流程图等,并说明了用该程序进行测试的结果。
In order to meet the requirements of Mongolian information processing, we focus on the research of Mongolian conjunctive form, including the structure, function, meaning as well as its automatic recognition from the perspective of computational linguistic. In this study, we develop the Knowledge-base of Mongolian Conjunctive Form which contains the information of morphology, syntax, semantics and usage. Based on the above knowledge-base, we also develop the Rule Database of Mongolian Conjunctive Form. This thesis consists of five chapters.
     Chapter 1 introduces the research object, significance, background, methods and materials. Based on the previous work on the Mongolian conjunctive form, we explain the naming, definition, classification, range of Mongolian conjunctive form as well as other related issues.
     Chapter 2 explains the attributes in the database such as the structure, function and position which comes from the analysis of the corpus. The Mongolian conjunctive form is divided into two classes:composite structure and anaphoric structure. We focus on two aspects:the position of the conjunctive form in a sentence and the relationship between the conjunction itself and its connected components. While analyzing the function of the conjunctive form, we record the number of occurrences in the corpus, the former connected components and the conjunction functions and so on. The conjunctive forms in Mongolian language have nine types of relations:coordination progression selection、adversative、supposition、opposition、going-ahead、cause-effect and hooking.
     Chapter 3 analyzes the structure and the function of the conjunction form based on its usage in the corpus and the traditional Mongolian linguistics. We set the attribute fields for Knowledge-base of Mongolian Conjunctive Form and fill in the fields on the basis of its structure and function. The attributes are not based on syntactic information but on semantic information. That is the difference with the Mongolian grammar information dictionary.
     Chapter 4 introduces the construction of the Rule Database of Mongolian Conjunctive Form which is based on the phrase structure grammar and presented in the text form. We divide the Mongolian conjunction rules into two classes:the rule for composite structure and the rule for anaphoric structure.
     Chapter 5 elaborates the development of the Automatic Recognition program for Mongolian conjunctive form, including the system architecture and data flow chart and so on. The performance of the program is also presented at the end of this chapter.
引文
[1] #12
    [2] #12
    [3] #12
    [4] #12
    [5] #12
    [6] #12
    [7] #12
    [8] #12
    [9] #12
    [10] #12
    [11] #12
    [12] #12
    [13] #12
    [14] #12
    [15] #12
    [16] #12
    [17] #12
    [18] #12
    [19] #12
    [20] #12
    [21] #12
    [22] #12
    [23] #12
    [24] #12
    [25] #12
    [26] #12
    [29]#12
    [30]#12
    [31]#12
    [32]布·哈·托达葉娃(苏):现代蒙古标准语语法讲义,中央民族学院,1957年。
    [33]吕叔湘:《现代汉语八百句》,商务印书馆,1980年。
    [34]北京大学中文系1955,1957级班编:《现代汉语虚词例释》,1982年。
    [35]高更生:《长句分析》,中国社会科学出版社,1983年。
    [36]清格尔泰:《蒙古语语法》,内蒙古人民出版社,1992年。
    [37]姚天顺:《自然语言理解——一种让机器懂得人类语言的研究》,清华大学出版社,1995年。
    [38]冯志伟:《自然语言的计算机处理》,上海外语教育出版社,1996年。
    [39]贾彦德:《汉语语义学》,北京大学出版社,1999年。
    [40]冯志伟:《计算语言学基础》,商务印书馆,2001年。
    [41]靳光瑾:《现代汉语动词语义计算理论》,北京大学出版社,2001年。
    [42]黄昌宁、李涓子:《语料库语言学》,商务印书馆,2002年。
    [43]俞士文等:《现代汉语语法信息词典详解》,第二版,北京大学出版社,2003年。
    [44]亢世勇:《面向信息处理的现代汉语语法研究》,上海辞书出版社,2004年。
    [45]俞士汶:《计算语言学概论》,商务印书馆,2004年。
    [46]巴达玛敖德斯尔:《面向汉蒙机器翻译的短语转换规则研究》,内蒙古教育出版社,2005年。
    [47]德·青格乐图:《现代蒙古语固定短语语法信息词典详解》,内蒙古教育出版社,2005年。
    [48]田中穗积:《自然言语解析の基础》,产业图书株式会社,1989年。
    [49]小沢重男:《蒙古语文语文法讲义》东京大学书材发行,1987年。
    [50]#12
    2.#12
    [1]#12
    [2]#12
    [3]#12
    [4]#12
    [5]#12
    [6]#12
    [7]#12
    [8] #12
    [9] #12
    [10] #12
    [11] #12
    [12] #12
    [13] #12
    [14] #12
    [15] #12
    [16] #12
    [17] #12
    [18]#12
    [19]#12
    [20]#12
    [21]#12
    [22]#12
    [23]那顺乌日图:《『蒙古语语法信息词典』框架设计》,内蒙古大学博士学位论文,2000年。
    [24]达胡白乙拉:《蒙古语基本动词短语自动识别研究》,内蒙古大学博士学位论文,2005年。
    [25]达胡白乙拉:《面向信息处理的现代蒙古语名词短语结构规则研究》,硕士学位论文,内蒙古大学,2002年。
    [26]淑琴:《蒙古语语法信息词典构形附加成分分库》的设计与实现,硕士学位论文,内蒙古大学,2005年。
    [27]包艳花:《蒙古文识别文本后处理相关技术研究》,内蒙古大学硕士学位论文,2007年。
    [28]宁琦:《谈建立现代俄语简单模型的理论基础》,中国俄语教学(季刊),1999年第一期(总第80期)。
    [29]吴贻翼:《试谈现代俄语中简单句模型的概念》,中国俄语教学(季刊),1999年第3期(总第80期)。
    [30]华沙宝,《蒙古语词类标注系统—AYIMAG》,内蒙古大学学报(人文·哲学版),1999年第5期。
    [31]李文平:《常用连词用法比较》,山西教育,2001年第14期。
    [32]那顺乌日图:《蒙古语语法信息词典》的开发与应用,发表于Workshop on Mongolic Languages,Taiwan,2002年9月。
    [33]华沙宝,《蒙古语短语标注策略》,中央民族大学学报,2003年第5期。
    [34]华沙宝,达胡白乙拉:《对蒙古语语料库基本名词短语的定界与统计分析》,内蒙古大学第四次蒙古学国际学术讨论会·论文提要,呼和浩特,2004年8月。
    [35]刘云,俞士汶,朱学锋,段慧明:《现代汉语虚词知识库的建设》,语言文字应用,2005年2月,第一期。
    [36]巴·萨日娜:《『蒙古语语法信息词典』动词语法属性字段设置》,内蒙古大学学报(人文社会科学版),2005年11月。
    [37]冯金江:《日语中连接句子和段落的接续词—与汉语连词的对比》,江西科技师范学院学报,2006年6月,第3期。
    [38]华沙宝:《对蒙古语语料库的短语标注》,中央民族大学学报,2006年第5期。
    [39]高莲花:《生成句法框架内的蒙古语动词及其句法结构研究》,中央民族大学博士学位论文,2007年。
    [40]周强、张伟、俞士汶:《汉语树库的构建》,中文信息学报,1997年8月第11卷第4期。
    [40]郑军:《也说现代汉语连词范围》,淮北煤师院学报(哲学社会科学版),2002年4月第23卷第2期。
    [41]郑军:《现代汉语连词研究概述》,龙岩师专学报,2004年2月第22卷第一期。
    [42]周刚:《连词产生和发展的历史要略》,安徽大学学报(哲学社会科学版),2003年1月第27卷第1期。
    [43]苏鹰:《日语中连接句子和段落的接续词—与汉语连词的对比》,湖南大学学报(哲学社会科学版),2002年5月第16卷第3期。
    [44]赵军、黄昌宁:《结合句法组成模板识别汉语基本名词短语的概率模型》,计算机研究与发展,1999年11月第36卷第11期。
    [45]凌小鹏、柴佩琪:《用说明模板改进基于配价的德汉机器翻译》,中文信息学报,2000年10月第14卷第5期。
    [46]刘云,俞士汶,朱学锋等:《现代汉语虚词知识库的建设》,语言文字应用,2005年2月第1期。
    [47]昝红英、张坤丽、俞士汶等:《现代汉语虚词知识库的研究》,中文信息学报,2007年10月第21卷第5期。
    [48]杨攀,张建,李淼,乌达巴拉,雪艳:《汉蒙统计激起翻译中的形态学方法的研究》,中文信息学报,2009年2月第23期第1卷。
    [49]#12

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700