蒙古语名词词汇语义网的构建
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
词汇语义网是以词义与语义关系为经纬建立的人类语言知识表达基本架构。本文在吸收和借鉴WordNet及中文词汇语义网研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充分利用了其它相关的资源,研究和实现了蒙古语名词词汇语义网。其目的就是以自动转换与人工干预相结合的方法构造蒙古语名词词汇语义网,能够应用于蒙古语词汇语义查询及机器翻译等应用系统。
     蒙古语名词词汇语义网主要是参照WordNet设计了蒙古语名词词汇概念及语义关系网络的框架,建立了蒙古语词汇语义数据库。语义关系的建立主要依据传统语义学的成果,包括现有各种词典和相关著作。
     本文为了兼顾WordNet框架的合理性和蒙古语词汇语义系统的独特性,从以下几个方面进行了研究和实验:
     (1)以《蒙古语语义信息词典》的名词分库、《蒙古语近义词小词典》中的名词部分及《类语辞典》中的名词部分为主要研究对象,建立了与WordNet词汇概念兼容的蒙古语名词同义词集合。
     (2)以蒙古语名词同义词集为组织单位,首先从WordNet移植语义关系,再利用《蒙古语近义词小词典》、《蒙古语辞典》等蒙古语各类语义知识库进行适当“修剪”后逐步生成符合蒙古语自身特点的词汇语义网。
     (3)结合计算机数据库技术和Web程序开发技术研究开发了蒙古语名词词汇语义网的查询维护程序。通过该程序系统向各类用户提供了一个方便快捷的蒙古语词汇语义信息查询应用功能,设计实现了数据库维护功能,解决了蒙古语名词词汇语义网的动态更新问题。
     (4)研究设计了基于蒙古语名词词汇语义网的歧义消除算法,给出了基于语料库的多义词和同形词歧义消除实验设计步骤及结果分析。
Lexical semantic network is basic structure of expressing human language knowledge, which is constructed based on the word meaning and semantic relations. This article studied and realized the Mongolian Noun Lexical Semantic Network by absorbing and drawing the searching theories and methods of Wordnet and Chinese Lexical Network, combined with the current situation of Mongolian information processing, and by making the full use of other related resources. The purpose of it is to build the Mongolian Noun Lexical Semantic Network by combining auto transforming and manual intervention, and apply it in the systems of Mongolian lexical semantic searching, machine translation and so on.
     In the Mongolian Noun Lexical Semantic Network, we have mainly built the structure of Mongolian noun lexical concept and semantic relation network according to the designing of Wordnet, and have built Mongolian lexical semantic database. The construction of semantic relations is mainly based on the achievements of traditional semantics and existing all kinds of dictionaries and related writings.
     This article gives consideration to both the rationality of Wordnet structure and originality of the Mongolian lexical semantic system, and studied and experimented in the following aspects:
     (1) By using the Noun sub-database of Mongolian Semantic Information Dictionary, the noun part of Mongolian Synonym Small Dictionary and the noun part in Thesaurus as the main researching object, we constructed the Mongolian noun synonym sets, which are compatible with WordNet word concepts.
     (2) By using the Mongolian noun synonym sets as the organizing units, the semantic relations are firstly transplanted from Wordnet, and then by using Mongolian Synonym Small Dictionary, Mongolian Dictionary and other Mongolian All Kinds of Semantic Knowledge Database for suitable correction, the lexical semantic network which accords with the characteristic of Mongolian itself is created step by step.
     (3) The searching and maintaining program of Mongolian Noun Lexical Semantic Network is studied and developed by combining with the computer database technology and web program developing technology. Through this program system, we provide to all kinds of clients with a convenient and quick Mongolian lexical semantic information searching and application function, designed and realized a database maintaining function, and solved the problem of dynamically updating the Mongolian Noun Lexical Semantic Network.
     (4)The disambiguation algorithm based on the Mongolian Noun Lexical Semantic Network is studied and designed, and the experiment designing steps and result analysis of disambiguating polysemants and homographs based on corpuses is provided.
引文
① 朱虹,刘扬.词汇语义知识库的研究现状与发展趋势[J].情报学报.2008年第6期870-877页
    ② 黄居仁,谢舒凯,洪嘉辞等.“中文词汇网络_跨语言知识处理基础架构的设计理念与实践”[J].中文信息学报.2010年第2期14-22页
    ① 陈群秀.现代汉语述语动词机器词典的扩充和槽关系研究.《语言文字应用》[J].200]年第04期
    ② 于江生,俞士汶.“中文概念词典的结构”[J].中文信息学报.2002年第4期.
    ① 张志毅,张庆云.《词汇语义学》[M].商务印书馆.2005.第1页
    [1]Beckwith R, Miller G A, Tengi R. Design and Implementation of the WordNet Lexical Database and Searching Software[J]. Specification of WordNet.1993
    [2]Fellbaum C. WordNet:an Electronic Lexical Database [M]. MIT Press.1999
    [3]Miller G A. An on line lexical database[J].International Journal of Lexicography.1990.3 (4):235-244.
    [4]Kamps J. Visualizing WordNet Structure[C].ICGW 2002. India.2002
    [5]Gross D, Miller K. Adjectives in WordNet [J].International Journal of Lexicography, 1990.3 (4):265-277.
    [6]Fellbaum C. Cooccurrence and antonymy[J]. InternationalJournal of Lexicography,1995.8 (4) :281-303.
    [7]Fellbaum C, Miller G A, Curtiss S, etc. An auditory processing deficit as apossible sour ce of SLI [A].Proceedings of the 19th Boston University Conference on Language Development [C]. Ithaca.NY:Cascadilla Press.1995.204-215.
    [8]Miller G A. Noun in WordNet:a Lexical Inheritance System[J].Specification of WordNet.1993.
    [9]Miller G A. et al. Introduction to WordNet:An On-line Lexical Database[J]. Specification of WordNet.1993.
    [10]Pavelek P, Pala K. VisDic-a New Tool for WordNet Editing[C].ICGW 2002. India.2002.
    [11]Vossen P. Euro WordNet:a Multilingual Database with Lexical Semantic Networks. Dordrecht. Kluwer.1998.
    [12]Wilson R A, Keil F C. The MIT Encyclopedia of the Conginitive Sciences[M].London Cambri dge. Massachusetts:MIT Press.1999.
    [13]Liu Y, Yu J S, Yu S W A Tree-Structure Solution for the Development of Chinese[C].WordNe tICGW 2002. India.2002.
    [14]Liu Y, Yu S W, Yu J S. Building a Bilingual WordNet-Like Lexicon:the New Approach and Algorithms [C].COLING2002. Taipei. China.2002.
    [15]Yu J S. Evolution of WordNet-Like Lexicoa [C]. ICGW 2002. India.2002.
    [16]Yu J S, Liu Y, Yu S W. Construction of WordNet-Like Lexicon[C].WCLS2002. Taipei. China. 2002.
    [17]Yu J S, Yu S W, Liu Y, Zhang H R. Introduction to CCD[C].ICCC2001. Singapore.2001.
    [18]Mei-chun Liu. Ting-yi Chiang. The Construction of the Mandarin VerbNet A Frame-based Study of statement VerbsVerbs[J].LANGUAGE AND LINGUISTICS 9.2:239-270.2008.
    [19]Chang J S, You G N. etc. Building a Bilingual WordNet and Semantic Concordance from Corpu sand MRD[C].WCLS2002. Taipei. China.2002
    [20]Huang ChuRen,ChangRuYng,ShiangBinLee.SinicaBowBilingualOntological WordNet). Integration of Bilingual WordNet and SUMO[C].Proceedings of LREC2004/Lisbon.2004.1553-1556.
    [21]张全.WordNet与HNC的语义知识表示[C]. Advances in Computation of Oriental Languages-P roceedings of the 20th International Conference on Computer Processing of Oriental Languages.2003年.
    [22]朱虹,刘扬.词汇语义知识库的研究现状与发展趋势[J].情报学报.2008年第6期.
    [23]黄居仁,谢舒凯,洪嘉馡等.中文词汇网络_跨语言知识处理基础架构的设计理念与实践[J].中文信息学报.2010年第2期.
    [24]那顺乌日图.蒙古文信息处理概述[C].The second China-Japan Natural Joint Processing Research Promotion Conference, Peking.2002年10月.
    [25]那顺乌日图.关于面向信息处理的蒙古语义研究[J].内蒙古大学学报.2002年第5期.
    [26]德·萨日娜、那顺乌日图.蒙古语语义信息词典的初步构建[C].第十届全国计算语言学学术会议.中国计算机语言学研究前沿进展(2007-2009).2009年.
    [28]张志毅,张庆云.《词汇语义学》[M].商务印书馆.2005年.
    [29]贾君枝,董刚.FrameNet_WordNet_VerbNet比较研究[J].情报科学.2007年第11期.
    [30]张俐,李晶皎,胡明涵,姚天顺.中文WordNet的研究及实现[J].东北大学学报(自然科学版)第24卷第4期.2003年4月.
    [31]KipperKarinSchuler.VERBNET.A Broad-Coverage Comperhensive Verb Lexicon[EB/OL].http://repo sitory.upenn.edu/dissetations.AAI3179808,2006-12-14.
    [32]俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004年第5期.
    [33]于江生,俞士汶.中文概念词典的结构[J].中文信息学报.2002年第4期.
    [34]刘扬,俞士汶,于江生.CCD语义知识库的构造研究[J].小型微型计算机系统.2005年第8期.
    [35]刘扬,俞士汶,CCD构造模型及VACOL辅助软件的设计与实现[J].语言文字应用.2003年第1期.
    [36]王惠、詹伟东、俞士汶.“现代汉语语义词典”的结构及应用[J].语言文字应用.2006年第2期.
    [45]贾晞儒.蒙古语反义词概述[J].青海民族学院学报.1985年第1期.
    [53]德·萨日娜.蒙古语语义词典的数据库建设[C].《中文计算技术与语言问题研究—第七届中文信息处理国际会议论文集》.电子工业出版社.2007年9月.
    [54]海银花,那顺乌日图.面向蒙古语语义信息词典的名词语义分类体系[C].第十届全国计算语言学学术会议.中国计算机语言学研究前沿进展(2007-2009),2009年.
    [55]德·萨日娜.关于蒙古语语义分析的思考[J].内蒙古社会科学(汉文版).2004年第3期.
    [59]其木格.蒙汉语常用语义格对比研究[D].中央民族大学硕士学位论文.2008年6月.
    [60]毕玉德,闫艳萍.一种基于WordNet的多语种词汇语义网半自动构建方法[J].解放军外国语学院学报.2008年9月.
    [73]林杏光.《词汇语义和计算语言学》[M].语文出版社.1999年5月.
    [81]贾彦德.《汉语语义学》[M].北京大学出版社.1999年9月.
    [85]哈斯.基于搭配词库的蒙古文同形词歧义消除[J].内蒙古师范大学学报(自然科学版).2011年第2期.
    [86]姚天顺,朱靖波等.《自然语言理解》(一种让机器懂得人类语言的研究).清华大学出版社.2002年10月.
    [89]哈斯.蒙古文WordNet名词同义词集合构建算法[J].中国计算语言学研究前沿进展(2009-2011)清华大学出版社.2011年8月.
    [90]金书包.用义素分析法探析反义词、近义词与上下位词[J]内蒙古社会科学.2002年第5期.
    [91]金书包.蒙古语反义词研究中存在的问题[J].内蒙古社会科学.2010年第2期.
    [95]曹都毕力格.《蒙英汉辞典》[Z].内蒙古教育出版社.2006
    [100]那顺乌日图.蒙古语语言知识库的建立与应用[J].中文信息学报.2011年第6期.
    [104]李慧.蒙古语语义知识词典的研究与实现[D].内蒙古大学硕士学位论文.2012年6月.
    [105]陈群秀.一个在线义类词库:词网WordNet [J].语言文字应用.1998年第2期.
    [106]姚天顺,张俐,高竹.WordNet综述[J].语言文字应用.2001年第1期.
    [107]董振东.语义关系的表达和知识系统的建造[J].语言文字应用1998年第3期 (总第27期).
    [108]董振东.汉语知识词典及词汇内部语义描述研究[J].语言文字应用.2000年第1期.
    [109]董振东,董强.知网和汉语研究[J].当代语言学.2001年第1期.
    [110]陈群秀.现代汉语述语动词机器词典的扩充和槽关系研究[J].语言文字应用.2001年第4期.
    [111]冯志伟.计算语言学基础[M].商务印书馆.北京.2008年1月.
    [112]俞士汶.《计算语言学概论》[M].商务印书馆.北京.2003年9月.
    [113]黄昌宁,李涓子.《语料库语言学》[M].商务印书馆.北京.2002年.
    [114]李茜.框架网(FrameNet)一项基于框架语义学的词库工程.科技论坛[J].2005年第16期.
    [115]唐旭日.WordNet与HowNet之关系研究[J].湖北广播电视大学学报.2007年第7期.
    [116]王萌,何婷婷,姬东鸿,王晓荣.基于HowNet概念获取的中文自动文摘系统.《中文信息学报》.2005年第3期.
    [117]张晶,姚建民,赵铁军,李生.基于WordNet和HowNet建设双语语义词典[J].高技术通讯.2001年第12期.
    [118]徐力斌,刘宗田,周文,宋二伟.基于WordNet和自然语言处理技术的半自动领域本体构建[J].计算机科学2007年第6期.
    [119]张会平,吕学强,施水才,李渝勤.基于WordNet的语义分布词典建设[J].现代图书情报技术.2007年第3期.
    [120]高元梓.基于CEF和WordNet的词汇拓展框架的构建[J].重庆文理学院学报(社会科学版).2010年第3期.
    [121]王石,曹存根.一种WordNet概念自动翻译方法[J].中文信息学报.2009第7期.
    [122]赵小兵,邱莉榕,赵铁军.多民族语言本体知识库构建技术[J].中文信息学报.2011年第4期.
    [123]巴达玛敖德斯尔.面向信息处理的蒙古语词语分类体系研究[J].中央民族大学学报(哲学社会科学版).2004年第3期.
    [124]塔娜,林民,李小庆,宝美荣.面向跨语言信息检索的蒙汉语义词典的构建[J].内蒙古师范大学学报(自然科学汉文版).2011年第1期.
    [125]塔娜,林民,李小庆.面向跨语言信息检索的蒙汉语义词典构建初探[J].计算机与数字工程.2010年第8期.
    [126]李虎,田金文,王缓缓,石勇.基于Ontology的数据库自然语言查询接口的研究[J].计算机科学.2010年第6期.
    [127]刘宇鹏,李生,赵铁军.基于WordNet词义消歧的系统融合[J].自动化学报.2010年第11期.
    [128]吴思颖,吴扬扬.基于中文WordNet的中英文词语相似度计算[J].郑州大学学报(理学版).2010年第2期.
    [129]俞杨信.一种基于语义树的三维模型检索方法[J].信息系统.2011年第1期.
    [130]毕焕欢.基于WordNet和FrameNet的领域语义词典的构建研究[D].华中师范大学硕士学位论文.2011年5月.
    [131]罗俊丽,李慧娜,路凯.基于词义消歧的语义查询扩展研究[J].微电子学与计算机.2012年第1期.
    [132]岳峰,孙亮,王宽全,王永吉,左旺孟.利用构建语义词典的查询自动分类方法[J].哈尔滨工业大学学报.2008年第7期.
    [134]许方芳,郑诚,戈明东.语义网中的本体映射研究[J].计算机与现代化.2008年第2期.
    [135]舒鑫柱.现代汉语词汇语义网模型设计[J].山西大学学报(自然科学版)2005年第4期.
    [136]舒鑫柱.基于资源的汉语词汇语义网的实现[J].山西大学学报(自然科学版)2008年第1期.
    [137]柯淑津.以词汇知识驱动的词网自动对映[J].中文信息学报.2002年第4期.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700