多语言电子词典构建
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
电词的研究是一门新兴的、跨领域的学科。语言学、词学的发展为其打下了坚实的理论础,计算科学、计算语言学、计算词学、语料库语言学及语料库的发展为其实现己的目标供了强有力的技支持和资源保障。本研究课拟就我国少数民族语言(主要以藏语为例)和汉语、英语互译的电词进行研究、设计和构建。
     多语言电词研究对民族语语音学研究、计算语言学研究、词学研究、器翻译、语言文字教学和民族文字信息处理领域的许多方面,具有重要的学价值和广泛的应用价值,其研究内容和方法涉及民族文字(藏文)分词技、计算语言学、计算词学、语料库语言学、民文信息词研究、统计语言学、数据库技、音频压缩解码技、人交互技、程序设计技等多个学科。多语言电词为民族语语音教学和学习研究供本依据。
     本文主要从多语言电词的总体方案设计入手,解决民族文字在电词中的实现,以及多语言词库的设计和多语言电词软件的实现。本课还重解决了民族文字鼠标取词以及民族文字和中英文在词软件上的混排问,其中,鼠标取词模块是多语言电词软件功能上的重和技上的难。
     最后阐了本课在多语言电词研究领域的不足和下一步的研究工作。
Electronic dictionary research is a new and interdisciplinary subject. The development of linguistics and lexicography which have built up a strong theoretical foundation, also computer science, computational linguistics, computational lexicography, corpus linguistics and corpus which provides a strong technology and resources protection for the development of electronic dictionary. This research project intended to research, design and construct electronic dictionary of Chinese minority language (especially Tibetan language), and English-Chinese translation.
     The research of multi-language electronic dictionary which have important academic value and broad application value on nation speech language studies, computational linguistics, lexicography research, machine translation, language teaching and national text information processing field, and the research contents and methods involving national characters participle technology (Tibetan), computational linguistics, calculation of lexicography, corpus linguistics, text information dictionary research, statistical linguistics, database technology and audio compression decoding technology, human-machine interaction, programming techniques, etc. Multi-language electronic dictionary provide the basic research for national language pronunciation teaching and learning.
     In this paper, we start from overall design of multi-language electronic dictionary to solve the realization of national characters in electronic dictionary, multi-language dictionary database design and multi-language electronic dictionary software implementation. This issue has also focused on solving problems of rar-word from the mouse of national characters and mixed problem of national characters and Chinese and English in electronic dictionary software. Among them, rar-word from the mouse is focal point and key technical difficulties in multi-language electronic dictionary software function.
     Finally, we discussed some research gaps and future research work of multi-language electronic dictionary.
引文
①主要参考了江狄、董颖红:《藏字叠加结构现行处理统计分析》[J],《中文信息》1994年第4期。林河水,程伟等,一种符合ISO14651语义的藏文排序实现方法,中文信息学报,2004,05(18)35-41
    [1]冯志伟.机器翻译与语言研究[J].术语标准化与信息技术,2007.
    [2]冯志伟.自然语言机器翻译新论[M].北京:语言出版社,1994.231
    [3]姚天顺,朱靖波.自然语言理解:一种让机器懂得人类语言的研究[M].北京:清华大学出版社,1995.215-216
    [4]章宜华.计算词典学与新型词典[M].上海:上海辞书出版社,2004.158-159
    [5] Hartmann,R R K & James,G. Dictionary of Lexicography. BeiJing Foreign Language Teaching and Research Press, 2000.
    [6]冯志伟.自然语言的计算机处理[M].上海:上海外语教育出版社,1996.
    [7] Amsler R A.Computational Lexicology: A Research Program.AFIPS Conference Proceedings, Huston,May,1982:657-663
    [8] [9]章宜华.关于计算词典学理论框架的探讨[J].辞书研究,2007,6.2-3
    [10]于洪志,何向真.基于Web页面的藏文在线输入技术[J].计算机工程,2008,34(18):260-262
    [11]王华伟,崔启亮.软件本地化[M].北京:电子工业出版社,2005,4.
    [12] Wikipedia. Unicode. http://en.wikipedia.org/wiki/Unicode, November, 2009
    [13] Microsoft.如何在Windows Vista中使用微软藏文键盘输入藏文. http://windows.microsoft. com/zh-CN/windows-vista/Microsoft-Tibetan-Keyboard-in-Windows-Vista
    [14] Wikipedia. Uniscribe. http://en.wikipedia.org/wiki/Uniscribe, November, 2009.
    [15]于洪志,喇秉军.Web环境下藏文页面音节处理技术[J].计算机应用研究,2008,Vol.25. 1298
    [16]江荻,周季文.论藏文的续性及排序方法[J].中文信息学报,2000,14(1):56-64
    [17]扎西次仁.中华大藏经·丹珠尔藏文对勘本字频统计分析[J].中国藏学,1997年第2期.
    [18]鲍怀翘等.藏语拉萨话语音声学参数数据库[J].民族语文,1992年第5期.
    [19] Daniel Jurafsky&James H.Martin著,冯志伟,孙乐译.自然语言处理综论[M].北京:电子工业出版社,2005.
    [20]索南当周、韩维良、德盖才郎,等.实用化汉藏机器翻译系统中藏语格助词和动词时态的处理[M].北京:电子工业出版社,1999.
    [21]江荻、董颖红.藏字叠加结构现行处理统计分析[J].中文信息,1994年4期.
    [22] GB 16959-1997,信息技术信息交换用藏文编码字符集基本集[S].中国国家标准汇编239.北京:中国标准出版社,1997.
    [23]彭寿全.藏文集外字编码方案及实现[C].第六届全国少数民族语言文字信息处理学术交流会论文,1995.
    [24]江荻,董颍红.藏文信息处理属性统计研究[J].中文信息学报,1994,9(2).
    [25]尼玛扎西.汉藏在线翻译多媒体电子词典设计研究与实现(硕士学位论文).拉萨:西藏大学,2008.
    [26]粟武宾.民族语文现代化与标准化[C].中国少数民族语言文字现代化文集,北京:民族出版社,1999.
    [27]李永宏,何向真,艾金勇,等.藏文编码方式及其相互转换.计算机应用,2009,29(7):2016-2018
    [28]罗秉芬、江荻.藏文计算机自动分词的基本规则[C].中国少数民族语言文字现代化文集,北京:民族出版社,1999.
    [29]扎西次仁.一个人机互助的藏文分词和词登录系统的设计[C].中国少数民族语言文字现代化文集,北京;民族出版社,1999.
    [30]罗秉芬、江荻.藏文计算机自动分词的基本规则[C].中国少数民族语言文字现代化文集,北京:民族出版社,1999.
    [1]金山词霸2009牛津版.北京金山软件有限公司.2008
    [2]金山词霸2010 beta.北京金山软件有限公司.2010
    [3]谷歌金山词霸合作版2010.谷歌公司,金山公司. 2010
    [4]有道桌面词典3.1.网易公司.2010
    [5]灵格斯2.7.0. http://www.lingoes.cn.2010
    [6] QQ词典1.0.深圳腾讯公司.2010
    [7] Babylon Pro 8.0.6.巴比仑有限公司.2010
    [8]谷歌翻译(Google Translate)客户端4.4.360. Google Translate and Wikipedia.2010
    [9]海词词典.美国印第安纳大学.2010
    [10]歌木斯阿语词典(阿汉英三语互译)1.0.歌木斯网.2010
    [11] Dr.eye译典通专业版8.0英业达(上海)有限公司.2008
    [12] IBM智能词典.IBM.2008
    [13]碧黎库特英汉维电子词典.新疆大学.2007
    [14]班智达藏汉英电子词典.青海师范大学.2006
    [15]英藏汉电子词典.西北民族大学.2002
    [1] Engkoo微软英库在线(http://www.engkoo.com)
    [2] Google字典(http://www.google.com/dictionary)
    [3]百度词典(http://dict.baidu.com/)
    [4]海词在线(http://dict.cn/)
    [5]金山爱词霸(http://www.iciba.com/)
    [6] Yahoo!字典(雅虎中国)(http://fanyi.cn.yahoo.com/)
    [7]牛津英汉双解词典(http://bbs.nuc.edu.cn/cgi-bin/oxdict.pl)
    [8]中国译典(http://www.chinafanyi.com/)
    [9]词博词典(http://www.cibo.cn/)
    [10]中国知网英汉-在线汉英词典(http://ecdict.cnki.net/)
    [11] 1000词典网(http://www.1000dictionaries.com/)
    [12]巴比伦词典网站(http://www.babylon.com)
    [13]韦氏英语词典(http://www.webster.com/)
    [14]剑桥在线词典(http://dictionary.cambridge.org/)
    [15]韦氏在线大词典(http://www.m-w.com/netdict.htm)
    [16]中华在线字典(http://www.ourdict.cn/)
    [1]金山词霸3.0 for iPhone.金山公司
    [2]有道词典for iPhone.网易公司
    [3] weDict for iPhone
    [4]欧路词典for iPhone.(http://www.eudic.net/eudic/iphone.aspx)
    [5] MDict for iPhone. (http://www.mdict.cn/)

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700