摘要
语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语语义知识库的方法。该方法根据航空术语的特点将辅助构建分成四个关键过程,构建了2 000条术语概念描述(DEF)。最后通过对人工标注的术语间相似度与根据术语DEF计算的术语间相似度结果的对比,验证了该构建方法的有效性。
Semantic knowledge base is a basic resource of natural language processing.The existing large-scale semantic knowledge base is basically generic knowledge base,lacking the domain specific semantic knowledge.This paper proposes a semi-automatic method of constructing the semantic knowledge base of aviation terms by HowNet.It consists of four key processes of construction,resulting altogether 2 000 descriptions of the term concept(DEF).Finally,the validity of the method is verified by comparing the term similarities obtained by manual annotation and those obtained according to the term DEF.
引文
[1]董振东,董强.知网[EB/OL].http://www.keenage.com/.
[2]刘扬,俞士汶,于江生.CCD语义知识库的构造研究[J].小型微型计算机系统,2005,26(8):1411-1415.
[3]You L,Liu T,Liu K.Chinese FrameNet and OWLrepresentation[C]//Prpceedings of the 6the International Conference on Advanced Language Processing and Web Information Technology.IEEE Computer Society,2007:140-145.
[4]陈群秀,黄昌宁.现代汉语述语动词机器词典研究初探[C].全国计算机语言学联合学术会议,1993.
[5]董振东,董强.建设中文词汇语义资源中的一些问题和我们的对策[EB/OL].http://www.keenage.com.
[6]郝长伶,董强.知网知识库描述语言[C].全国计算语言学联合学术会议,2003.
[7]董振东,董强.面向信息处理的词汇语义研究中的若干问题[J].语言文字应用,2001(3):27-32.
[8]张桂平,刁丽娜,王裴岩.基于HowNet的航空术语语义知识库的构建[J].中文信息学报,2014,28(5):92-101.
[9]王羊羊,等.基于HowNet的术语语义知识库构建技术[J].沈阳航空航天大学学报,2016,33(4):78-84.
[10]冯志伟.特思尼耶尔的从属关系语法[J].当代语言学,1983,(1):63-65.
[11]陈小芳,等.基于统计和规则相结合的汉语术语语义分析方法[C].全国信息检索学术会议.2010.
[12]周其焕.航空术语的构词分析[J].中国民航大学学报,2007,25(4):60-64.
[13]刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3):565-573.
[14]Berger A L,et al.A maximum entropy approach to natural language processing[J].Computational Linguistics,1996,22(1):39-71.
[15]夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194.