用户名: 密码: 验证码:
现代汉语复杂句蜕块研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
由中科院声学所黄曾阳研究员创立的HNC(Hierarchical Network ofConcepts)理论是自然语言理解处理领域的重要理论,它以概念联想脉络为主导,建立了自然语言表述和处理的新模式。其模式之一是自然语言语句的表述模式,句类和语义块理论是该模式的主要内容。句类是语句的语义结构类型,语义块是语句的语义构成单位。语义块的整体或局部可以由句子蜕化而来,称为句蜕,它是语义块的特殊构成。句蜕之间或句蜕与其他成分之间的嵌套或组合以及句蜕内部语义块的复杂变化等形成复杂句蜕,包含复杂句蜕的语义块称为复杂句蜕块。HNC的语言理解处理模式称为句类分析,语义块构成分析是句类分析基本内容之一,而复杂句蜕块的分析是语义块构成分析的一大难点。
     从对语料的分析入手,在对HNC理论和语言学研究关于句蜕现象的认识进行比较的基础上,对复杂句蜕块现象归纳出不同的细类,并对每种类型进行深入分析,并用统计的方法得到句蜕块及复杂句蜕块的分布数据,观察它们的出现情况,在此基础上,结合HNC的句类分析技术,提出复杂句蜕块处理的基本策略,这是本文的研究思路。其中,对复杂句蜕块的分析是本文研究的重点,也是难点。在研究过程中,主要采用了归纳分析的方法和统计的方法,部分运用了演绎的方法。
     本文的主要研究内容就是复杂句蜕块分析,具体包括以下四个方面,这也是本文的主要贡献:
     (1)阐述了复杂句蜕块的定义和范围,并总结了语言学对句蜕块及复杂句蜕块这种语言现象的研究。
     (2)基于对真实语料的分析,给出了复杂句蜕块的三种类型的子类,并对各种类型进行了详细的研究。语义块的三种类型是:语义块=包装句蜕、语义块=变形句蜕和语义块=句蜕嵌套。其中,第一,对包装句蜕中包装成分的语义类型进行了详细的研究,并辨析了易混淆的前包装成分与语义块分离、包装句蜕和要素句蜕;第二,分析了变形句蜕的三种类型:伴随语义块分离的变形句蜕,伴随句类转换的变形句蜕和伴随语义块并合的变形句蜕;对三种情况进行了详细的研究;第三,把句蜕嵌套划分成三个大类,在三个大类下面又归纳出子类,对每种子类都进行了分析。
     (3)依据从人民日报、参考消息、光明日报等报纸杂志中抽取出来的部分真实文本(约150000字,叙述体),统计了句蜕现象在文本中的出现情况:含句蜕语义块有4420各,占语义块总数(15273个)的28.94%;含句蜕语串有2207个,占语串总数(6967个)的31.68%,说明了研究句蜕现象的重要性。在含句蜕语义块中,得到了各类型句蜕的分布情况;并统计得到了复杂句蜕块类型之一的句蜕嵌套类型下面各子类的分布数据,为HNC句类分析系统制定适当的句蜕处理策略提供了依据。
     (4)在简要介绍HNC句类分析技术的基础上,讨论了各类复杂句蜕块的处理策略,提出了各类型复杂句蜕块处理的大致思路。
     (2)和(3)是本文所做的主要工作,也是本文的创新之处。(2)是详细
    
    划分出了复杂句蜕块三种类型的子类,并对各子类进行了分析研究,其中对包
    装句蜕包装成分的语义类型的研究尤其深入,对句蜕块嵌套的子类划分及分析
    尚属首次。(3)是第一次得到了句蜕块及复杂句蜕块各类的分布数据,使我们
    对句蜕现象有了清晰的认识。因此,本文的研究将加深人们对句蜕现象的认识,
    并推进HNC理论对句蜕和复杂句蜕的研究,对复杂句蜕块的深入分析也将为
    HNC句类分析技术制定句蜕处理策略提供理论依据,并丰富现代汉语在句子和
    短语层面的研究。
     但由于时间所限及笔者能力上的欠缺,本文还存在一些问题尚未解决,其
    中包括对复杂句蜕块子类的更深入分析、对复杂句蜕块在不同文体中的分布的
    认识以及对复杂句蜕块的详细处理策略的研究等。
HNC ( Hierarchical Network of Concepts ), founded by Prof. Huang Zengyang, is an important theory of natural language understanding. It has established a new model for describing and processing natural language. One part of the model is the semantic patterns of sentences, which are based on the concepts of sentence category (SC) and semantic chunk. SC is the semantic category of sentences, and semantic chunk is the semantic component of sentences. Sentence decomposition (SD) which means a sentence degenerated to be a semantic chunk or a part of a semantic chunk, is a special type of composition of semantic chunk. Nesting or combination between SD forms complex sentence decomposition (CSD). Sentence category analysis (SCA) is the natural language processing model of HNC. The analysis of SD is important in SCA. And CSD processing is one of the most difficult parts. So, studying on CSD is the emphasis of this thesis.
    The main contents of this thesis includes:
    (1) Explains the definition and types of CSD, and introduces studies on SD and CSD in linguistics.
    (2) Enumerates and studies the types of CSD in detail on the basis of analyzing a quantity of corpus, including the following three aspects: the studies on the recapitulation of sentence decompositions, the studies on the transformation of sentence decompositions and the studies on the nesting of sentence decompositions.
    (3) Accounts the distribution of SD and CSD in testing text.
    (4) Introduces SCA of HNC, and discusses the processing strategies of each type of CSD
引文
丁声树等,1961,《现代汉语语法讲话》。商务印书馆
    古川裕,1989,《“的”字结构及其所能修饰的名词》。《语言教学与研究》 第一期
    郭齐禄,1990,《谈谈复杂的定语》。《语文教学与研究》 第二期
    黄曾阳,1997,《HNC理论概要》。《中文信息学报》 第四期
    黄曾阳,1998,《HNC(概念层次网络)理论》。清华大学出版社
    黄曾阳,2000,《自然语言理解处理的20项难点》。中科院声学所内部资料
    黄曾阳,2001,《HNC的发展和未来》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    金五鑫,1987,《AV式顺序定语刍议》。《汉语学习》 第五期
    晋耀红,1998,《基于 HNC 理论的句类分析系统的设计与实现》。中科院声学所硕士学位论文
    晋耀红,2001,《汉语的多动词难点处理》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    晋耀红,2001,《汉语句蜕处理》。《自然语言理解与机器翻译》,2001,清华大学出版社
    晋耀红,张全,杜燕玲,1998,《HNC的句类分析系统与传统的句法分析的比较研究》。《1998中文信息处理国际会议论文集》 清华大学出版社
    柯航,2001,《“对”字的语言学表述和 HNC 分析》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    李千驹,2001,《基于 HNC 理论的汉语定中结构研究》。广西师范大学硕士学位论文
    林杏光,1993,《进一步深入研究现代汉语的格关系》。《汉语学习》 第五期
    林杏光,2000,《词汇语义和计算语言学》。语文出版社
    刘智颖,2001,《论广义对象语义块的分离》。《自然语言理解与机器翻译》,清华大学出版社
    鲁川,林杏光,1989,《现代汉语语法的格关系》。《汉语学习》 第五期
    鲁川等,1993,《谓语的语义分类和语义组合模式》。《汉语学习》 第一期
    陆俭明,1983,《“的”字结构和“所”字结构》。《语法研究和探索 (2)》 北京大学出版社
    吕敬参,1987,《“名+谓”作定语问题》。《河南大学学报》 第二期
    马真,1981,《简明实用汉语语法》。北京大学出版社
    苗传江,1998,《HNC理论的句类》。《1998中文信息处理国际会议论文集》,清华大学出版社
    苗传江,1998,《自然语言理解的新进展——简评黄曾阳先生创立的 HNC 理论》。《科技导报》 第三期
    苗传江,2000,《HNC秋季讲习班教材》。中科院声学所内部资料
    苗传江,2001,《HNC句类知识研究》。中科院声学所博士学位论文
    苗传江,2001,《HNC自然语言表述模式与知识库建设》。《HNC与语言学研究研讨会论文集》,2001,武汉理工大学出版社
    苗传江,2001,《句类知识概要》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    苗传江,2001,《现代汉语特征语义块的构成和分离》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    
    
    彭淑莉,2001,《HNC理论下的“有”字意义与“有”字句》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    唐兴全,2001,《HNC理论的五元组与词性》,《自然语言理解与机器翻译》,清华大学出版社
    陶明阳,1999,《现代汉语特征语义块复合构成》。中国人民大学硕士学位论文
    王艾录,1989,《定中结构里的语义干涉现象》。《山西师范大学学报》 第四期
    王汉生,1987,《主谓词组充当定语的特点》。《阜阳师范学报》 第一期
    许嘉璐,2000,《现状和设想——试论中文信息处理与现代汉语研究》。《中国语文》 第6期
    薛侃,1999,《现代汉语的块扩及句蜕研究》。中国人民大学硕士学位论文
    薛侃,2001,《汉语包装句蜕研究》。《HNC与语言学研究研讨会论文集》。武汉理工大学出版社
    张普,1991,《信息处理用现代汉语语义分析的理论和方法》。《中文信息学报》 第三期
    张普,1992,《汉语信息处理研究》。北京语言学院出版社
    张普,1998,《主持人的话》。《语言文字应用》 第2期
    张庆旭,1996,《汉语述语动词框架分类及其语义限制》。《汉语学习》 第三期
    张全,2001,《时间概念短语初探》。《HNC与语言学研究研讨会论文集》,武汉理工大学出版社
    张艳红,1999,《HNC理论的主辅语义块及其相互变换》。北京语言文化大学硕士学位论文
    张艳红,2001,《英汉互译中的过渡处理》。《自然语言理解与机器翻译》,清华大学出版社
    朱德熙,1961,《说“的”》。《中国语文》 第十二期
    朱德熙,1978,《“的”字结构和判断句》。《中国语文》 第一、二期
    朱晓亚,2001,《现代汉语句模研究》。北京大学出版社

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700