面向中文信息处理的复句关系词自动标识研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
复句作为汉语语法的重要实体单位,在语法学界受到较多关注,且相关理论成果较多。但是,从中文信息处理的角度来看,汉语复句的信息化处理的相关成果还较少,复句信息工程尚未取得实质性的突破和进展。究其原因,一是研究还不全面深入,现有的成果还未囊括复句信息处理的所有环节和难题;二是大多数研究成果都是面向人的,很多方法在信息处理中操作性不强;三是各个研究相对孤立,未将所有环节串联起来,形成一个有机的整体。目前,复句的信息化研究主要是分句与非分句的识别、复句层次关系的识别,而这些研究都以关系词的提取为前提。可见,一方面,关系词的自动提取是其他各项研究工作得以开展的基础;另一方面,关系词作为构成复句的一个部件,本身也需要深入研究。在这种背景下,本文以面向中文信息处理为出发点,以邢福义先生的复句理论为指导,对复句关系词的自动标识方法进行研究和探讨,并以自动机理论、形式化逻辑等为辅助手段,对关系词标识涉及的问题进行建模,对总结的规则进行形式化描述和存储,并研究基于规则的关系词自动标识的方法,已达到自动标识复句关系词的目的。
     本文的研究主要从以下四个方面展开:
     1、全面总结影响关系词自动标识的因素。影响关系词标识准确率的因素主要有五类,分别为:关系副词的影响,介词的影响,关系标记不同用法的影响(同形异义词、同形异构词、同形异类词的关联和非关联用法的影响),关系标记搭配的影响和关系标记隐现形式的影响。对每一类影响因素,主要分析其各自的特点,并讨论对应的处理方法和策略。
     2、对标记连用现象进行深入研究。主要研究二标记连用和三标记连用时各个标记的语法语义功能和类别。对于二标记连用,归纳出矛盾类和限制类两种类型。这种类型的区分,既可以在计算机处理时减少不必要的计算,也可以作为复句分析过程中的一个切入点。三标记连用现象中,识别不同的关系词所需的方法不同,没有一个统一且粒度较细的策略,需要具体问题具体分析。
     3、研究句式特点与关系词标识之间的关系。主要考察三类句式:第一、格式固定且无歧义,但语义关系不好确定导致关系词辖域确定困难的句式,称之为特殊句式;第二、扩展句式,普通的基于搭配理论的算法不能很好地处理扩展句式的关系词标识问题;第三、多重复句的普通句式,复句实例的标记序列中含有多个标记对。对于特殊句式,采用表里关联的方式将标记序列与处理结果一一对应;对于扩展句式,采用自动机理论进行建模,既保证了可操作性,又保证了对语言现象的概括性;对普通句式,主要是把问题抽象化,并转化为数学模型,利用解空间的求解来对标记序列进行处理。针对上述句式,建立规则库,并探讨了基于规则的关系词自动标识方法。
     4、对部分充盈模态和非充盈模态下关系词的标识问题进行研究。文章首先对分句的语义关联理论进行了进一步地补充,提出3大类14个语义关联特征,并制定了特征分析的优先图,修正了分句语义关联度的计算方法。充盈模态下的关系标记主要考察“不是……就是……”,“虽然……但是……所以……”等。研究发现,对“不是……就是……”,可利用极值分析法处理;对“虽然……但是……所以……”,暂无较好的处理策略,需要建立常识知识库。非充盈模态下主要是对三分句句式的关系词的识别进行考察,发现从关系标记的典型和非典型属性入手,通过结合搭配知识,并利用分句的语义关联特征,可较准确地标识出各个分句中的关系词。
As an important entity unit of Chinese grammar, compound sentence gains much concern in the grammarians and has lots of relevant outcomes and theories. However, from the perspective of Chinese information processing, the processing of Chinese compound sentences has less relevant results, information engineering of compound sentence has not yet made any substantial progress. The reasons are, firstly, the study does not go deeply inside, and the existing studies have not yet include all aspects and problems of compound sentences information processing. Secondly, most of the research results are for the people, and the operability of many ways is not strong in information processing. Thirdly, each study is relatively isolate, and has not link the others, so has not form an organized whole. Currently, the study of compound sentence information technology is mainly about the identification of clause and non-clause and identification the layers of compound sentence, but the extraction of the relational markers is the premise of all the studies. So we can see that, on the one hand, the automatic extraction of relational markers is the base of other various studies which can be carried out, on the other hand, relational markers as a part of compound sentence needs further study. In this situation, this paper takes the Chinese information processing as a starting point, and takes the compound sentence theory of Mr. Xing-fuyi as guidance, to research and study the automatic identification and markup method of relation markers, and with the automata theory and formal logic as auxiliary means to model the issues involved about identifies of relation markers, and to describe and storage the rules, to design the prototype model of auto-identification system of the relation markers based on rules.
     The study of this paper involves the following four parts:
     Firstly, it sums up the factors which have influence on auto-markup of relation markers comprehensively. The factors are classified mainly into five categories, which are the influence of the adverbs, of the prepositions, of the different usage of relation markers, of the collocations and the occurrence and non-occurrence respectively. For each type of factor, it mainly analyzes its features and make up the corresponding strategies.
     Secondly, it studies the co-occurrence of relation markers, and mainly focuses on syntax and semantic function and types of the two and three markers. There are two types of the two markers' co-occurrence, which are contradiction type and constriction type. It not only can reduce the unnecessary computing in the processing, but also can be seen as a checkpoint in the analyzing of compound sentences for distinguishing the two types. In the co-occurrence of three markers, it does not have a unified strategy, but needs to use different method to identify the different markers.
     Thirdly, it studies the relation between the mark-up of relation markers and the pattern of sentences. It mainly studies three kinds of patterns. The first is called special pattern, the feature of this pattern is that its form is solid and is unambiguous, but the jurisdiction range of the markers is hard to determine result from the hard identification of its semantic relationship. The second is called expanding pattern, the ordinary algorithms can not deal with the identification of relation markers of this pattern. The third is called ordinary pattern, the feature of this pattern is that the compound sentences of this pattern have multiple semantic layers, and have multiple relation markers pairs. For special pattern, it uses the strategy of mapping to map the sequence of relation markers to its corresponding mark-up results. For expanding pattern, it uses the automata theory to modeling, by doing this, it not only assures its operability, but also assures its generality of the phenomenon. For ordinary pattern, its strategy is to abstract the problems, and transform the problems to mathematical models, and then uses the computing of resolution space to deal with the sequence of relation markers.
     Fourthly, it studies some problems partly in saturated mode and non-saturated mode. Firstly, the paper makes some supplementary of the theory of semantic relevancy. It proposes 14 semantic relevance features which classified into three categories, and makes out a preferred diagram for feature analysis. It also amends the computing method of semantic relevance degree. It mainly studies the relation markers "bushi…jiushi…", "suiran…danshi…suoyi…" in saturated mode. It finds that the method of polarity analysis can be used to deal with the markers of "bushi…iushi…". For markers "suiran…danshi…suoyi…", it does not have any effective method except for building common sense knowledge base. It mainly studies the relation markers of the sentences with three clauses in non-saturated mode. It finds that by considering the typical and atypical attribute of relation markers, and combining the knowledge of collocation, and using the semantic relevance feature of clauses, it can mark-up the relation markers accurately.
引文
[1]罗进军.有标假设复句研究.武汉:华中师范大学博士学位论文,2007.
    [2]范开泰.关联词语[M].上海:上海教育出版社,1981.
    [3]邢福义.复句与关系词[M].哈尔滨:黑龙江人民出版社,1985.
    [4]王维贤.现代汉语复句新解.上海:华东师范大学出版社,1994.
    [5]邢福义.汉语复句研究[M].北京:商务印书馆,2001.
    [6]周刚.连词与相关问题研究.合肥:安徽教育出版社,2002.
    [7]姚双云.复句关系标记的搭配研究与相关解释.武汉:华中师范大学博十学位论文,2006.
    [8]刘云.复句关系词语离析度考察[J].语言教学与研究,2008(6)
    [9]肖升.面向中文信息处理的受限有标复句联结机制分析.武汉:华中师范大学博士学位论文,2010.
    [10]吴锋文.汉语复句关系词库的建设及其利用[J].语言科学,2010(2)
    [11]王弘宇.数量因素对“不是A,就是B”格式意义的制约作用[J].世界汉语教学.1995(2)
    [12]刘颂浩.也谈“不是A,就是B”格式[J].世界汉语教学.1996(1)
    [13]王弘宇.细说“不是A,就是B”格式[J].世界汉语教学.1996(4)
    [14]刘乃仲.“不是A,就是B”的又一种并列句[J].吉林大学学报.1998(5)
    [15]周有斌.“不是A,就是B”句表述对象的数量及作用[J].安徽教育学院学报.2002(1)
    [16]周有斌.制约选择项在“不是…就是…”中出现顺序的因素[J].琼州大学学报,2003(4)
    [17]朱斌.现代汉语“是”字句然否类型联结研究[D].华中师范大学博士学位论文,2002(3)
    [18]肖元珍.限选式“不是A,就是B”分析[D].广州:暨南大学硕士学位论文,2005.
    [19]钟莹.“不是A,就是B”格式及相关问题研究[D].广州:暨南大学硕士学位论文,2006.
    [20]吴孟君.连词“尽管”与“即使”的区别.语文教学通讯,1982(2).
    [21]吕敬参.也谈“虽然…但是…因此…”式复句的分析.河南大学学报(哲学社会科学版),1988(5).
    [22]王忠良.“即使……但是”复句逻辑初探.延边大学学报(社会科学版),1992(2).
    [23]肖伟良.关于“虽然……但是……所以……”这类复句的层次分析.广西梧州师范高等专科学校学报,1998(10)
    [24]刘雪春.“即使…也…”式复句的逻辑分析.郑州大学学报(哲学社会科学版),1998(3)
    [25]戴悉心.“即使”句的分类及其语义语用分析.世界汉语教学,2001(2).
    [26]李国庆.现代汉语的“不是P,也是Q”复句.安徽教育学院学报.2002(5)
    [27]李冲.“即使……也……”还是“虽然……但……”.语文学刊,2004(2)
    [28]王收奇.“即使连x(,)Y”嵌套式.汉语学习,2005(2).
    [29]张宝胜.“宁可”复句的语义特征.语言研究,2007(1).
    [30]于红梅.副词“都”研究综述.牡丹江师范学院学报(哲社版),2007(6)
    [31]邵敬敏.“连A也/都B”框式结构及其框式化特点.语言科学,2008(4).
    [32]张邱林.“尚且p,何况q”反逼句式.世界汉语教学,2009(3)
    [33]韩栋.“哪怕”的多角度研究.郑州:河南大学硕十学位论文,2009.
    [34]邝岚.论“如果”和“如果说”[J].暨南大学华文学院学报,2005(2).
    [35]沈家煊.复句三域“行、知、言”[J].中国语文,2003(3)
    [36]张学成.复句句式语义层刍议[A]/陆俭明.面临新世纪挑战的现代汉语语法研究[C].济南:山东教育出版社,1999.
    [37]李琼.汉语复句熟读前后语言片段的非分句识别[D].武汉:华中师范大学博十学位论文,2008.
    [38]邹嘉彦等.中文篇章中的关联词语及其引导的句子关系的自动标注.中文信息处理会议论文集[C].1998.
    [39]高维君.机器学习在汉语关联词语识别中的应用.中文信息学报.2000.
    [40]李文翔、晏蒲柳、张滨.基于语料库的关联词识别方法[J].计算机工程与应用,2004(7).
    [41]尹蔚、罗进军.从“是p,还是q”有标选择复句看合用型关系词的自动识别.中南大学学报(社会科学版).2007(6)
    [42]胡金柱,沈威等.基于渡越矩阵的复句关系词自动标注初探.微计算机信息.2007(30).
    [43]陆俭明.关于句处理中所要考虑的语义问题[J].语言研究,2001(1)
    [44]胡金柱、舒江波.面向中文信息处理的复句关系词提取算法研究[J].计算机工程与科学,2009(10).
    [45]胡金柱、罗旋、肖明.本体论在复句领域概念建模中的应用[J].计算机应用研究,2006(10).
    [46]胡金柱、王琳等.汉语复句本体模型初探[J].华中师范大学学报(自然科学版),2005(4)
    [47]鲁松、宋柔.汉英机器翻译中描述型复句的关系识别与处理.软件学报,2001(1)
    [48]鲁松、白硕、李素建等.汉语多重关系复句的关系层次分析[J].软件学报,2001(7).
    [49]李晋霞、刘云.面向计算机的二重复句层次划分研究[A].语言计算与基于内容的文本处理——全国第7届计算语言学联合学术会议论文集[C],2003.
    [50]洪鹿平,张霄军.面向信息处理的汉语复句研究.现代语文,2008(3)
    [51]邢福义.研究观测点的一种选择——写在“小句中枢”问题讨论之前[J].汉语学报.2004(1).
    [52]邢福义.汉语语法学.东北师范大学出版社.2000.
    [53]吴锋文.面向中文信息处理的三句式有标复句层次关系自动识别研究.武汉:华中师范大学博士学何论文,2010.
    [54]胡金柱,舒江波,罗进军.汉语复句中分句的语义关联特征.语言文字应用,2010(4)
    [55]李劲荣.状态形容词的可及性等级及连用顺序.南昌大学学报(人文社会科学版).2005(03).
    [56]刘云.汉语虚词知识库的假设[M].武汉:华中师范大学出版社,2009.
    [57]李琼、胡金柱等.现代汉语复句中短语字段的自动识别初探[J].宁夏人学学报,2008(1)
    [58]罗进军.面向复句信息处理的小句关联理论[J].湘潭师范学院学报(社科版),2006(6)
    [59]朱林清等.现代汉语格式初探[M].天津:天津人民出版社,1987.
    [60]吕叔湘.吕叔湘文集(1)·中国文法要略[M].北京:商务印书馆,1990.
    [61]罗进军.“如果说p的话,q”类有标假设复句检视[J].汉语学习,2007(3).
    [62]吴伟妙.怎样分析“虽然…,但是…,所以…”这类复句.中学语文教学.1997(12)
    [63]孟庆甫.再谈“虽然……,但是……,所以……”这类复句的层次划分.中学语文教学.1998(06)
    [64]陈伟琳.由介词“为”的兼容用法引发的思考.华中师范大学学报(人文社会科学版),1999(9).
    [65]刘云、俞士汶.现代汉语虚词知识库的建设[J].语言文字应用,2005(1).
    [66]陈中干.现代汉语复句研究[M].北京:语文出版社,1995.
    [67]储泽祥.汉语因果复句的关联标记模式与“联系项居中原则”[J].中国语文,2008(5)
    [68]丁志丛.有标转折复句的关联标记模式及相关解释[J].求索,2008(12)
    [69]董佳.关于复句关联词语和分句顺序的研究文献综述[J].现代语文(语言研究),2008(7).
    [70]董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3).
    [71]黄爱华.对“如果说……那么……”的几点分析[J].连云港教育学院学报,1995(1)
    [72]李国臣、孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005(1)
    [73]李晓琪.现代汉语复句中关联词的位置[J].汉语教学与研究,1991(2)
    [74]李宇明.信息时代的中国语言问题[J].语言文字应用,2003(1)
    [75]刘颖.计算语言学[M].北京:清华大学出版社,2002.
    [76]陆俭明.要重视特征的研究与描写[J].长江学术,2006(1)
    [77]吕叔湘.现代汉语八百词(增订本)[M].北京:商务印书馆,2004.
    [78]吕雅娟、李生.基于双语模型的汉语句法分析知识自动获取[J].计算机学报,2003(1)
    [79]罗进军.“如果说p的话,q”类有标假设复句检视[J].汉语学习,2007(3)
    [80]罗进军.基于句法识别的有标复句层次关系研究[J].汉语学报,2009(1)
    [81]骆小所、谢学敏.论单句、复句的结构机制及二者所负载的信息差异[J].云南师范大学学报,2010(4).
    [82]马清华.关联词语的结构控制作用[J].汉语学习,2006(6)
    [83]彭爽.现代汉语介词知识库的建设及相关研究[D].北京:北京大学博士学位论文,2006.
    [84]邵敬敏.建立以语义特征为标识的汉语复句教学新系统刍议[J].世界汉语教学,2007(4)
    [85]宋玉柱.“无论”偏句中的连词[J].语文建设,1995(11)
    [86]宋玉柱.再谈关联词语在单句成分间的连接作用[J].汉语学习,1990(3).
    [87]孙良明.研究汉语单复句划分应当明了的问题[J].语言教学与研究,2007(2)
    [88]汪国胜、刘秀明.关于多重复句的分析[J].华中科技大学学报(社会科学版),2004(6)
    [89]王振来.关联词语的经络连接功能[J].大连民族学院学报,2002(2)
    [90]吴锋文.基于规则的汉语复句层次关系自动识别研究[J].华文教学与研究,2010(1).
    [91]邢福义、姚双云.汉语复句语料库的建设与利用[A].朱小健.中文信息处理的探索与实践[C].北京:北京师范大学出版社,2006.
    [92]邢福义、汪国胜.现代汉语[M].武汉:华中师范大学出版社,2003.
    [93]邢福义.“如果……就……”和“只要……就……”[J].中学语文教学,1980(11)
    [94]邢福义.“要不是p就q”句式及其修辞作用[J].语文教学与研究,1984(1)
    [95]邢福义.转折词和“如果说p,那么q”句式[J].语文建设,1986(3)
    [96]许嘉璐.现状和设想——试论中文信息处理与现代汉语研究[J].中国语文,2000(6)
    [97]姚双云.递进层次句式的关联与易位[J].语言教学与研究,2006(4)
    [98]尹蔚.多维视域下的有标选择复句研究[D].武汉:华中师范大学博士学位论文,2008.
    [99]俞士汶.现代汉语语法信息词典详解[M].北京:清华大学出版社,1998.
    [100]俞士汶.语法知识在语言信息处理研究中的作用[J].语言文字应用,1997(4)
    [101]咎红英、张坤丽等.现代汉语虚词知识库的研究[J].中文信息学报,2007(5)
    [102]詹卫东.面向中文信息处的现代汉语短语结构规则研究[M].广西科学技术出版社,2000.
    [103]詹卫东.以“计算”的眼光看汉语语法研究的“本位”问题[J].汉语学报,2005(1)
    [104]张仕仁.汉语复句的结构分析[J].中文信息学报,1994(4)
    [105]张文贤、邱立坤.基于语料库的关联词搭配研究[J].世界汉语教学,2007(4)
    [106]张谊生.“就是”的篇章衔接功能及其语法化历程[J].世界汉语教学,2002(3).
    [107]赵越.关系词“不但…而且…”的合用与“而且”的单用[J].内蒙古师范大学学报,2002(5).
    [108]周刚.关联成分的套用及其省略机制[J].汉语学习,2001(6).
    [109]周静.“甚至”的篇章衔接功能与语法化历程[J].暨南学报,2004(5)
    [110]杨吉春.论单句中的“单”和复句中的“复”的真止含义.云南师范大学学报,2000(4).
    [111]肖奚强.略论“除了……以外”与“都”、“还”的搭配规则.南京师大学报(社会科学版),1996(2).
    [112]李素建.基于语义计算的语句相关度研究.计算机工程与应用,2002(7)
    [113]王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法.中文信息学报,2005(1).
    [114]周海岩.关于规则的形式化定义.太原师范专科学校学报,2002(2).
    [115]廖东红.关联理论与语义理解.达县师范高等专科学校学报(社会科学版),2005(5).
    [116]谭立重.关联理论与语义的确定.佛山科学技术学院学报(社会科学版),2005(5).
    [117]张平.程度副词“还”新探.广西民族学院学报(哲学社会科学版),2006(3).
    [118]周守晋.“主观量”的语义信息特征与“就”、“才”的语义.北京大学学报(哲学社会科学版),2004(3).
    [119]黄喜宏,方绪军.“只好”和“不得不”辨异.汉语学习,2009(6).
    [120]张志远.正规式到有限自动机的算法实现.中国民航学院学报,2005(5).
    [121]周娟.副词“还是”的非类同用法试析.汉语学习,2005(5).
    [122]刘云峰 等.中文信息的潜在语义分析.华南理工大学学报(自然科学版),2004(11).
    [123]宗成庆,曹右琦,俞士汶.中文信息处理60年.语言文字应用,2009(4).
    [124]邵敬敏,周芍.语义特征的界定与提取方法.外语教学与研究(外国语文双月刊),2005(1).
    [125]张运良.语义块的多元逻辑组合构成研究.计算机应用研究,2006(11).
    [126]胡明扬.语义和语法.汉语学习,1997(4).
    [127]王世凯.语义功能语法的结构主义阐释.汉语学习,2006(5).
    [128]余志鸿.语义跟语法的碰撞.语言研究,1991(2).
    [129]王培光.语义感与语法感的关系.中国语文,2004(2).
    [130]李明琴,李涓子等.语义分析和结构化语言模型.软件学报,2005(9).
    [131]胡培安.语义层面与时间词语的管界.修辞学习,2006(2).
    [132]俞理明.语义标记和汉语构词的不对称现象.汉语学习,2006(6).
    [133]史忠植,董明楷等.语义Web的逻辑基础.中国科学E辑,2004(10).
    [134]邹韶华.语频·语义·语法.汉语学习,2004(2).
    [135]邢福义.语法知识在语言问题思辨中的应用.华中师范大学学报(人文社会科学版),2003(5).
    [136]周国辉.语法的弱化和语义的显化.外语教学,2001(6).
    [137]曾常年.现代汉语因果句群研究.武汉:华中师范大学博士学位论文,2003.
    [138]刘海涛.依存语法和机器翻译.语言文字应用,1997(3).
    [139]王树西,赵星秋.一种基于自然语言的模式推理算法.计算机科学,2006(12).
    [140]赵鹏,耿焕同,蔡庆生.一种基于语义和统计特征的中文文本特征表示方法.小型微型计
    算机系统,2007(7)
    [141]徐阳春.也谈复句格式和复句语义的关系——评析《复句格式对复句语义关系的反制约》中的两个关键表述.西南民族大学学报·人文社科版,2003(8).
    [141]龙涛.也说语义语法范畴——兼议语义功能语法.汉语学习,2003(3).
    [142]张超,张树生等.需求驱动的语义模型构建方法研究.计算机应用研究,2006(11).
    [143]袁毓林.信息抽取的语义知识资源研究.中文信息学报,2002(5).
    [144]刑福义.小句中枢说.中国语文,1995(6).
    [145]姚双云.小句中枢理论的应用与复句信息工程.汉语学报,2005(4).
    [146]王继同.小句谓语句的逻辑分析.浙江大学学报,1993(4).
    [147]马海兵,刘永丹等.三种文档语义倾向性识别方法的分析与比较.现代图书情报技术,2007(4).
    [148]陈志明.篇章、语法对语义的制约作用——以《逍遥游》为例.山西师大学报(社会科学版),2006(6).
    [149]贺春英.名词语义中的时间特征.外语学刊,2006(5).
    [150]詹卫东.面向自然语言处理的现代汉语词组本位语法体系.语言文字应用,1997(4).
    [151]韩宝育.面向人的自然语言释义.陕西师范大学学报(哲学社会科学版),2004(6).
    [152]夏年喜.逻辑学、语言学与信息科学——论自然语言逻辑的学科性质.安徽大学学报(哲学社会科学版),2006(2).
    [153]刘国辉.论主谓结构中句首主语的认知语义基础.外语与外语教学,2005(7).
    [154]史锡尧.论语义与语法的关系.汉语学习,1992(3).
    [155]税昌锡,邵敬敏.论语义特征的语法分类.汉语学习,2006(1).
    [156]程晓堂.论小句复合体中的小句关系.外语学刊,2005(4).
    [157]方琰,E.McDonald.论汉语小句的功能结构.外国语,2001(1).
    [158]田朝霞.论汉语歧义成结小句的概念内容与语法体现关系.西北大学学报(哲学社会科学版),2007(6).
    [159]萧国政.句子信息结构与汉语语法实体成活.世界汉语教学,2001(4).
    [160]袁毓林.句子的焦点结构及其对语义解释的影响.当代语言学,2003(4).
    [161]陆俭明.句法语义接口问题.外国语,2006(3).
    [162]魏本力,武成.介词短语的语义空间.四川外语学院学报,2006(5).
    [163]马庆株.结合语义表达的语法研究.汉语学习,2000(2).
    [164]靳光瑾.计算机理解汉语需要语法理论支撑.语言文字应用,1999(2).
    [165]周明,李生等.计算机对汉语复句的分析.情报科学,1990(1).
    [166]张蕾,李学良.基于知识图的语义分析.西北大学学报(自然科学版),2002(2).
    [167]韦向峰,缪建明,张全.汉语句群领域的自动抽取研究.计算机工程与应用,2009(4).
    [168]张仰森等.基于语料库的自然语言建模方法研究.计算机科学,2004(5).
    [169]马永军.基于依存语法的自然语言处理现状及前景展望.学术交流,2007(10).
    [170]冯晋,李春平.基于统计学和语义信息的中文文本主题识别技术.清华大学学报(自然科 学版),2005(S1).
    [171]岳安步,林作铨.基于四值语义的缺省逻辑.计算机学报,2005(9).
    [172]封春升,郝爱民.基于模式匹配的自然语言识别.计算机工程与应用,2006(19).
    [173]苗传江.基于HNC句类体系的句子语义研究.语言文字应用,2006(1).
    [174]姚天昉,娄德成.汉语语句主题语义倾向分析方法的研究.中文信息学报,2007(5).
    [175]袁毓林,王健.汉语拥有关系的语义模式和语法表现.世界汉语教学,2007(4).
    [176]娄德成,姚大昉.汉语句子语义极性分析和观点抽取方法的研究.计算机应用,2006(11).
    [177]邹崇理,高东平.汉语句式形式语义研究的思考.哲学动态,2009(8).
    [178]张仕仁.汉语复句的结构分析.中文信息学报,1994(4).
    [179]苗传江,张庆旭,李绘新.功能合一语法.语言文字应用,1995(3).
    [180]朱岩.复句格式和分句间逻辑、语义关系的对应与不对应.盐城师范学院学报(人文社会科学版),2003(1).
    [181]刘巧惠.多重复句第一层次的分析方法.语言学习,2008(5).
    [182]冯志伟.从格语法到框架网络.解放军外国语学院学报,2006(3).
    [183]赵冬青,李雪瑞.LBS中位置及其语义的研究.武汉大学学报·信息科学版,2006(5).
    [184]陆俭明.“句式语法”理论与汉语研究.中国语文,2004(5).
    [185]温宾利.自然语言中的关系结构.外语教学与研究(外国语文双月刊),2001(4).
    [186]周俊生,戴新宇等.自然语言信息抽取中的机器学习方法研究.计算机科学,2005(3).
    [187]熊仲儒.自然语言的词序.现代外语,2002(4).
    [188]张蕾,李学良,刘小冬.自然语言处理中逻辑词的知识图分析.中文信息学报,2001(6).
    [189]吴晨,张全.自然语言处理中句群划分及其判定规则研究.计算机工程,2007(2).
    [190]缪建明,张全,吴晨.自然语言处理中的语句语义表示格式研究.计算机工程,2006(16).
    [191]黄昌宁,张小凤.自然语言处理技术的三个里程碑.外语教学与研究(外国语文双月刊),2002(3).
    [192]杨宪泽.自然语言处理的句法分析和规则索引.科技通报,2002(11).
    [193]张钹.自然语言处理的计算模型.中文信息学报,2007(3).
    [194]龚小谨、罗振声、骆卫华.汉语句子谓语中心词的自动识别[J].中文信息学报,2003(2).
    [195]郭志良.现代汉语转折词研究[M].北京:北京语言文化大学出版社,1999.
    [196]Berson,M. The structure of the collocational dictionary, International of Journal of Lexicography,1989(2).
    [197]Tsou BKY, Yuen Rwm. Polarity classification of celebrity coverage in the Chinese press[A]. International Conference on Intelligence Analysis[C]. Virginia, USA,2005.
    [198]Heine,Bernd. Kuteva,Tania. Word Lexicon of Grammaticalization. Cambridge:Cambridge University Press,2002.
    [199]Kennedy,G. An Intruduction to Corpus Linguistics. 北京:外语教育与研究出版社,2000.
    [200]Partington,A. Utterly content in each other's company:Semantic prosody and semantic preference. International Journal of Corpus Linguistics.2004(9).
    [201]YI J, NIBLACK W. Sentiment mining in Web Fountain[A]. Proceedings of the 21st International Conference on Data Engineering(ICDE 2005)[C]. Washington, DC, USA:IEEE Computer Society Press,2005.
    [202]Grosz B J,Sidner C L. Attention, Intentions and the Structure of the Discourse[J]. Computational Linguistics,1986(12).
    [203]Deborah Schiffrin. Discourse Markers, Cambridge:Cambridge University Press.1987.
    [204]Gleitman,Lila. Coordinating Conjunctions in English, Lanuage,1965.
    [205]Turney PD, Littmanml. Measuring praise and criticism:inference of semantic orientation from association[J]. ACM Transactions on Information System,2003,21(4).

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700