一种用于句子分析中动词歧义结构消解的语义分析方法技术

技术编号:2845837 阅读:293 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开了用于句子分析中动词歧义结构消解的语义分析方法,包括:语义模型的构建和语义分析方法,所述的语义模型用于表达动词的歧义结构,所述的语义分析方法根据语义模型实现歧义结构的判断、消解和计算。本发明专利技术的优点在于:建立一种表达动词歧义结构的统一的语义模型,把歧义结构上升到句子层面进行处理,把歧义结构的计算转换成句蜕类型的判断;把该语义模型形式化为句类演绎规则,使得歧义结构的计算、推理过程,有法可依、有章可循。

【技术实现步骤摘要】

本专利技术涉及智能信息处理技术,特别涉及一种计算机理解自然语言的句子时,对包含动词的歧义结构的语义分析方法。
技术介绍
歧义问题是语言中普遍存在的现象,特别是由于汉语的“一字多义、一义多用”,使得汉语中的歧义现象更是普遍。语言学家对歧义问题有比较多的研究,比较重要的论著有赵元任(1959)《汉语中的歧义现象》、朱德熙(1980)《汉语句法中的歧义现象》、吕叔湘(1984)《歧义类例》、黄国营(1985)《现代汉语歧义短语》、邵敬敏(1994)《歧义分化方法探讨》,等等,这些文献归纳了大量的歧义现象,而且探讨了这些歧义的分化方法。从计算机信息处理的角度,也有较多的研究,冯志伟(1995)《论歧义结构的潜在性》探讨了歧义格式实例化为歧义结构的可能、詹卫东(2000)《面向中文信息处理的现代汉语短语结构规则研究》对现代汉语短语结构的定界歧义和结构关系的判定歧义做了系统的考察。歧义结构是指语言中存在的某种构成形式,它可以承载多种语言现象,形成多种内部关系,或者承载的一种语言现象同时具有多种内部关系,从而形成了歧义现象。动词歧义结构是指此结构中一定包含动词。歧义结构一般可以分为两类1、结构型歧义。结构型歧义是指同一结构,在语言表达中,如果所承载的语言现象不同,所处的语言环境不同,其所表达的语义关系就不同。比如下面的三个例子中的划线部分,同是“v+FKQ+的+FKH”结构,其中v代表动词,FKQ表示语义结构中“的”之前的部分,FKH表示语义结构中“的”之后的部分。在三个例子中,动词v和FKQ、FKH之间的语义关系却各不相同。参与这个计划的俄罗斯企业也遇到了一些严重的问题。国家为维持产品的低价格而压低生产资料的价格。大家对制定这个计划的背景都很清楚。2、内容型歧义。内容型歧义是指同一语言现象,其内容本身的语义关系存在歧义。语言学界常见的例子,如“鸡不吃了”、“咬死了猎人的狗”,就是内容型歧义的代表。结构型歧义具有以下两个特点1)、结构型歧义是潜在的,当这个结构被具体语言现象实例化后,这种歧义就不复存在。对人理解来说,结构型歧义没有任何困难,但对计算机来说,则需要对同一结构,针对不同的条件,给出不同的检验操作,这样才能保证计算机面对结构型歧义时,不会无所适从。总结结构型歧义及其处理规则,是自然语言理解系统设计开发中最主要,也是最复杂的工作。2)、结构型歧义一般只局限于结构内部。结构的边界划分、内部的语义关系确定是结构型歧义解决的关键。与结构型歧义不同的是,内容型歧义,单就这个结构本身来说,对人和计算机都是有歧义的,这个歧义的解决,一般需要借助外部语言环境的帮助。语言学家研究较多的是内容型歧义,而计算机处理语言时,在关注内容型歧义的同时,还要关注结构型歧义。歧义结构的分析,不仅要靠歧义结构内部的语义约束,而且要靠外部的语言环境(句子层面或篇章层面)。以往的歧义结构研究大都是在短语层面进行,而且基本上只在语法层面研究歧义结构内部的约束,缺乏系统,可计算性差,严重制约了计算机理解语言的发展,也直接影响着机器翻译、自动摘要等深层次的语言分析技术的发展。本专利技术给出了一种统一的计算模型和方法,能有效地进行歧义结构的判断、消解和计算。
技术实现思路
本专利技术的目的是克服现有的动词歧义结构消解方法可计算性差等缺点,提供,实现对动词歧义结构的判断、消解和计算。为了实现上述目的,本专利技术提供了,包括一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;包括以下具体步骤1)、选择一待处理的句子;2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;3)、根据句子的预期知识做初步检验,检查句子的格式是否正确,若正确,转至步骤5),否则,执行步骤4);4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束操作,否则,执行步骤6);6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;7)、利用句类演绎规则,在作用域内进行句蜕类型判断;8)、根据步骤7)的判断结果,若只有一种句蜕类型,则句子无歧义,结束操作,否则,执行下一步;9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。上述技术方案中,所述的语义模型是利用句类演绎规则,把动词歧义结构上升到句子层面,将动词歧义结构的计算转换成句蜕类型的判断,所述的句蜕类型包括原型句蜕、包装句蜕、要素句蜕,当一个动词结构可同时满足两种以上句蜕类型的句类演绎规则时,该动词结构存在歧义。上述技术方案中,所述的句类演绎规则是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则,它的巴克斯范式是<句类演绎规则>∷=$<语义核心块所在的语义块内部的结构表示式KFJ> <入口><Eg属性><E属性><K属性> <检验条件> <判断结果类型> <语义核心块所在语义块内部的句类表示式KMJ>$其中,Eg表示全局语义核心块,E表示局部语义核心块,K表示语义块。上述技术方案中,所述的步骤2)中,所述的语义块切分的切分规则与语法学中的语义块切分规则相同。上述技术方案中,所述的步骤4)中,所述的预期知识是根据语法学研究所得到的句子语法规则。上述技术方案中,在所述的步骤7)中,包括7-1、选取一种句蜕类型的句类演绎规则;7-2、根据步骤7-1所选取的句类演绎规则,对作用域的语义块结构表达式做结构匹配操作,匹配成功,执行下一步,否则,跳转到步骤7-7;7-3、将句子的局部语义中心的属性和全局语义中心的属性分别与句类演绎规则的局部语义中心的属性和全局语义中心的属性做匹配操作,若匹配成功,执行下一步,否则,跳转到步骤7-7;7-4、对句类演绎规则中的“检验条件”逐个进行判断,判断成功,执行下一步,否则,跳转到步骤7-7;7-5、将局部语义中心所在的语义块的属性与句类演绎规则中的K属性做匹配,匹配成功执行下一步,否则,跳转到步骤7-7;7-6、步骤7-1所选取的句类演绎规则匹配成功,该句类演绎规则所对应的句蜕类型成立;7-7、判断是否还有其他类型的句类演绎规则,若有,跳转到步骤7-1,否则,结束操作。本专利技术的优点在于1、建立了一种表达动词歧义结构的统一的语义模型,把歧义结构上升到句子层面进行处理,把歧义结构的计算转换成句蜕类型的判断。2、把该语义模型形式化为句类演绎规则,使得歧义结构的计算、推理过程,有法可依、有章可循。3、分析算法以句子语义中心确定和歧义结构的角色确定为前提,使得歧义结构的处理能做到有本文档来自技高网
...

【技术保护点】
一种用于句子分析中动词歧义结构消解的语义分析方法,包括:一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;具体步骤如下:1)、首先将要分析的文章输入计算机,选择一待处理的句子; 2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;3)、根据句子的预期知识做初步检查,检查句子的格式是否正确,若正确,转至步骤5),否则 ,执行步骤4);4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束 操作,否则,执行步骤6);6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;7)、利用句类演绎规则,在作用域内进行句蜕类型判断;8)、根据步骤7)的判断结果,若只有一种 句蜕类型,则句子无歧义,结束操作,否则,执行下一步;9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义 结构的合理语义表示。...

【技术特征摘要】
1.一种用于句子分析中动词歧义结构消解的语义分析方法,包括一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;具体步骤如下1)、首先将要分析的文章输入计算机,选择一待处理的句子;2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;3)、根据句子的预期知识做初步检查,检查句子的格式是否正确,若正确,转至步骤5),否则,执行步骤4);4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束操作,否则,执行步骤6);6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;7)、利用句类演绎规则,在作用域内进行句蜕类型判断;8)、根据步骤7)的判断结果,若只有一种句蜕类型,则句子无歧义,结束操作,否则,执行下一步;9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。2.根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析方法,其特征在于,所述的语义模型是利用句类演绎规则,把动词歧义结构上升到句子层面,将动词歧义结构的计算转换成句蜕类型的判断,所述的句蜕类型包括原型句蜕、包装句蜕、要素句蜕,当一个动词结构可同时满足两种以上句蜕类型的句类演绎规则时,该动词结构存在歧义。3.根据权利要求1所述的用于句子分析中动词歧义结构消解的语义模型,其特征在于,所述的句类演绎规则是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则,它的巴克斯范式是<句类演...

【专利技术属性】
技术研发人员:晋耀红苗传江邬郑
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有1条评论
  • 来自[湖南省长沙市电信] 2015年03月27日 16:35
    动词(Verb),就是用来形容或表示各类动作的词汇。基本上每个完整的句子都有一个动词,要表示第二个动作时可使用不定词、动名词、对等连接词、从属连接词或增加子句等方法连结。
    0
1