【技术实现步骤摘要】
本专利技术涉及智能信息处理技术,特别涉及一种计算机理解自然语言的句子时,对包含动词的歧义结构的语义分析方法。
技术介绍
歧义问题是语言中普遍存在的现象,特别是由于汉语的“一字多义、一义多用”,使得汉语中的歧义现象更是普遍。语言学家对歧义问题有比较多的研究,比较重要的论著有赵元任(1959)《汉语中的歧义现象》、朱德熙(1980)《汉语句法中的歧义现象》、吕叔湘(1984)《歧义类例》、黄国营(1985)《现代汉语歧义短语》、邵敬敏(1994)《歧义分化方法探讨》,等等,这些文献归纳了大量的歧义现象,而且探讨了这些歧义的分化方法。从计算机信息处理的角度,也有较多的研究,冯志伟(1995)《论歧义结构的潜在性》探讨了歧义格式实例化为歧义结构的可能、詹卫东(2000)《面向中文信息处理的现代汉语短语结构规则研究》对现代汉语短语结构的定界歧义和结构关系的判定歧义做了系统的考察。歧义结构是指语言中存在的某种构成形式,它可以承载多种语言现象,形成多种内部关系,或者承载的一种语言现象同时具有多种内部关系,从而形成了歧义现象。动词歧义结构是指此结构中一定包含动词。歧义结构一般可以分为两类1、结构型歧义。结构型歧义是指同一结构,在语言表达中,如果所承载的语言现象不同,所处的语言环境不同,其所表达的语义关系就不同。比如下面的三个例子中的划线部分,同是“v+FKQ+的+FKH”结构,其中v代表动词,FKQ表示语义结构中“的”之前的部分,FKH表示语义结构中“的”之后的部分。在三个例子中,动词v和FKQ、FKH之间的语义关系却各不相同。参与这个计划的俄罗斯企业也遇到了一些严重 ...
【技术保护点】
一种用于句子分析中动词歧义结构消解的语义分析方法,包括:一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;具体步骤如下:1)、首先将要分析的文章输入计算机,选择一待处理的句子; 2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;3)、根据句子的预期知识做初步检查,检查句子的格式是否正确,若正确,转至步骤5),否则 ,执行步骤4);4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束 操作,否则,执行步骤6);6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;7)、利用句类演绎规则,在作用域内进行句蜕类型判断;8)、根据步骤7)的判断结果,若只有一种 ...
【技术特征摘要】
1.一种用于句子分析中动词歧义结构消解的语义分析方法,包括一用于表达动词的歧义结构的语义模型和根据语义模型进行动词歧义结构的判断、消解、计算的语义分析算法;具体步骤如下1)、首先将要分析的文章输入计算机,选择一待处理的句子;2)、假设句子中的某一个动词为全局的语义中心,根据全局语义中心对句子进行语义块切分,所述的全局语义中心是决定句子语义类型和句子内部语义关系的词语;3)、根据句子的预期知识做初步检查,检查句子的格式是否正确,若正确,转至步骤5),否则,执行步骤4);4)、检查句子中是否还有其他动词可假设为全局语义中心,若没有,结束操作,否则,跳转到步骤2);5)、检查句子中是否还有其他动词可以假设为局部语义中心,所述的局部语义中心是指句子中的子句的语义中心,若没有,结束操作,否则,执行步骤6);6)、根据上述语义块切分结果,确定局部语义中心中的动词的作用域,所述作用域为所在语义块的前后边界;7)、利用句类演绎规则,在作用域内进行句蜕类型判断;8)、根据步骤7)的判断结果,若只有一种句蜕类型,则句子无歧义,结束操作,否则,执行下一步;9)、利用句子全局语义核心的预期知识对歧义结构的语义角色进行判断,去除不符合预期知识的句蜕类型;10)、利用句子局部语义核心的预期知识,对句蜕类型的合理性进行判断,得到歧义结构的合理语义表示。2.根据权利要求1所述的用于句子分析中动词歧义结构消解的语义分析方法,其特征在于,所述的语义模型是利用句类演绎规则,把动词歧义结构上升到句子层面,将动词歧义结构的计算转换成句蜕类型的判断,所述的句蜕类型包括原型句蜕、包装句蜕、要素句蜕,当一个动词结构可同时满足两种以上句蜕类型的句类演绎规则时,该动词结构存在歧义。3.根据权利要求1所述的用于句子分析中动词歧义结构消解的语义模型,其特征在于,所述的句类演绎规则是对语义块内部的动词的语义角色和语义块内部的切分关系进行判断的规则,它的巴克斯范式是<句类演...
【专利技术属性】
技术研发人员:晋耀红,苗传江,邬郑,
申请(专利权)人:中国科学院声学研究所,
类型:发明
国别省市:11[中国|北京]