当前位置: 首页 > 专利查询>苏州大学专利>正文

一种隐式篇章关系类型推理方法及系统技术方案

技术编号:9718837 阅读:137 留言:0更新日期:2014-02-27 05:37
本发明专利技术提供了一种隐式篇章关系类型推理方法及系统,从中文和英文两个方面,在网络中检索与隐式篇章平行的显式篇章,再通过计算平行显式篇章与隐式篇章的相似度,选出与隐式篇章整体相似度最高的平行显式篇章,然后根据所述平行显式篇章的关系类型,来确定隐式篇章的关系类型。由于本发明专利技术提供的方法和系统,通过网络获得与隐式篇章相关的中文和英文篇章资源,因而,能够获得更多与隐式篇章相似度更高的显式篇章,从而提高了隐式篇章的关系类型推理的精确率。

【技术实现步骤摘要】
一种隐式篇章关系类型推理方法及系统
本专利技术涉及自然语言处理
,更具体地说,涉及一种隐式篇章关系类型推理方法及系统。
技术介绍
目前,篇章关系分析是自然语言处理的一个核心问题。篇章是指由一系列连续子句、句子或语段构成的语言整体,篇章关系是指同一篇章中相邻的句子之间的语义连接关系,篇章关系类型分析是指自动检测同一篇章内相邻子句、句子或语段之间的组织结构及逻辑关系,如因果关系、转折关系等。根据篇章中句子之间是否存在显式连接词(如因为、但是等),将篇章关系分为显式篇章关系和隐式篇章关系。在对显式篇章进行关系类型分析时,可直接根据显式连接词推断其具体关系类型,例如,显式篇章的显式连接词为“所以”,则显式篇章的关系类型为“因果关系”。但是,隐式篇章由于不具有显式连接词,因此,在对隐式篇章关系类型进行分析时,只能通过自然语言处理技术,结合语言学信息、具体的上下文语义信息以及相关领域知识进行推理,来识别隐式篇章关系的类型。现有的隐式篇章关系类型推理均是采用监督学习的方法,即采用模版匹配的方法,从生语料库中抽取显式篇章,并直接去除显式篇章中的连接词,人为构成隐式篇章模版,来获得训本文档来自技高网...

【技术保护点】
一种隐式篇章关系类型推理方法,其特征在于,包括:将英文隐式篇章翻译成中文隐式篇章,构建中文关键词和英文关键词,并根据所述关键词进行网络检索,获得中文篇章和英文篇章;从所述中文篇章和英文篇章中,选出与所述中文隐式篇章对应的中文平行显式篇章以及与所述英文隐式篇章对应的英文平行显式篇章;计算所述中文平行显式篇章与所述中文隐式篇章的相似度,以及所述英文平行显式篇章与所述英文隐式篇章的相似度,并选出整体相似度最高的若干个中文平行显式篇章和英文平行显式篇章;检测并获得所述若干个中文平行显式篇章和英文平行显式篇章的关系类型,然后根据所述关系类型的分值,确定所述隐式篇章的关系类型。

【技术特征摘要】
1.一种隐式篇章关系类型推理方法,其特征在于,包括: 将英文隐式篇章翻译成中文隐式篇章,构建中文关键词和英文关键词,并根据所述关键词进行网络检索,获得中文篇章和英文篇章; 从所述中文篇章和英文篇章中,选出与所述中文隐式篇章对应的中文平行显式篇章以及与所述英文隐式篇章对应的英文平行显式篇章; 计算所述中文平行显式篇章与所述中文隐式篇章的相似度,以及所述英文平行显式篇章与所述英文隐式篇章的相似度,并选出整体相似度最高的若干个中文平行显式篇章和英文平行显式篇章; 检测并获得所述若干个中文平行显式篇章和英文平行显式篇章的关系类型,然后根据所述关系类型的分值,确定所述隐式篇章的关系类型。2.根据权利要求1所述的方法,其特征在于,所述构建中文关键词和英文关键词的过程,具体为: 选出所述中文隐式篇章的实词,并将所述实词任意组合,构建实词对,所述实词对即为中文关键词; 选出所述英文隐式篇章的二元组,并将所述二元组任意组合,构建二元组对,所述二元组对即为英文关键词,其中,所述二元组是由两个连续词汇构成。3.根据权利要求2所述的方法,其特征在于,所述选出与所述中文隐式篇章对应的中文平行显式篇章以及与所述英文隐式篇章对应的英文平行显式篇章的原则是: 所述篇章的两个句子之间由显式连接词衔接; 所述显式篇章的第一句具有与所述隐式篇章的第一句相同的二元组或实词; 所述显式篇章的第二句具有与所述隐式篇章的第二句相同的二元组或实词; 所述显式篇章中的两个句子分别与所述隐式篇章中的两个句子平行,即对应核心词相同; 其中,所述隐式篇章为具有两个相邻句子的隐式篇章,所述两个相邻的句子即为第一句和第二句。4.根据权利要求3所述的方法,其特征在于,所述计算所述中文显式篇章与所述中文隐式篇章的相似度,以及所述英文显式篇章与所述英文隐式篇章的相似度,具体为: 利用向量空间模型、词频反文档频率以及余弦夹角公式,计算所述中文显式篇章的第一句与所述中文隐式篇章的第一句的相似度,所述中文显式篇章的第二句与所述中文隐式篇章的第二句的相似度; 利用向量空间模型、词频反文档频率以及余弦夹角公式,计算所述英文显式篇章的第一句与所述英文隐式篇章的第一句的相似度,所述英文显式篇章的第二句与所述英文隐式篇章的第二句的相似度。5.根据权利要求4所述的方法,其特征在...

【专利技术属性】
技术研发人员:洪宇严为绒
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1