一种事件关系检测方法及系统技术方案

技术编号:11993405 阅读:57 留言:0更新日期:2015-09-02 21:23
本发明专利技术公开了一种事件关系检测方法和系统,包括:获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与其逻辑关系对应的测试连接词;确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;通过分析进行分词处理后的测试前置文本和测试后置文本的框架语义,构建测试前置向量及测试后置向量;确定每个测试句子的测试前置向量与测试后置向量组成其测试向量对;获取待测向量对,从全部测试向量对中确定出与待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为待测向量对对应的待测句子的逻辑关系。由此,不仅实现了通用性,获取的检测结果还具有较高准确度。

【技术实现步骤摘要】

本专利技术设及自然语言处理
,更具体地说,设及一种事件关系检测方法及 系统。
技术介绍
逻辑关系能将离散于文本中的事件相连接,而事件关系检测则是一项面向事件之 间逻辑关系(包括因果关系、时序关系等)的自然语言处理技术,通常用于确定离散于文本 中的事件的逻辑关系,其中,事件通常指文本中完整事件的语义单元,如事件句子等。 现有技术中用于检测离散于文本中的事件间的逻辑关系的事件关系检测方法仅 仅着眼于某一特定的逻辑关系,如因果关系,即,仅仅能检测出具有某一特定逻辑关系的事 件,因此,现有技术中的事件关系检测技术不具有通用性。 综上所述,现有技术中的事件关系检测技术不具有通用性。
技术实现思路
本专利技术的目的是提供一种事件关系检测方法及系统,W解决现有技术中的事件关 系检测技术不具有通用性的问题。 为了实现上述目的,本专利技术提供如下技术方案: 一种事件关系检测方法,包括:[000引获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句 子的逻辑关系对应的测试连接词; 确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接 词之后的文本为测试后置文本; 分析进行分词处理后的测试前置文本的框架语义,W构建分别与每个测试句子对 应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,W构建分别与每个 测试句子对应的测试后置向量; 确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试 向量对; 获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似 度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对 应的待测句子的逻辑关系。 优选的,所述分析进行分词处理后的测试前置文本的框架语义,W构建分别与每 个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,W构 建分别与每个测试句子对应的测试后置向量,包括: 对所述测试前置文本进行分词处理,得到分别与每个测试句子对应的测试前置词 组;对所述测试后置文本进行分词处理,得到分别与每个测试句子对应的测试后置词组; 分析所述测试前置词组中的词语的框架语义,得到每个测试句子的前置框架语义 集合; 分析所述测试后置词组中的词语的框架语义,得到每个测试句子的后置框架语义 集合; 利用所述前置框架语义集合构建每个测试句子的测试前置向量,利用所述后置框 架语义集合构建每个测试句子的测试后置向量。[001引优选的,所述获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一 个与该测试句子的逻辑关系对应的测试连接词,包括: 获取指定文本信息; 将所述文本信息进行分句处理,得到第一句子; 确定所述第一句子中已提供逻辑关系的句子为第二句子; 获取每个第二句子所包含的连接词; 确定所述第二句子中其连接词指向该第二句子的逻辑关系的概率大于预设阔值 的预设数量句子为测试句子。 优选的,所述获取待测向量对,包括;[002引获取待测句子; 确定该待测句子中的一个连接词为待测连接词; 确定所述待测句子中位于所述待测连接词之前的文本为待测前置文本,位于所述 待测连接词之后的文本为待测后置文本;[002引分析进行分词处理后的待测前置文本的框架语义,W构建待测前置向量,分析进 行分词处理后的待测后置文本的框架语义,W构建待测后置向量; 确定所述待测前置向量和所述待测后置向量组成待测向量对。 优选的,所述从全部测试句子的测试向量对中确定出与所述待测向量对相似度最 高的测试向量对,包括: 确定所述待测向量对的待测前置向量和待测后置向量; 计算每个测试句子的测试前置向量与所述待测前置向量的第一相似度,W及该测 试句子的测试后置向量与所述待测后置向量的第二相似度; 利用所述第一相似度和所述第二相似度确定所述待测向量对与每个测试句子的 测试向量对的相似度; 确定出所述相似度中最高的相似度对应的测试向量对。 优选的,所述计算每个测试句子的测试前置向量与所述待测前置向量的第一相似 度,W及该测试句子的测试后置向量与所述待测后置向量的第二相似度,包括: 计算每个测试句子的测试前置向量与所述待测前置向量的向量余弦值,并将该向 量余弦值确定为第一相似度; 计算每个测试句子的测试后置向量与所述待测后置向量的向量余弦值,并将该向 量余弦值确定为第二相似度。[003引优选的,所述利用所述第一相似度和所述第二相似度确定所述待测向量对与每个 测试句子的测试向量对的相似度,包括: 按照下列公式计算所述相似度: 其中,Sim为所述待测向量对与每个测试句子的测试向量对的相似度,EveSimi所 述为第一相似度,EveSims为所述第二相似度,e为自然常数。 一种事件关系检测系统,包括: 获取模块,用于获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括 一个与该测试句子的逻辑关系对应的测试连接词; 第一确定模块,用于确定每个测试句子中位于测试连接词之前的文本为测试前置 文本,位于测试连接词之后的文本为测试后置文本; 向量构建模块,用于分析进行分词处理后的测试前置文本的框架语义,W构建分 别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语 义,W构建分别与每个测试句子对应的测试后置向量; 第二确定模块,用于确定每个测试句子对应的测试前置向量与测试后置向量组成 该测试句子的测试向量对; 第=确定模块,用于获取待测向量对,从全部测试句子的测试向量对中确定出与 所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系 为所述待测向量对对应的待测句子的逻辑关系。 本专利技术提供的一种事件关系检测方法及系统,通过已提供逻辑关系、且包括有与 逻辑关系相对应的连接词的预设数量测试句子,建立与每个测试句子对应的测试向量对, 并确定出与待测向量对相似度最高的测试向量对,该测试向量对对应的测试句子的逻辑关 系即为待测向量对对应的待测句子的逻辑关系。目P,确定相似度最高的两个向量对所对应 的句子具有相同的逻辑关系。本申请提供的一种事件关系检测方法及系统,不仅仅能检测 出某一特定逻辑关系,而是可W根据需要获取与任意逻辑关系对应的测试句子及测试向量 对,进而确定待测向量的逻辑关系,具有通用性;且实验证明,本专利技术提供的一种事件关系 检测方法及系统获得的检测结果具有较高的准确度。【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根据 提供的附图获得其他的附图。 图1为本专利技术实施例提供的一种事件关系检测方法的流程图;图2为本专利技术实施例提供的一种事件关系检测方法中步骤S13的流程图; 图3为本专利技术实施例提供的一种事件关系检测方法中步骤S11的流程图; 图4为本专利技术实施例提供的一种事件关系检测方法中获取待测向量对的流程图;图5为本专利技术实施例提供的一种事件关系检测方法中从全部测试句子的测试向 量对中确定出与待测向量对相似度最高的测试向量对的流程图;图6为本专利技术实施例提供的一种事件关系检测系统的结构示意图。【具本文档来自技高网...

【技术保护点】
一种事件关系检测方法,其特征在于,包括:获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨雪蓉洪宇姚建民朱巧明
申请(专利权)人:苏州大学张家港工业技术研究院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1