System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于篇章文本的事件检测方法及装置、电子设备制造方法及图纸_技高网

用于篇章文本的事件检测方法及装置、电子设备制造方法及图纸

技术编号:40330028 阅读:8 留言:0更新日期:2024-02-09 14:22
本发明专利技术公开了一种用于篇章文本的事件检测方法及装置、电子设备,涉及人工智能技术领域或其他相关领域,其中,该方法包括:接收事件检测指令;响应事件检测指令,接收待检测的目标篇章文本;将目标篇章文本输入至预设事件检测模型,输出事件检测结果,预设事件检测模型中至少包括:双向门控循环计算层和掩码条件随机场计算层,双向门控循环计算层用于捕捉目标篇章文本中各单词之间的全局依赖关系,得到全局特征向量,掩码条件随机场计算层用于根据全局特征向量对目标篇章文本进行识别与分类,得到事件标签和事件类型。本发明专利技术解决了相关技术中对复杂篇章文本进行事件检测时全局特征提取能力不足、事件类型判别准确率低的技术问题。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体而言,涉及一种用于篇章文本的事件检测方法及装置、电子设备


技术介绍

1、在全球信息化程度与日俱增的背景下,社会各行业领域不断产生海量的事件文本信息,其中,事件作为信息的最基本表现形式之一,包含着社会各领域重要的动态变化情况,从海量文本中有效地检测出关键事件信息,能够为信息自动化处理、突发事件检测与跟踪、市场动态分析以及智能问答等任务提供有力支持。目前,随着现实世界信息表述的复杂化和篇幅化,事件信息往往随机的分布在篇章文本中,篇章文本中的事件元素呈现跨句子分散的状态,事件触发词根据上下文信息以及事件论元的不同在篇章文本中触发不同类型的事件,句子层面事件和篇章层面事件之间存在共现关系。

2、现有的事件检测方法存在明显的缺陷:1,现有检测模型结构过于简单,运算能力不足,对于复杂自然语言的篇章级文本的事件特征提取能力不足;2,现有检测模型主要利用句子级别的上下文信息进行事件检测,忽略了篇章级别的全局特征和事件之间的相互关系,导致篇章层面的事件触发词定位和事件类型判别准确度不足。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本专利技术实施例提供了一种用于篇章文本的事件检测方法及装置、电子设备,以至少解决相关技术中对复杂篇章文本进行事件检测时全局特征提取能力不足、事件类型判别准确率低的技术问题。

2、根据本专利技术实施例的一个方面,提供了一种用于篇章文本的事件检测方法,包括:接收事件检测指令,其中,所述事件检测指令用于对目标篇章文本中的事件信息进行识别与分类,得到事件标签与事件类型;响应事件检测指令,接收待检测的所述目标篇章文本;将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果,其中,所述事件检测结果至少包括:所述事件标签和所述事件类型,所述预设事件检测模型中至少包括:双向门控循环计算层和掩码条件随机场计算层,所述双向门控循环计算层用于捕捉所述目标篇章文本中各单词之间的全局依赖关系,得到全局特征向量,所述掩码条件随机场计算层用于根据所述全局特征向量对所述目标篇章文本进行识别与分类,得到所述事件标签和所述事件类型。

3、可选地,所述预设事件检测模型还包括:bert编码层,将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果的步骤,包括:通过所述bert编码层对所述目标篇章文本进行分词,得到分词结果,其中,分词结果中包含n个单词,n为正整数;将所述分词结果映射至向量空间,得到单词向量集合,其中,所述单词向量集合中包含n个单词向量,每个所述单词向量与一个所述单词一一对应;基于预设注意力机制对所述单词向量集合进行编码运算,得到嵌入编码向量,其中,所述嵌入编码向量用于表征所述目标篇章文本中各单词的语义信息、各单词的位置信息以及各语句之间的分段关联信息;依据所述嵌入编码向量和预设事件触发词列表进行事件检测,得到所述事件检测结果。

4、可选地,依据所述嵌入编码向量和预设事件触发词列表进行事件检测,得到所述事件检测结果的步骤,包括:通过所述双向门控循环计算层对所述嵌入编码向量进行全局特征运算,得到所述全局特征向量,其中,所述全局特征向量用于表征在所述目标篇章文本中各个所述单词之间的所述全局依赖关系;通过所述掩码条件随机场计算层基于所述全局特征向量和所述单词向量集合建立观测随机场,并在所述观测随机场中对所有所述单词向量进行观测,得到观测结果,其中,所述掩码条件随机场计算层用于预置所述预设事件触发词列表,并基于该预设事件触发词列表对所有所述单词向量对应的所述单词进行匹配,得到观测结果,所述观测结果中至少包括:目标单词以及所述目标单词对应的事件触发词;将所述观测结果中的所述事件触发词作为所述事件标签,并在所述预设事件触发词列表中提取该事件标签对应的所述事件类型;基于所述事件标签和所述事件类型生成所述事件检测结果。

5、可选地,在所述观测随机场中对所有所述单词向量进行观测,得到观测结果的步骤,包括:基于所述观测随机场计算得到所有所述单词向量对应的条件概率值,其中,所述条件概率值是指所述单词向量对应的所述单词命中所述预设事件触发词列表中的事件触发词的概率值;选取所有所述条件概率值中的最大值作为目标概率值;基于所述目标概率值确定所述目标单词和该目标单词命中的所述事件触发词;基于所述目标单词和所述事件触发词生成所述观测结果。

6、可选地,在将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果之前,还包括:对所述目标篇章文本进行预处理操作,其中,所述预处理操作包括以下至少之一:篇幅检测、词形还原、文本序列填充、文本序列截断、文本清洗、停用词过滤、实体标记以及删除特定词汇。

7、可选地,所述预设事件检测模型至少包括以下组成部分:输入层,与bert编码层连接,用于接收所述目标篇章文本,并将所述目标篇章文本传输至所述bert编码层;所述bert编码层,与所述双向门控循环计算层连接,用于对所述目标篇章文本进行分词,将分词结果中的所有单词映射至向量空间,并在所述向量空间中对所有单词向量进行编码运算,得到该目标篇章文本对应的嵌入编码向量;所述双向门控循环计算层,与所述掩码条件随机场计算层连接,用于对所述嵌入编码向量进行全局特征运算,得到全局特征向量;所述掩码条件随机场计算层,与输出层连接,用于基于所述全局特征向量和所有所述单词向量建立观测随机场,并基于所述观测随机场对所有所述单词向量进行观测,得到所述事件标签和所述事件类型;所述输出层,用于基于所述事件标签和所述事件类型生成所述事件检测结果,并输出该事件检测结果。

8、可选地,所述预设事件检测模型是通过如下步骤得到的:接收篇章文本数据集,其中,所述篇章文本数据集中至少包括:m个篇章文本以及每个所述篇章文本对应的文本数据,所述文本数据至少包括:预定义事件类型和所述预定义事件类型对应的预定义事件标签,m为正整数;将所述篇章文本数据集中的m个篇章文本输入至初始事件检测模型,输出m个模型检测结果,其中,所述模型检测结果至少包括:模型检测事件类型和模型检测事件标签;存在所述模型检测结果指示所述模型检测事件类型与所述预定义事件类型不一致,或所述模型检测事件标签与所述预定义事件标签不一致的情况下,调整所述初始事件检测模型的模型参数;在所有所述模型检测结果指示所述模型检测事件类型与所述预定义事件类型一致,且所述模型检测事件标签与所述预定义事件标签一致的情况下,得到所述预设事件检测模型。

9、根据本专利技术实施例的另一方面,还提供了一种用于篇章文本的事件检测装置,包括:接收单元,用于接收事件检测指令,其中,所述事件检测指令用于对目标篇章文本中的事件信息进行识别与分类,得到事件标签与事件类型;响应单元,用于响应事件检测指令,接收待检测的所述目标篇章文本;输入单元,用于将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果,其中,所述事件检测结果至少包括:所述事件标签和所述事件类型,所述预设事件检测模型中至少包括:双向门控循环计算层和掩码条件随机场计算层,本文档来自技高网...

【技术保护点】

1.一种用于篇章文本的事件检测方法,其特征在于,包括:

2.根据权利要求1所述的事件检测方法,其特征在于,所述预设事件检测模型还包括:BERT编码层,将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果的步骤,包括:

3.根据权利要求2所述的事件检测方法,其特征在于,依据所述嵌入编码向量和预设事件触发词列表进行事件检测,得到所述事件检测结果的步骤,包括:

4.根据权利要求3所述的事件检测方法,其特征在于,在所述观测随机场中对所有所述单词向量进行观测,得到观测结果的步骤,包括:

5.根据权利要求1所述的事件检测方法,其特征在于,在将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果之前,还包括:

6.根据权利要求1所述的事件检测方法,其特征在于,所述预设事件检测模型至少包括以下组成部分:

7.根据权利要求1所述的事件检测方法,其特征在于,所述预设事件检测模型是通过如下步骤得到的:

8.一种用于篇章文本的事件检测装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的用于篇章文本的事件检测方法。

10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的用于篇章文本的事件检测方法。

...

【技术特征摘要】

1.一种用于篇章文本的事件检测方法,其特征在于,包括:

2.根据权利要求1所述的事件检测方法,其特征在于,所述预设事件检测模型还包括:bert编码层,将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果的步骤,包括:

3.根据权利要求2所述的事件检测方法,其特征在于,依据所述嵌入编码向量和预设事件触发词列表进行事件检测,得到所述事件检测结果的步骤,包括:

4.根据权利要求3所述的事件检测方法,其特征在于,在所述观测随机场中对所有所述单词向量进行观测,得到观测结果的步骤,包括:

5.根据权利要求1所述的事件检测方法,其特征在于,在将所述目标篇章文本输入至预设事件检测模型,输出事件检测结果之前,还包括:

6.根据权利要求1所述的事件检测方...

【专利技术属性】
技术研发人员:董勇圣
申请(专利权)人:天翼电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1