事件信息处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:36651805 阅读:11 留言:0更新日期:2023-02-18 13:14
本申请涉及一种事件信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取事件描述文本,对所述事件描述文本进行主体识别,得到所述事件描述文本对应的第一事件主体;基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件;基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本;对所述内容搜索文本进行主体识别,得到第二事件主体;计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度;基于所述主体相似度从所述候选主体集合中筛选得到与所述第二事件主体相关的目标主体,将所述目标主体作为所述事件描述文本对应的事件描述主体。采用本方法能够有效提高事件信息处理的准确率。件信息处理的准确率。件信息处理的准确率。

【技术实现步骤摘要】
事件信息处理方法、装置、计算机设备和存储介质
[0001]本申请要求于2021年08月04日提交中国专利局,申请号为2021108899398,申请名称为“事件信息处理方法、装置、计算机设备和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。


[0002]本申请涉及计算机
,特别是涉及一种事件信息处理方法、装置、计算机设备和存储介质。

技术介绍

[0003]随着计算机技术以及互联网技术的发展,在很多情况下都需要对事件信息进行处理,如对事件描述文本例如新闻进行处理,以得到事件描述文本中的关键事件信息。
[0004]然而,目前在对事件描述文本进行处理时,通常是直接从事件描述文本中获取其中的描述主体,例如,将新闻中出现的主体名词作为新闻描述的主体,导致得到的事件信息的准确率较低。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够有效提高事件信息处理准确率的事件信息的处理方法、装置、计算机设备和存储介质。
[0006]一种事件信息处理方法,所述方法包括:获取事件描述文本,对所述事件描述文本进行主体识别,得到所述事件描述文本对应的第一事件主体;基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件;基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本;对所述内容搜索文本进行主体识别,得到第二事件主体;计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度;基于所述主体相似度从所述候选主体集合中筛选得到与所述第二事件主体相关的目标主体,将所述目标主体作为所述事件描述文本对应的事件描述主体。
[0007]一种事件信息处理装置,所述装置包括:获取模块,用于获取事件描述文本;识别模块,用于对所述事件描述文本进行主体识别,得到所述事件描述文本对应的第一事件主体;所述获取模块还用于基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件;搜索模块,用于基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本;所述识别模块还用于对所述内容搜索文本进行主体识别,得到第二事件主体;计算模块,用于计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度;筛选模块,用于基于所述主体相似度从所述候选主体集合中筛选得到与所述第二事件主体相关的目标主体,将所述目标主体作为所述事件描述文本对应的事件描述主体。
[0008]在一个实施例中,获取模块还用于根据所述目标实体类型获取对应的目标搜索词,所述目标搜索词包括所述目标实体类型对应的实体类型词以及描述内容搜索词;所述内容搜索条件包括所述目标搜索词;搜索模块还用于将所述第一事件主体以及所述目标搜
索词作为组合搜索词,基于组合搜索词进行内容搜索,得到内容搜索文本。
[0009]在一个实施例中,该装置还包括:组合模块。获取模块还用于获取所述目标实体类型对应的实体类型词,以及获取所述目标实体类型对应的描述内容搜索词;组合模块用于将所述实体类型词以及所述描述内容搜索词进行组合,得到所述目标搜索词。
[0010]在一个实施例中,该装置还包括:输入模块。获取模块还用于获取所述目标实体类型对应的搜索范围限定条件,所述搜索范围限定条件限定在所述目标实体类型对应的实体描述内容的范围内进行搜索;所述内容搜索条件包括所述搜索范围限定条件;输入模块用于在所述搜索范围限定条件对应的搜索词输入位置中输入所述第一事件主体,以触发基于所述第一事件主体在所述搜索范围限定条件所限定的搜索范围内进行内容搜索,得到内容搜索文本。
[0011]在一个实施例中,该装置还包括:切分模块和对比模块。切分模块用于基于实体切分方式对所述第二事件主体进行切分,得到第一切分词集合;基于所述实体切分方式对所述候选主体进行切分,得到第二切分词集合;对比模块用于将所述第一切分词集合中的切分词与所述第二切分词集合中的切分词进行对比,得到对比一致的切分词;获取模块还用于获取对比一致的切分词的词数量,作为第一词数量;计算模块还用于基于所述第一词数量得到所述第二事件主体与所述候选主体之间的主体相似度;所述主体相似度与所述第一词数量成正相关关系。
[0012]在一个实施例中,获取模块还用于获取所述第一切分词集合与所述第二切分词集合所包含的切分词数量,作为第二词数量;计算模块还用于基于所述第一词数量以及所述第二词数量得到所述第二事件主体与所述候选主体之间的主体相似度;所述主体相似度与所述第二词数量成负相关关系。
[0013]在一个实施例中,该装置还包括:成分分析模块。切分模块还用于对所述事件描述文本进行切分,得到切分词序列;成分分析模块用于对所述切分词序列进行成分分析,得到所述切分词序列中各个切分词对应的成分;获取模块还用于从所述切分词序列中获取为主体成分的切分词,作为所述事件描述文本对应的第一事件主体。
[0014]在一个实施例中,该装置还包括:选取模块。成分分析模块还用于对所述切分词序列进行成分分析,得到切分词序列中各个切分词为候选成份的成分可能度;计算模块还用于基于所述切分词序列中各个切分词对应的成分可能度以及成分转移可能度,得到所述切分词序列对应的候选成分序列的序列可能度;选取模块用于选取序列可能度最大的候选成分序列,作为所述切分词序列对应的目标成分序列,所述切分词对应的成分为所述目标成分序列中对应顺序的目标成分。
[0015]在一个实施例中,获取模块还用于对于候选成分序列,获取所述候选成分序列中的当前候选成分对应的切分词为所述当前候选成分的当前成分可能度;获取所述候选成分序列中的后向候选成分对应的切分词为所述后向候选成分的后向成分可能度,所述后向候选成分为所述候选成分序列中,所述当前候选成分的下一成分;获取所述当前候选成分转移到所述后向候选成分的成分转移可能度;计算模块还用于基于所述当前成分可能度、所述后向成分可能度以及所述成分转移可能度得到所述候选成分序列的序列可能度。
[0016]在一个实施例中,筛选模块还用于从候选主体集合中,筛选满足相似度条件候选主体,作为与所述第二事件主体相关的目标主体;所述相似度条件包括相似度大于相似度
阈值或者相似度排序大于排序阈值的至少一个。
[0017]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取事件描述文本,对所述事件描述文本进行主体识别,得到所述事件描述文本对应的第一事件主体;基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件;基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本;对所述内容搜索文本进行主体识别,得到第二事件主体;计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度;基于所述主体相似度从所述候选主体集合中筛选得到与所述第二事件主体相关的目标主体,将所述目标主体作为所述事件描述文本对应的事件描述主体。
[0018]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件信息处理方法,其特征在于,所述方法包括:获取事件描述文本,对所述事件描述文本进行主体识别,得到所述事件描述文本对应的第一事件主体;基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件;基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本;对所述内容搜索文本进行主体识别,得到第二事件主体;计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度;基于所述主体相似度从所述候选主体集合中筛选得到与所述第二事件主体相关的目标主体,将所述目标主体作为所述事件描述文本对应的事件描述主体。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一事件主体,获取对实体描述内容进行搜索的内容搜索条件,包括:获取所述第一事件主体所属的目标实体类型;获取对所述目标实体类型对应的实体描述内容进行搜索的内容搜索条件。3.根据权利要求2所述的方法,其特征在于,所述获取对所述目标实体类型对应的实体描述内容进行搜索的内容搜索条件包括:根据所述目标实体类型获取对应的目标搜索词,所述目标搜索词包括所述目标实体类型对应的实体类型词以及描述内容搜索词;所述内容搜索条件包括所述目标搜索词;所述基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本包括:将所述第一事件主体以及所述目标搜索词作为组合搜索词,基于组合搜索词进行内容搜索,得到内容搜索文本。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标实体类型获取对应的目标搜索词包括:获取所述目标实体类型对应的实体类型词,以及获取所述目标实体类型对应的描述内容搜索词;将所述实体类型词以及所述描述内容搜索词进行组合,得到所述目标搜索词。5.根据权利要求2所述的方法,其特征在于,所述获取对所述目标实体类型对应的实体描述内容进行搜索的内容搜索条件包括:获取所述目标实体类型对应的搜索范围限定条件,所述搜索范围限定条件限定在所述目标实体类型对应的实体描述内容的范围内进行搜索;所述内容搜索条件包括所述搜索范围限定条件;所述基于所述第一事件主体以及所述内容搜索条件进行内容搜索,得到内容搜索文本包括:在所述搜索范围限定条件对应的搜索词输入位置中输入所述第一事件主体,以触发基于所述第一事件主体在所述搜索范围限定条件所限定的搜索范围内进行内容搜索,得到内容搜索文本。6.根据权利要求1所述的方法,其特征在于,所述计算所述第二事件主体与候选主体集合中的各个候选主体之间的主体相似度包括:基于实体切分方式对所述第二事件主体进行切分,得到第一切分词集合;
基于所述实体切分方式对所述候选主体进行切分,得到第二切分词集合;将所述第一切分词集合中的切分词与所述第二切分词集合中的切分词进行对比,得到对比一致的切分词;获取对比一致的切分词的词数量,作为第一词数量;基于所述第一词数量得到所述第二事件主体与所述候选主体之间的主体相似度;所述主体相似度与所述第一词数量成正相关关系。7.根据权利要求6所述的方法,其特征在于,所述基于所述第一词数量得到所述第二事件主体与所述候选主体之间的主体相似度包括:获取所述第一切分词集合与所述第二切分词集合所包含的切分词数量,作为第二词数量;基于所述第一词数量以及所述第二词数量得到所述第二事件主体与所述候选主体之间的主体相似度;所述主体相似度与所述第二词数量成负...

【专利技术属性】
技术研发人员:李俊琪
申请(专利权)人:财付通支付科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1