基于扩散模型的事件骨架图生成方法、系统、终端及介质技术方案

技术编号:38344906 阅读:17 留言:0更新日期:2023-08-02 09:24
本发明专利技术公开了一种基于扩散模型的事件骨架图生成方法、系统、终端及介质,训练扩散事件图模型时,采用扩散模型对事件图样本进行加躁和去躁以优化所述扩散事件图模型中的隐变量,获得已训练好的扩散事件图模型,将采样到的噪声输入已训练好的扩散事件图模型来生成事件骨架图。通过采用扩散模型的加噪和去噪过程训练扩散事件图模型,能够增强扩散事件图模型的鲁棒性,在训练过程中通过迭代完善扩散事件图模型中的隐变量,从而修正事件骨架图生成过程中的错误。因此,通过扩散模型的范式解决了事件骨架图生成时错误会累计的问题,能够生成的高质量的事件骨架图。高质量的事件骨架图。高质量的事件骨架图。

【技术实现步骤摘要】
基于扩散模型的事件骨架图生成方法、系统、终端及介质


[0001]本专利技术涉及自然语言处理
,尤其涉及的是一种基于扩散模型的事件骨架图生成方法、系统、终端及介质。

技术介绍

[0002]随着数字化时代的到来,利用自然语言处理技术从大量的事件数据中归纳出有价值的事件模式(即事件骨架)成为一个极其重要的课题。事件骨架图生成旨在对复杂事件类型进行归纳并生成出一个代表其一般发展过程的事件模式图,常用于商业参考、突发事件分析、金融事件分析,问答系统中。
[0003]虽然目前有少量事件骨架图生成模型采用自回归方法逐个的生成原子事件以及原子事件之间的时序关系从而生成整个事件图。但是,由于自回归方法每次都是根据正确的部分事件图生成其余的部分,事件骨架图生成模型的鲁棒性差,且在事件骨架图生成过程中无法进行错误修正,导致错误被积累,生成的事件骨架图质量不高。
[0004]因此,现有技术有待改进和提高。

技术实现思路

[0005]本专利技术的主要目的在于提供一种基于扩散模型的事件骨架图生成方法、系统、智能终端及存储介质,能够解决目前生成的事件骨架图质量不高的问题。
[0006]为了实现上述目的,本专利技术第一方面提供一种基于扩散模型的事件骨架图生成方法,所述方法包括:预先构建扩散事件图模型,采用扩散模型对事件图样本进行加躁,获得第一事件序列,根据所述事件图样本优化所述扩散事件图模型中的隐变量,对所述第一事件序列进行去噪,获得去噪结果,根据所述去噪结果训练所述扩散事件图模型,获得已训练好的扩散事件图模型;采样到一个噪声并根据所述噪声获得第二事件序列;将所述第二事件序列输入所述已训练好的扩散事件图模型,根据所述已训练好的扩散事件图模型中的隐变量生成所述噪声对应的事件骨架图。
[0007]可选的,所述采用扩散模型对事件图样本进行加躁,获得第一事件序列,包括:将所述事件图样本转换为连续空间中的事件序列样本;对所述事件序列样本迭代加躁,获得加躁后的事件序列;在所述加躁后的事件序列中加入位置编码和扩散步数,获得所述第一事件序列。
[0008]可选的,所述将所述事件图样本转换为连续空间中的事件序列样本,包括:基于拓扑排序,将所述事件图样本展开为序列样本;通过嵌入算法将所述序列样本转换为所述事件序列样本。
[0009]可选的,所述对所述第一事件序列进行去噪,获得去噪结果,包括:对所述第一事件序列进行迭代去躁,获得所述去噪结果,所述去噪结果包括去噪
后的事件序列和事件图结构。
[0010]可选的,所述根据所述去噪结果训练所述扩散事件图模型,获得已训练好的扩散事件图模型,包括:基于所述去噪后的事件序列和所述事件图结构,计算损失值;根据所述损失值迭代训练所述扩散事件图模型,获得所述已训练好的扩散事件图模型。
[0011]可选的,对所述第一事件序列进行迭代去躁,获得去噪后的事件序列和事件图结构,包括:将所述第一事件序列输入基于图注意力机制的第一自编码器,获得事件序列特征;将所述事件序列特征分别输入基于图注意力机制的第二自编码器和基于图注意力机制的第三自编码器,分别获得事件序列类型特征和事件序列结构特征;采用舍入模型对所述事件序列类型特征进行重构,获得所述去噪后的事件序列;根据所述事件序列结构特征,采用边分类器进行事件图重构,获得所述事件图结构。
[0012]可选的,所述边分类器为多层感知机,所述根据所述事件序列结构特征,采用边分类器进行事件图重构,获得所述事件图结构,包括:将所述事件序列结构特征输入多层感知机,获得所述事件序列结构特征中每两个事件之间的时序关系;根据所述事件序列结构特征中的所有事件以及所有事件之间的所述时序关系进行事件图重构,获得所述事件图结构。
[0013]可选的,所述将所述第二事件序列输入所述已训练好的扩散事件图模型,根据所述已训练好的扩散事件图模型中的隐变量生成所述噪声对应的事件骨架图,包括:对所述第二事件序列进行迭代去噪,获得事件序列类型特征和事件图结构特征;基于所述事件序列类型特征,采用舍入模型获得还原后的事件序列;将所述事件图结构特征输入预先训练好的多层感知机,获得事件图结构;将所述还原后的事件序列和所述事件图结构进行组合,获得所述事件骨架图。
[0014]本专利技术第二方面提供一种基于扩散模型的事件骨架图生成系统,其中,上述系统包括:预训练模块,用于预先构建扩散事件图模型,采用扩散模型对事件图样本进行加躁,获得第一事件序列,根据所述事件图样本优化所述扩散事件图模型中的隐变量,对所述第一事件序列进行去噪,获得去噪结果,根据所述去噪结果训练所述扩散事件图模型,获得已训练好的扩散事件图模型;事件序列模块,用于采样到一个噪声并根据所述噪声获得第二事件序列;事件骨架图模块,用于将所述第二事件序列输入所述已训练好的扩散事件图模型,根据所述已训练好的扩散事件图模型中的隐变量生成所述噪声对应的事件骨架图。
[0015]可选的,所述预训练模块包括转换单元、加噪单元和去噪单元,所述转换单元用于将所述事件图样本转换为连续空间中的事件序列样本;所述加噪单元用于对所述事件序列样本迭代加躁,获得加躁后的事件序列,在所述加躁后的事件序列中加入位置编码和扩散
步数,获得所述第一事件序列;所述去噪单元用于对所述第一事件序列进行迭代去躁,获得所述去噪结果,所述去噪结果包括去噪后的事件序列和事件图结构;所述预训练模块用于基于所述去噪后的事件序列和所述事件图结构,计算损失值,根据所述损失值迭代训练所述扩散事件图模型,获得已训练好的扩散事件图模型。
[0016]本专利技术第三方面提供一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的基于扩散模型的事件骨架图生成程序,上述基于扩散模型的事件骨架图生成程序被上述处理器执行时实现任意一项上述基于扩散模型的事件骨架图生成方法的步骤。
[0017]本专利技术第四方面提供一种计算机可读存储介质,上述计算机可读存储介质上存储有基于扩散模型的事件骨架图生成程序,上述基于扩散模型的事件骨架图生成程序被处理器执行时实现任意一项上述基于扩散模型的事件骨架图生成方法的步骤。
[0018]由上可见,本专利技术训练扩散事件图模型时,预先采用扩散模型对事件图样本进行加躁和去躁并根据事件图样本生成扩散事件图模型中的隐变量,然后将采样到的噪声输入已训练好的扩散事件图模型来生成事件骨架图。与现有技术相比,本专利技术通过采用扩散模型的加噪和去噪过程训练扩散事件图模型,能够增强扩散事件图模型的鲁棒性,在训练过程中通过迭代完善扩散事件图模型中的隐变量,从而修正事件骨架图生成过程中的错误。因此,本专利技术通过扩散模型的范式解决了事件骨架图生成时错误会累计的问题,能够生成高质量的事件骨架图。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于扩散模型的事件骨架图生成方法,其特征在于,所述方法包括:预先构建扩散事件图模型,采用扩散模型对事件图样本进行加躁,获得第一事件序列,根据所述事件图样本优化所述扩散事件图模型中的隐变量,对所述第一事件序列进行去噪,获得去噪结果,根据所述去噪结果训练所述扩散事件图模型,获得已训练好的扩散事件图模型;采样到一个噪声并根据所述噪声获得第二事件序列;将所述第二事件序列输入所述已训练好的扩散事件图模型,根据所述已训练好的扩散事件图模型中的隐变量生成所述噪声对应的事件骨架图。2.如权利要求1所述的基于扩散模型的事件骨架图生成方法,其特征在于,所述采用扩散模型对事件图样本进行加躁,获得第一事件序列,包括:将所述事件图样本转换为连续空间中的事件序列样本;对所述事件序列样本迭代加躁,获得加躁后的事件序列;在所述加躁后的事件序列中加入位置编码和扩散步数,获得所述第一事件序列。3.如权利要求2所述的基于扩散模型的事件骨架图生成方法,其特征在于,所述将所述事件图样本转换为连续空间中的事件序列样本,包括:基于拓扑排序,将所述事件图样本展开为序列样本;通过嵌入算法将所述序列样本转换为所述事件序列样本。4.如权利要求1所述的基于扩散模型的事件骨架图生成方法,其特征在于,所述对所述第一事件序列进行去噪,获得去噪结果,包括:对所述第一事件序列进行迭代去躁,获得所述去噪结果,所述去噪结果包括去噪后的事件序列和事件图结构。5.如权利要求4所述的基于扩散模型的事件骨架图生成方法,其特征在于,所述根据所述去噪结果训练所述扩散事件图模型,获得已训练好的扩散事件图模型,包括:基于所述去噪后的事件序列和所述事件图结构,计算损失值;根据所述损失值迭代训练所述扩散事件图模型,获得所述已训练好的扩散事件图模型。6.如权利要求4所述的基于扩散模型的事件骨架图生成方法,其特征在于,对所述第一事件序列进行迭代去躁,获得去噪后的事件序列和事件图结构,包括:将所述第一事件序列输入基于图注意力机制的第一自编码器,获得事件序列特征;将所述事件序列特征分别输入基于图注意力机制的第二自编码器和基于图注意力机制的第三自编码器,分别获得事件序列类型特征和事件序列结构特征;采用舍入模型对所述事件序列类型特征进行重构,获得所述去噪后的事件序列;根据所述事件序列结构特征,采用边分类器进行事件图重构,获得所述事件图结构。7.如权利要求6所述的基于扩散模型的事件骨架图生成方法,其特征在于,所述边分类器为多层感知机,所述根据所述事件序列结构特征,采用边分类器进行事件图重构,获得所述事件图结构,包括:将所述事件序列结构特征输入多层感知机,获得所述事件序列结构特征中每两个事件之间的时序关...

【专利技术属性】
技术研发人员:杨海钦张林幺宝刚
申请(专利权)人:粤港澳大湾区数字经济研究院福田
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1