System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 生成文本摘要的方法、系统及设备和存储介质技术方案_技高网

生成文本摘要的方法、系统及设备和存储介质技术方案

技术编号:40332812 阅读:11 留言:0更新日期:2024-02-09 14:24
本发明专利技术提供一种生成文本摘要的方法、系统及设备和存储介质,属于自然语言处理技术领域,通过BERT网络框架对输入文本进行向量转化处理,再对转化得到的矩阵向量利用双向长短记忆网络进行双向向量特征拼接以得到文本序列结构特征向量矩阵,然后将文本序列结构特征向量矩阵输入预设图神经网络中,利用预先创建的输入文本的关联矩阵对文本序列结构特征向量矩阵进行图结构特征提取,最后基于提取的图结构特征向量矩阵进行后续的摘要生成,更好地将图结构信息与序列结构信息结合起来,既同时保持文本序列结构特征又同时获取了图结构特征,减少输入文本的语义信息的缺失。

【技术实现步骤摘要】

本专利技术属于自然语言处理,具体涉及一种生成文本摘要的方法、系统及设备和存储介质


技术介绍

1、自动文本摘要是自然语言处理领域研究的热点,它通过生简洁的句子来表达输入文本的主旨。自动文本摘要可分为两种:一种是抽取式自动文本摘要,它通过抽取输入文本中的单词、短语和句子来组成一个简短句子来表达输入文本的主旨。另一种是生成式自动文本摘要,它通过生成的方式生成摘要,所生成的摘要里的某些词、短语并不在原文中,所以生成式自动文本摘要,更符合常规思维。

2、近年来,采用以双向长短期记忆网络,门控循环单元和卷积神经网络组成的序列到序列模型在生成式自动文本摘要中获得不错的效果,然而这些模型由于缺乏对图结构信息的获取能力,所以生成的摘要容易出现重复、语序错乱等问题。


技术实现思路

1、基于以上现有的生成文本摘要的现状,本专利技术提供一种生成文本摘要的方法、系统及设备和存储介质,用以克服现有技术中存在的至少一个技术问题。

2、为实现上述目的,本专利技术提供一种生成文本摘要的方法,包括:

3、基于预设字向量映射表,将输入文本转换为预设维度的矩阵向量;

4、采用双向长短记忆网络对所述矩阵向量中的向量进行前向向量特征和后向向量特征拼接处理,得到文本序列结构特征向量矩阵;

5、将所述文本序列结构特征向量矩阵输入预设图神经网络中,基于所述预设图神经网络中预先创建的所述输入文本的关联矩阵对所述文本序列结构特征向量矩阵进行图结构特征提取处理,得到图结构特征向量矩阵;

6、根据预设图结构特征向量选取规则,从所述图结构特征向量矩阵中获取目标图结构特征向量,并采用单向长短期记忆网络对所述目标图结构特征向量进行隐状态向量生成处理,获取包含预设数量的隐状态向量的隐状态向量集合;

7、通过注意力机制获取所述隐状态向量集合中的隐状态向量的背景向量,得到背景向量矩阵;

8、采用线性连接层技术将所述背景向量矩阵中的每个背景向量均映射成与所述预设字向量映射表的大小相等的映射矩阵,并通过归一化指数函数公式计算得到每个背景向量生成所述预设字向量映射表中的每个字的概率分数,并将概率分数最大值对应的预设字向量映射表中的字作为目标生成字;

9、将所述目标生成字按照与所述输入文本中的字的关联关系进行对应排序,以生成输入文本的摘要。

10、为了解决上述问题,本专利技术还提供一种生成文本摘要的系统,所述系统包括:

11、向量化处理模块,用于基于预设字向量映射表,将输入文本转换为预设维度的矩阵向量;

12、序列结构特征处理模块,用于采用双向长短记忆网络对所述矩阵向量中的向量进行前向向量特征和后向向量特征拼接处理,得到文本序列结构特征向量矩阵;

13、图结构特征提取模块,用于将所述文本序列结构特征向量矩阵输入预设图神经网络中,基于所述预设图神经网络中预先创建的所述输入文本的关联矩阵对所述文本序列结构特征向量矩阵进行图结构特征提取处理,得到图结构特征向量矩阵;

14、隐状态向量处理模块,用于根据预设图结构特征向量选取规则,从所述图结构特征向量矩阵中获取目标图结构特征向量,并采用单向长短期记忆网络对所述目标图结构特征向量进行隐状态向量生成处理,获取包含预设数量的隐状态向量的隐状态向量集合;

15、背景向量获取模块,用于通过注意力机制获取所述隐状态向量集合中的隐状态向量的背景向量,得到背景向量矩阵;

16、概率分数计算模块,用于采用线性连接层技术将所述背景向量矩阵中的每个背景向量均映射成与所述预设字向量映射表的大小相等的映射矩阵,并通过归一化指数函数公式计算得到每个背景向量生成所述预设字向量映射表中的每个字的概率分数,并将概率分数最大值对应的预设字向量映射表中的字作为目标生成字;

17、摘要生成模块,用于将所述目标生成字按照与所述输入文本中的字的关联关系进行对应排序,以生成输入文本的摘要。

18、为了解决上述问题,本专利技术还提供一种电子设备,电子设备包括:

19、至少一个处理器;以及,

20、与所述至少一个处理器通信连接的存储器;其中,

21、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前所述的生成文本摘要的方法中的步骤。

22、为了解决上述问题,本专利技术还提供一种计算机可读存储介质,计算机可读存储介质中存储有至少一个指令,至少一个指令被电子设备中的处理器执行时实现上述的生成文本摘要的方法。

23、本专利技术提供的生成文本摘要的方法、系统及设备和存储介质,通过对输入文本进行向量转化处理,再对转化得到的矩阵向量利用双向长短记忆网络进行双向向量特征拼接以得到文本序列结构特征向量矩阵,然后将文本序列结构特征向量矩阵输入预设图神经网络中,利用预先创建的输入文本的关联矩阵对文本序列结构特征向量矩阵进行图结构特征提取,最后基于提取的图结构特征向量矩阵进行后续的摘要生成,更好地将图结构信息与序列结构信息结合起来,既同时保持文本序列结构特征又同时获取了图结构特征,减少了输入文本的语义信息的缺失,有效解决了现有技术中由于摘要生成模型缺乏对图结构信息的获取能力,导致生成的摘要容易出现重复、语序错乱等问题。

本文档来自技高网...

【技术保护点】

1.一种生成文本摘要的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述基于预设字向量映射表,将输入文本转换为预设维度的矩阵向量包括:

3.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述关联矩阵的创建方法包括如下步骤:

4.根据权利要求3所述的生成文本摘要的方法,其特征在于,所述字间共生连接边的确定方法包括如下步骤:

5.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述预设图结构特征向量选取规则为:

6.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述采用单向长短期记忆网络对所述目标图结构特征向量进行隐状态向量生成处理,获取包含预设数量的隐状态向量的隐状态向量集合包括:

7.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述通过注意力机制获取所述隐状态向量集合中的隐状态向量的背景向量,得到背景向量矩阵包括:

8.一种生成文本摘要的系统,其特征在于,所述系统包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,存储有至少一个指令,其特征在于,所述至少一个指令被电子设备中的处理器执行时实现如权利要求1至7中任一所述的生成文本摘要的方法。

...

【技术特征摘要】

1.一种生成文本摘要的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述基于预设字向量映射表,将输入文本转换为预设维度的矩阵向量包括:

3.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述关联矩阵的创建方法包括如下步骤:

4.根据权利要求3所述的生成文本摘要的方法,其特征在于,所述字间共生连接边的确定方法包括如下步骤:

5.根据权利要求1所述的生成文本摘要的方法,其特征在于,所述预设图结构特征向量选取规则为:

6.根据权利要求1所述的生成文本摘要的方法,其特征在于,...

【专利技术属性】
技术研发人员:梁泽雨
申请(专利权)人:中国传媒大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1