摘要的生成方法、装置及存储介质制造方法及图纸

技术编号:31015564 阅读:11 留言:0更新日期:2021-11-30 02:55
本发明专利技术公开了一种摘要的生成方法、装置及存储介质,涉及文本处理技术领域,其中,上述摘要的生成方法,可以包括:获取目标段落的文本内容,其中,所述目标段落为文章分段后得到的第一段落之后的某一个段落;基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的文本内容获得的。能够解决目前生成式摘要的段落和段落之间的关联较弱,生成的摘要结果拼接后通顺性和逻辑性较低,可读性较差的问题。可读性较差的问题。可读性较差的问题。

【技术实现步骤摘要】
摘要的生成方法、装置及存储介质


[0001]本专利技术涉及文本处理
,尤其涉及一种摘要的生成方法、装置及存储介质。

技术介绍

[0002]针对长文本的生成式摘要,目前主要的方法是将输入的原文分段后使用NLG(Natural Language Generation,自然语言生成)模型中的生成式摘要模型生成各段的摘要,然后直接将生成的每段摘要拼接在一起得到需要的长文本摘要结果。
[0003]但是,使用上述方法得到的长文本摘要无法保证段落和段落之间的关联,生成的摘要结果拼接后通顺性和逻辑性较低,导致生成的摘要可读性较差。

技术实现思路

[0004]鉴于上述问题,本申请实施例提供一种摘要的生成方法、装置及存储介质,主要目的在于解决目前摘要的段落和段落之间的关联较弱,生成的摘要结果拼接后通顺性和逻辑性较低,可读性较差的问题。
[0005]为解决上述技术问题,第一方面,本申请实施例提供了一种摘要的生成方法,该方法可以包括:
[0006]获取文章分段后的目标段落的文本内容,其中,所述目标段落为所述文章分段后得到的第一段落之后的任一段落;
[0007]基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的文本内容获得的。
[0008]在第一方面的第一种可能的实施方式中,在所述基于所述目标段落的文本内容和所述目标段落之前段落的文本内容通过生成式摘要模型生成所述目标段落的摘要结果之前,所述方法还可以包括:
[0009]根据所述目标段落之前段落的文本内容生产所述目标段落之前段落的摘要结果;
[0010]所述基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,可以包括:
[0011]所述基于所述目标段落的文本内容和所述目标段落之前段落的摘要结果,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的摘要结果获得的。
[0012]在第一方面的第二种可能的实施方式中,所述目标段落之前段落的摘要结果为与所述目标段落相邻的前一个段落的摘要结果。
[0013]在第一方面的第三种可能的实施方式中,所述基于所述目标段落的文本内容和所述目标段落之前段落的摘要结果通过生成式摘要模型生成所述目标段落的摘要结果,包括:
[0014]基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向
量表示;
[0015]基于所述目标段落之前段落的摘要结果,通过所述生成式摘要模型的编码输入部分进行向量表示;
[0016]基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果。
[0017]在第一方面的第四种可能的实施方式中,所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示之前,所述方法还包括:
[0018]将所述目标段落之前的至少一个段落的摘要结果拼接至所述目标段落的文本内容,以生成第一待表示信息;
[0019]所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示,包括:
[0020]基于所述第一待表示信息,通过所述生成式摘要模型的编码输入部分进行向量表示;
[0021]所述基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果,包括:
[0022]基于所述第一待表示信息的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果。
[0023]在第一方面的第五种可能的实施方式中,所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示之前,所述方法还包括:
[0024]将所述目标段落之前的全部段落的摘要结果拼接至所述目标段落的文本内容,以生成第二待表示信息;
[0025]所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示,包括:
[0026]基于所述第二待表示信息,通过所述生成式摘要模型的编码输入部分进行向量表示;
[0027]所述基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果,包括:
[0028]基于所述第二待表示信息的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果。
[0029]在第一方面的第六种可能的实施方式中,所述基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果,包括:
[0030]通过所述目标段落之前段落的摘要结果的向量表示,将所述生成式摘要模型的向量解码部分输出的第一个字符对应的输入,初始化为动态隐变量;
[0031]基于所述目标段落的文本内容的向量表示和已输出的前一个字符,通过所述生成式摘要模型的向量解码部分依次生成后续字符,以总结生成所述目标段落的摘要结果。
[0032]第二方面,本申请实施例还提供了一种摘要的生成装置,可以包括:
[0033]获取单元,用于获取目标段落的文本内容,其中,所述目标段落为文章分段后得到的第一段落之后的某一个段落;
[0034]生成单元,用于基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的文本内容获得的。
[0035]在第二方面的第一种可能的实施方式中,所述生成单元还用于:
[0036]根据所述目标段落之前段落的文本内容生产所述目标段落之前段落的摘要结果;
[0037]基于所述目标段落的文本内容和所述目标段落之前段落的摘要结果,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的摘要结果获得的。
[0038]在第二方面的第二种可能的实施方式中,所述目标段落之前段落的摘要结果为与所述目标段落相邻的前一个段落的摘要结果。
[0039]在第二方面的第三种可能的实施方式中,所述生成单元还用于:
[0040]基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示;
[0041]基于所述目标段落之前段落的摘要结果,通过所述生成式摘要模型的编码输入部分进行向量表示;
[0042本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种摘要的生成方法,其特征在于,包括:获取目标段落的文本内容,其中,所述目标段落为文章分段后得到的第一段落之后的某一个段落;基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的文本内容获得的。2.根据权利要求1所述的方法,其特征在于,在所述基于所述目标段落的文本内容和所述目标段落之前段落的文本内容通过生成式摘要模型生成所述目标段落的摘要结果之前,所述方法还包括:根据所述目标段落之前段落的文本内容生产所述目标段落之前段落的摘要结果;所述基于所述目标段落的文本内容和所述目标段落之前段落的文本内容,通过生成式摘要模型生成所述目标段落的摘要结果,包括:基于所述目标段落的文本内容和所述目标段落之前段落的摘要结果,通过生成式摘要模型生成所述目标段落的摘要结果,其中,所述目标段落的摘要结果的第一个字符是基于所述目标段落之前段落的摘要结果获得的。3.根据权利要求2所述的方法,其特征在于,所述目标段落之前段落的摘要结果为与所述目标段落相邻的前一个段落的摘要结果。4.根据权利要求2所述的方法,其特征在于,所述基于所述目标段落的文本内容和所述目标段落之前段落的摘要结果通过生成式摘要模型生成所述目标段落的摘要结果,包括:基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示;基于所述目标段落之前段落的摘要结果,通过所述生成式摘要模型的编码输入部分进行向量表示;基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示之前,所述方法还包括:将所述目标段落之前的至少一个段落的摘要结果拼接至所述目标段落的文本内容,以生成第一待表示信息;所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示,包括:基于所述第一待表示信息,通过所述生成式摘要模型的编码输入部分进行向量表示;所述基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果,包括:基于所述第一待表示信息的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果。6.根据权利要求4所述的方法,其特征在于,所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示之前,所述方法还包括:
将所述目标段落之前的全部段落的摘要结果拼接至所述目标段落的文本内容,以生成第二待表示信息;所述基于所述目标段落的文本内容,通过所述生成式摘要模型的编码输入部分进行向量表示,包括:基于所述第二待表示信息,通过所述生成式摘要模型的编码输入部分进行向量表示;所述基于所述目标段落的文本内容的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所述目标段落的摘要结果,包括:基于所述第二待表示信息的向量表示和所述目标段落之前段落的摘要结果的向量表示,通过所述生成式摘要模型的向量解码部分总结生成所...

【专利技术属性】
技术研发人员:涂曼姝龚能杨鹏
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1