文本摘要生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37236838 阅读:44 留言:0更新日期:2023-04-20 23:18
本公开提供一种文本摘要生成方法、装置、电子设备和存储介质,所述方法包括:采用长短期记忆网络模型对第一描述文本进行编码并基于编码结果得到第一解码数据;采用所述长短期记忆网络模型对第二描述文本进行编码并基于编码结果得到第二解码数据;根据所述第一解码数据、所述第二解码数据和所述长短期记忆网络模型的模型参数获取生成概率、第一复制概率和第二复制概率;根据所述生成概率、所述第一复制概率和所述第二复制概率以及三者各自对应的权重获取解码概率,以根据所述解码概率生成所述文本摘要。本公开的技术方案可以自动调整文本摘要的风格。文本摘要的风格。文本摘要的风格。

【技术实现步骤摘要】
文本摘要生成方法、装置、电子设备和存储介质


[0001]本公开涉及计算机
,尤其涉及一种文本摘要生成方法、装置、电子设备和非暂态计算机可读存储介质。

技术介绍

[0002]文本摘要自动生成算法是根据输入的文本自动生成文本摘要的算法,该算法的输入是商品的介绍长文本,输出是商品的摘要短文本。
[0003]文本摘要自动生成算法中,可以对长文本进行编码后,利用复制机制进行解码以得到长文本的文本摘要。复制机制指的是解码器在解码时从输入文本中选择一个词进行解码的机制。
[0004]传统的复制机制只能从一个文本输入来源中进行复制,其摘要风格仅受单一文本来源影响,不能灵活变化。

技术实现思路

[0005]本公开提供一种文本摘要生成方法、装置、电子设备和非暂态计算机可读存储介质,用以解决文本摘要的风格单一的问题,实现文本摘要风格的自动调整。
[0006]本公开提供一种文本摘要生成方法,包括:采用长短期记忆网络模型对第一描述文本进行编码并基于编码结果得到第一解码数据;采用所述长短期记忆网络模型对第二描述文本进行编码并基本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本摘要生成方法,其特征在于,所述方法包括:采用长短期记忆网络模型对第一描述文本进行编码并基于编码结果得到第一解码数据;采用所述长短期记忆网络模型对第二描述文本进行编码并基于编码结果得到第二解码数据;根据所述第一解码数据、所述第二解码数据和所述长短期记忆网络模型的模型参数获取生成概率、第一复制概率和第二复制概率;根据所述生成概率、所述第一复制概率和所述第二复制概率以及三者各自对应的权重获取解码概率,以根据所述解码概率生成所述文本摘要,其中,所述三者各自对应的权重根据所述长短期记忆网络模型的第一激活函数参数组、预设的摘要风格调整参数、所述第一解码数据和所述第二解码数据得到。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一解码数据、所述第二解码数据和所述长短期记忆网络模型的模型参数获取生成概率、第一复制概率和第二复制概率,包括:根据所述第一解码数据、所述第二解码数据和所述长短期记忆网络模型的生成概率参数获取生成概率;根据所述第一解码数据获取所述第一复制概率;根据所述第二解码数据获取所述第二复制概率。3.根据权利要求2所述的方法,其特征在于,所述第一解码数据包括第一解码器隐藏序列、第一上下文向量以及第一注意力向量;所述第二解码数据包括第二解码器隐藏序列、第二上下文向量以及第二注意力向量;其中,所述第一复制概率根据所述第一注意力向量得到;所述第二复制概率根据所述第二注意力向量得到;所述根据所述第一解码数据、所述第二解码数据和所述长短期记忆网络模型的生成概率参数获取生成概率,包括:将所述第一解码器隐藏序列和所述第二解码器隐藏序列叠加得到第三解码器隐藏序列;将所述第一上下文向量和所述第二上下文向量叠加得到第三上下文向量;根据所述第三解码器隐藏序列、所述第三上下文向量和所述生成概率参数获取所述生成概率。4.根据权利要求3所述的方法,其特征在于,根据所述生成概率、第一复制概率和第二复制概率以及三者各自对应的权重获取解码概率之前,所述方法还包括:根据所述第一激活函数参数组、所述第三解码器隐藏序列、所述第三上下文向量、叠加词向量获取第一权重,其中,所述叠加词向量由所述第一描述文本和所述第二描述文本的词向量序列叠加得到;根据所述第一权重和所述摘要风格调整参数获取所述三者各自对应的权重。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一权重和所述摘要风格调整参数获取所述三者各自对应的权重,包括:设置所述第一权重为所述生成概率的权重;
设置第二权重与所述摘要风格调整参数的乘积为所述第一复制概率的权重,其中,所述第二权重为1减去所述第一权重的差;设置所述第二权重与第一参数的乘积为所述第二复制概率的权重,其中,所述第一参数为1减去所述风格调整参数的差。6.根据权利要求1所述的方法,其特征在于,所述长短期记忆网络模型的训练方法包括:将训练集中的训练数据输入所述长短期记忆网络模型;根据所述长短期记忆网络模型当前时间步长的标准答案和所述当前时间步长之前的时间步长的输出答案得到损失函数值;根据所述损失函数值调整所述长短期记忆网络模型,直到所述长短期记忆网络模型的损失函数值小于等于设定阈值,得到所述长短期记忆网络模型的模型参数;其中,所述模型参数包括所述生成概率...

【专利技术属性】
技术研发人员:李浩然袁鹏
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1