摘要文本生成方法、计算设备及存储介质技术

技术编号:36359450 阅读:17 留言:0更新日期:2023-01-14 18:16
本说明书实施例提供摘要文本生成方法、计算设备及存储介质,该方法包括:获取目标文本;对目标文本执行摘要词预测任务,确定目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;对目标文本执行影响词预测任务,确定目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,影响词为经过因果分析确定的对摘要文本生成结果具有影响的词类型;针对目标文本对应的待生成摘要文本中的任一位置,根据任一位置的第一预测概率与第二预测概率,确定任一位置对应的目标摘要词;基于目标摘要词,生成目标文本对应的待生成摘要文本。基于第一预测概率与第二预测概率进行摘要预测,可提高摘要词的预测概率,从而使生成的摘要文本更准确。摘要文本更准确。摘要文本更准确。

【技术实现步骤摘要】
摘要文本生成方法、计算设备及存储介质


[0001]本说明书实施例涉及计算机
,特别涉及摘要文本生成方法。

技术介绍

[0002]近年来,生成式的文本摘要方法在生成流畅和多样化摘要方面取得了很大进展。然而,生成的摘要中通常包含与源文档不一致的内容,即存在事实不一致的问题。这种事实不一致的问题可能会误导公众,甚至产生不必要的法律和道德风险,大大限制了生成式文本摘要的实际应用。亟需一种更好的方案。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了两种摘要文本生成方法。本说明书一个或者多个实施例同时涉及一种模型训练方法,一种摘要文本生成装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种摘要文本生成方法,包括:获取目标文本;对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述影响词为经过因果分析确定的对所述摘要文本生成结果具有影响的词类型;针对所述目标文本对应的待生成摘要文本中的任一位置,根据所述任一位置的第一预测概率与第二预测概率,确定所述任一位置对应的目标摘要词;基于所述目标摘要词,生成所述目标文本对应的摘要文本。
[0005]根据本说明书实施例的第二方面,提供了一种摘要文本生成方法,包括:接收前端上传的目标文本;对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述影响词为经过因果分析确定的对所述摘要文本生成结果具有影响的词类型;针对所述目标文本对应的待生成摘要文本中的任一位置,根据所述任一位置的第一预测概率与第二预测概率,确定所述任一位置对应的目标摘要词;基于所述目标摘要词,生成所述目标文本对应的摘要文本,将所述摘要文本发送至所述前端。
[0006]根据本说明书实施例的第三方面,提供了一种模型训练方法,包括:获取目标文本;
对所述目标文本的摘要相关词添加摘要标记,以及对所述目标文本的影响相关词添加影响标记,得到文本标签样本,其中,所述影响相关词为所述目标文本中除所述摘要相关词以外的词;基于所述文本标签样本对所述第二摘要文本预测模型进行训练,并将训练后的第二摘要文本预测模型的模型参数发送至端侧设备。
[0007]根据本说明书实施例的第四方面,提供了一种摘要文本生成装置,包括:文本获取模块,被配置为获取目标文本;第一任务模块,被配置为对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;第二任务模块,被配置为对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述影响词为经过因果分析确定的对所述摘要文本生成结果具有影响的词类型;摘要确定模块,被配置为针对所述目标文本对应的待生成摘要文本中的任一位置,根据所述任一位置的第一预测概率与第二预测概率,确定所述任一位置对应的目标摘要词;摘要生成模块,被配置为基于所述目标摘要词,生成所述目标文本对应的摘要文本。
[0008]根据本说明书实施例的第五方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述摘要文本生成方法的步骤。
[0009]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述摘要文本生成方法的步骤。
[0010]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述摘要文本生成方法的步骤。
[0011]本说明书实施例提供摘要文本生成方法、计算设备及存储介质,其中所述摘要文本生成方法包括:获取目标文本;对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述影响词为经过因果分析确定的对所述摘要文本生成结果具有影响的词类型;针对所述目标文本对应的待生成摘要文本中的任一位置,根据所述任一位置的第一预测概率与第二预测概率,确定所述任一位置对应的目标摘要词;基于所述目标摘要词,生成所述目标文本对应的摘要文本。通过对目标文本执行分别执行摘要词预测任务和影响词预测任务,从而得到目标文本对应的待生成摘要文本中,各位置上关注摘要词的第一预测概率和关注影响词第二预测概率,并基于第一预测概率与第二预测概率的差值确定摘要词,可以提高摘要词的预测概率,从而使得生成的摘要文本更加准确。
附图说明
[0012]图1是本说明书一个实施例提供的一种摘要文本生成方法的应用示意图;
图2是本说明书一个实施例提供的一种摘要文本生成方法的流程图;图3是本说明书一个实施例提供的一种摘要文本生成方法的因果图的示意图;图4是本说明书一个实施例提供的一种摘要文本生成方法的因果图的另一示意图;图5是本说明书一个实施例提供的一种摘要文本生成方法的处理过程流程图;图6是本说明书一个实施例提供的一种模型训练方法的处理过程流程图;图7是本说明书一个实施例提供的一种摘要文本生成装置的结构示意图;图8是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0013]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0014]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0015]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0016]首先,对本说明书一个或多个实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种摘要文本生成方法,包括:获取目标文本;对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率;对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述影响词为经过因果分析确定的对所述摘要文本生成结果具有影响的词类型;针对所述目标文本对应的待生成摘要文本中的任一位置,根据所述任一位置的第一预测概率与第二预测概率,确定所述任一位置对应的目标摘要词;基于所述目标摘要词,生成所述目标文本对应的待生成摘要文本。2.根据权利要求1所述的方法,所述对所述目标文本执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率,包括:将所述目标文本输入第一摘要文本预测模型,执行摘要词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的摘要词的第一预测概率。3.根据权利要求2所述的方法,所述对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,包括:对所述目标文本中的摘要相关词添加掩码标记,得到掩码文本,其中,所述摘要相关词为所述目标文本中与所述摘要词相关的词;将所述掩码文本输入第一摘要文本预测模型,执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率。4.根据权利要求2所述的方法,所述对所述目标文本执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,包括:将所述目标文本输入第二摘要文本预测模型,执行影响词预测任务,确定所述目标文本对应的待生成摘要文本中,各位置的影响词的第二预测概率,其中,所述第二摘要文本预测模型对所述影响词的预测概率高于所述第一摘要文本预测模型。5.根据权利要求4所述的方法,还包括对所述第二摘要文本预测模型进行训练的步骤;相应地,对所述第二摘要文本预测模型进行训练,包括:对所述目标文本的摘要相关词添加摘要标记,以及对所述目标文本的影响相关词添加影响标记,得到文本标签样本,其中,所述影响相关词为所述目标文本中除所述摘要相关词以外的词;基于所述文本标签样本对所述第二摘要文本预测模型进行训练。6.根据权利要求5所述的方法,所述基于所述文本标签样本对所述第二摘要文本预测模型进行训练,包括:将所述文本标签样本输入所述第二摘要文本预测模型,得到训练预测概率;根据第一损失函数和所述训练预测概率,计算第一损失值,其中,所述第一损失函数用于减少所述第二摘要文本预测模型对所述摘要词的预测概率;根据第一损失值对所述第二摘要文本预测模型的模型参数进行调整,获得训练后的第二摘要文本预测模型。7.根据权利要求6所述的方法,在所述基于所述文本标签样本对所述第二摘要文本预
测模型进行训练,包括:根据第二损失函数和所述训练预测概率,计算第二损失值,其中,所述第二损失函数用于增加所述第一训练模型对所述影响词的预测概率;根据第二损失值对所述第一训练模型的模型参数进行调整,获得训练后的第二摘要文本预测模型。8....

【专利技术属性】
技术研发人员:谢悦湘董晨鹤李雅亮丁博麟沈颖
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1