标题的生成方法及装置、存储介质、电子设备制造方法及图纸

技术编号:34456390 阅读:27 留言:0更新日期:2022-08-06 17:03
本申请公开了一种标题的生成方法及装置、存储介质、电子设备,属于计算机领域。其中,该方法包括:确定待生成标题的多个标题风格;将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题,其中,每个备选标题对应一个标题风格;在所述多个备选标题中选择一个输出为目标标题。本申请解决了相关技术中不能自动生成预定风格的标题的技术问题,提高了标题的生成效率。标题的生成效率。标题的生成效率。

【技术实现步骤摘要】
标题的生成方法及装置、存储介质、电子设备


[0001]本申请涉及计算机领域,尤其涉及一种标题的生成方法及装置、存储介质、电子设备。

技术介绍

[0002]在相关技术,在终端推送的文章或短视频等媒体内容是否被用户点击,往往与标题内容的吸引力有关。相关技术中,推送的标题往往过于直白,无法吸引用户的注意力。
[0003]在相关技术,将原标题改写成有吸引力的标题是学术界比较热门且较难攻克的问题,但相关技术对标题的改写并没有达到工业落地的需求和效果,原因是改写的标题的准确率不够高,多样性(生成不同风格的标题)也不够。由于训练集的难获取性(很难找到一个标题对应另一个风格的标题),导致基于原媒体内容生成特定风格的标题的效果一般,想要生成特定风格的标题,主要靠人工编辑。
[0004]针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种标题的生成方法及装置、存储介质、电子设备。
[0006]根据本申请实施例的一个方面,提供了一种标题的生成方法,包括:确定待生成标题的多个标题风格;将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题,其中,每个备选标题对应一个标题风格;在所述多个备选标题中选择一个输出为目标标题。
[0007]进一步,将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题包括:针对每个标题风格,根据所述标题风格生成所述预训练的T5模型中条件层归一化LN的结构参数;将标题素材输入调整后的预训练的T5模型,输出标题字符串和所述标题字符串中每个标题字符的概率信息;基于所述概率信息对所述标题字符串进行集束搜索,生成对应的备选标题。
[0008]进一步,根据所述标题风格生成所述预训练的T5模型中条件层归一化LN的结构参数包括:将所述标题风格转换为一行M列的向量矩阵,其中,M为正整数;采样所述向量矩阵乘以N维的全连接层,得到M行N列的全连接矩阵,其中,N为正整数;对所述全连接矩阵中的M行进行求和,得到所述结构参数。
[0009]进一步,在将标题素材和所述多个标题风格输入预训练的T5模型之前,所述方法还包括:提取样本标题素材和样本标题,配置所述样本标题的第一标题风格;将所述样本标题素材,所述第一标题风格,和所述样本标题输入初始T5模型,输出中间文本;根据所述样本标题和所述中间文本计算所述初始T5模型的梯度下降参数,并基于所述梯度下降参数更新所述初始T5模型,得到所述预训练的T5模型。
[0010]进一步,根据所述样本标题和所述中间文本计算所述初始T5模型的梯度下降参数
包括:计算所述中间文本与所述样本标题的内容差异值,以及计算所述中间文本与所述样本标题的风格差异值;将所述内容差异值和所述风格差异值分别配置为所述初始T5模型的内容损失值和风格损失值;对所述内容损失值和所述风格损失值进行加权求和,得到所述初始T5模型的梯度下降参数。
[0011]进一步,计算所述中间文本与所述样本标题的风格差异值包括:对所述中间文本进行采样,生成与所述样本标题相同尺寸的中间标题;采用预训练的长短期记忆网络LSTM识别所述中间标题的第二标题风格;计算所述第一标题风格与所述第二标题风格的风格差异值。
[0012]进一步,在确定待生成标题的多个标题风格之前,所述方法还包括:确定待生成标题的目标视频;提取所述目标视频中的字幕信息,并将所述字幕信息确定为所述标题素材。
[0013]根据本申请实施例的另一个方面,还提供了一种标题的生成装置,包括:处理模块,用于确定待生成标题的多个标题风格;生成模块,用于将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题,其中,每个备选标题对应一个标题风格;选择模块,用于在所述多个备选标题中选择一个输出为目标标题。
[0014]进一步,所述生成模块包括:第一生成单元,用于针对每个标题风格,根据所述标题风格生成所述预训练的T5模型中条件层归一化LN的结构参数;输出单元,用于将标题素材输入调整后的预训练的T5模型,输出标题字符串和所述标题字符串中每个标题字符的概率信息;第二生成单元,用于基于所述概率信息对所述标题字符串进行集束搜索,生成对应的备选标题。
[0015]进一步,所述第一生成单元包括:转换子单元,用于将所述标题风格转换为一行M列的向量矩阵,其中,M为正整数;第一计算子单元,用于采样所述向量矩阵乘以N维的全连接层,得到M行N列的全连接矩阵,其中,N为正整数;第二计算子单元,用于对所述全连接矩阵中的M行进行求和,得到所述结构参数。
[0016]进一步,所述装置还包括:配置模块,用于在所述生成模块将所述字幕信息和所述多个标题风格输入预训练的T5模型之前,提取样本标题素材和样本标题,配置所述样本标题的第一标题风格;输出模块,用于将所述样本标题素材,所述第一标题风格,和所述样本标题输入初始T5模型,输出中间文本;更新模块,用于根据所述样本标题和所述中间文本计算所述初始T5模型的梯度下降参数,并基于所述梯度下降参数更新所述初始T5模型,得到所述预训练的T5模型。
[0017]进一步,所述更新模块包括:第一计算单元,用于计算所述中间文本与所述样本标题的内容差异值,以及计算所述中间文本与所述样本标题的风格差异值;配置单元,用于将所述内容差异值和所述风格差异值分别配置为所述初始T5模型的内容损失值和风格损失值;第二计算单元,用于对所述内容损失值和所述风格损失值进行加权求和,得到所述初始T5模型的梯度下降参数。
[0018]进一步,所述第一计算单元包括:生成子单元,用于对所述中间文本进行采样,生成与所述样本标题相同尺寸的中间标题;识别子单元,用于采用预训练的长短期记忆网络LSTM识别所述中间标题的第二标题风格;计算子单元,用于计算所述第一标题风格与所述第二标题风格的风格差异值。
[0019]进一步,所述装置还包括:确定模块,用于在所述处理模块确定待生成标题的多个
标题风格之前,确定待生成标题的目标视频;提取模块,用于提取所述目标视频中的字幕信息,并将所述字幕信息确定为所述标题素材。
[0020]根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
[0021]根据本申请实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
[0022]本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
[0023]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
[0024]在本申请实施例中,确定待生成标题的多个标题风格,将标题素材和所述多个标题风格输入预训练的T5模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标题的生成方法,其特征在于,包括:确定待生成标题的多个标题风格;将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题,其中,每个备选标题对应一个标题风格;在所述多个备选标题中选择一个输出为目标标题。2.根据权利要求1所述的方法,其特征在于,将标题素材和所述多个标题风格输入预训练的T5模型,生成多个备选标题包括:针对每个标题风格,根据所述标题风格生成所述预训练的T5模型中条件层归一化LN的结构参数;将标题素材输入调整后的预训练的T5模型,输出标题字符串和所述标题字符串中每个标题字符的概率信息;基于所述概率信息对所述标题字符串进行集束搜索,生成对应的备选标题。3.根据权利要求2所述的方法,其特征在于,根据所述标题风格生成所述预训练的T5模型中条件层归一化LN的结构参数包括:将所述标题风格转换为一行M列的向量矩阵,其中,M为正整数;采样所述向量矩阵乘以N维的全连接层,得到M行N列的全连接矩阵,其中,N为正整数;对所述全连接矩阵中的M行进行求和,得到所述结构参数。4.根据权利要求1所述的方法,其特征在于,在将标题素材和所述多个标题风格输入预训练的T5模型之前,所述方法还包括:提取样本标题素材和样本标题,配置所述样本标题的第一标题风格;将所述样本标题素材,所述第一标题风格,和所述样本标题输入初始T5模型,输出中间文本;根据所述样本标题和所述中间文本计算所述初始T5模型的梯度下降参数,并基于所述梯度下降参数更新所述初始T5模型,得到所述预训练的T5模型。5.根据权利要求4所述的方法,其特征在于,根据所述样本标题和所述中间文本计算所述初始T5模型的梯度下降...

【专利技术属性】
技术研发人员:保俊杉
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1