标题生成方法、训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26891364 阅读:23 留言:0更新日期:2020-12-29 16:09
本申请提供了一种标题生成方法、训练方法、装置、电子设备和存储介质,其中,该方法包括:获取为目标标题设置的关键词句,其中,所述关键词句包括:关键词或关键语句;将所述关键词句作为概率预测模型的输入参数,利用所述概率预测模型得到目标字典中的各个字符在所述关键词句两侧的各预设位置上的概率,其中,各所述预设位置为设置在所述关键词句两侧的各字符位置;根据所述概率,从所述目标字典中选择出目标字符;根据所述目标字符和所述关键词句的位置关系,生成所述目标标题,通过上述方法可以在只输入关键词句的情况下就可以得到目标标题,因此有利于降低用户在投放媒体内容时的投放难度。

【技术实现步骤摘要】
标题生成方法、训练方法、装置、电子设备和存储介质
本申请涉及计算机
,具体而言,涉及一种标题生成方法、训练方法、装置、电子设备和存储介质。
技术介绍
在通过媒体内容投放平台投放媒体内容(如:广告和文章等)之前,需要先获得媒体内容,其中,媒体内容包括媒体内容标题和媒体内容正文,媒体内容投放平台在获得一个完整的媒体内容后,可以将该媒体内容投放给用户端,该媒体内容在用户端展示时,只展示媒体内容标题,用户可以根据媒体内容标题中的内容确定是否打开该媒体内容,以查看该媒体内容中的媒体内容正文。在现有技术中,用户可以通过自己的用户端选择向其他用户端投放媒体内容,但是这种方式需要用户自己提供媒体内容标题,从而增加了用户在投放媒体内容时的投放难度。
技术实现思路
有鉴于此,本申请实施例提供了一种标题生成方法、训练方法、装置、电子设备和存储介质,以降低用户投放媒体内容时的投放难度。第一方面,本申请实施例提供了一种标题生成方法,包括:获取为目标标题设置的关键词句,其中,所述关键词句包括:关键词或关键语句;将所述关键词本文档来自技高网...

【技术保护点】
1.一种标题生成方法,其特征在于,包括:/n获取为目标标题设置的关键词句,其中,所述关键词句包括:关键词或关键语句;/n将所述关键词句作为概率预测模型的输入参数,利用所述概率预测模型得到目标字典中的各个字符在所述关键词句两侧的各预设位置上的概率,其中,各所述预设位置为设置在所述关键词句两侧的各字符位置;/n根据所述概率,从所述目标字典中选择出目标字符;/n根据所述目标字符和所述关键词句的位置关系,生成所述目标标题。/n

【技术特征摘要】
1.一种标题生成方法,其特征在于,包括:
获取为目标标题设置的关键词句,其中,所述关键词句包括:关键词或关键语句;
将所述关键词句作为概率预测模型的输入参数,利用所述概率预测模型得到目标字典中的各个字符在所述关键词句两侧的各预设位置上的概率,其中,各所述预设位置为设置在所述关键词句两侧的各字符位置;
根据所述概率,从所述目标字典中选择出目标字符;
根据所述目标字符和所述关键词句的位置关系,生成所述目标标题。


2.如权利要求1所述的方法,其特征在于,所述将所述关键词句作为概率预测模型的输入参数,利用所述概率预测模型得到目标字典中的各个字符在所述关键词句两侧的各预设位置上的概率,包括:
对所述关键词句进行切字处理,得到所述关键词句包括的各个字符;
查询所述关键词句包括的各个字符在所述目标字典中对应的第一身份标识ID;
将所述第一ID作为输入参数输入到transformer模型,得到所述目标字典中的各个字符在所述关键词句两侧的各预设位置上的概率。


3.如权利要求1所述的方法,其特征在于,根据所述概率,从所述目标字典中选择出目标字符,包括:
根据各所述预设位置在所述目标标题中与所述关键词句由小到大的间距顺序,从所述目标字典中依次确定所述目标字符;
其中,所述目标标题中与所述关键词句间距最小的目标字符依据概率采样,以及所述关键词句中与所述间距最小的目标字符相邻的字符的语义确定,所述目标标题中的其他目标字符依据概率采样,以及与该目标字符相邻的所述目标标题中已确定的字符的语义确定。


4.如权利要求1所述的方法,其特征在于,所述概率预测模型是通过使用元素对应的样本标题和该元素作为训练样本进行训练后得到的,其中,所述元素为一元组至N元组包括的元素,一元组包括的元素为所述样本标题包括的各个词语,二元组包括的元素为所述样本标题包括的各个词语中相邻的两个词语构成的语句,三元组包括的元素为所述样本标题包括的各个词语中相邻的三个词语构成的语句,以此类推,N等于所述样本标题包括的词语的数量,一元组至N元组是通过对所述样本标题进行切词处理后,由得到的各个词语构建的。


5.如权利要求4所述的方法,其特征在于,所述概率预测模型是通过所述元素包括的各第一字符在所述目标字典中对应的第二ID,以及所述样本标题包括各第二字符在所述目标字典中对应的第三ID进行训练后得到的。


6.如权利要求5所述的方法,其特征在于,所述概率预测模型的第一损失值的变化范围位于预设范围内,其中,第二损失值是将所述第二ID作为输入参数输入到所述概率预测模型中得到的输出矩阵与所述第三ID对应的矩阵之间的损失值,当所述第二损失值不位于所述预设范围内时,将所述第二损失值作为输入参数输入到指定的反响转播算法中,使用携带有输入参数的反向传播算法对所述概率预测模型中的参数进行调整,直至得到所述第一损失值。


7.一种用于标题生成的概率预测模型训练方法,其特征在于,所述概率预测模型用于得到目标字典中的各个字符在目标词语两侧的各预设位置上的概率,所述方法包括:
对于获取到的每个样本标题,对该样本标题进行切词处理,得到该样本标题包括的各个词语,其中,该样本标题中包括的任一标点符号作为一个词语;
使用该样本标题包括的各个词语构建N个元组,其中,N等于该样本标题包括的词语的数量,所述N个元组中的一元组包括的元素为该样本标题包括的各个词语,所...

【专利技术属性】
技术研发人员:郝卓琳
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1