用于进行交互行为预测的网络模型的训练方法及装置制造方法及图纸

技术编号:36929658 阅读:8 留言:0更新日期:2023-03-22 18:52
本公开提供了一种用于进行交互行为预测的网络模型的训练方法及装置,其中,该方法包括:获取样本行为内容序列,以及所述样本行为内容序列对应的提示文本;其中,所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征,所述样本行为内容序列对应的交互行为预测结果;将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果;基于在获取所述提示文本时确定的,所述预测结果对应的真值数据以及所述预测结果,对所述待训练的网络模型进行训练,以基于训练好的网络模型进行交互行为预测。测。测。

【技术实现步骤摘要】
用于进行交互行为预测的网络模型的训练方法及装置


[0001]本公开涉及互联网
,具体而言,涉及一种用于进行交互行为预测的网络模型的训练方法及装置。

技术介绍

[0002]随着互联网技术发展,网络上包含的内容也越来越多。目前,可以通过神经网络模型对网络上的内容的变化进行预测,并基于预测结果为用户推送更加符合浏览需求的内容,从而节省用户的搜索时间,提高效率。
[0003]相关技术中可以对该神经网络模型进行在线训练,然而,这种训练方法需要大量的计算资源,并且计算延迟较高,得到的训练之后的神经网络模型的性能也较差,进而难以满足预测需求。

技术实现思路

[0004]本公开实施例至少提供一种用于进行交互行为预测的网络模型的训练方法及装置。
[0005]第一方面,本公开实施例提供了一种用于进行交互行为预测的网络模型的训练方法,该方法包括:获取样本行为内容序列,以及所述样本行为内容序列对应的提示文本;其中,所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征,所述样本行为内容序列对应的交互行为预测结果;将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果;基于在获取所述提示文本时确定的,所述预测结果对应的真值数据以及所述预测结果,对所述待训练的网络模型进行训练,以基于训练好的网络模型进行交互行为预测。
[0006]一种可选的实施方式中,通过以下方式确定所述样本行为内容序列对应的提示文本:获取与所述待训练的网络模型预测的交互行为类别相匹配的提示文本模板;针对任一样本行为内容序列,获取该样本行为内容序列对应的交互行为标注信息;其中,所述交互行为标注信息包括提示结果,以及待预测结果对应的真值数据;基于所述提示文本模板以及该样本行为内容序列对应的所述交互行为标注信息中的提示结果,确定该样本行为内容序列对应的提示文本。
[0007]一种可选的实施方式中,所述将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果,包括:将所述样本行为内容序列中的各行为内容分别输入至所述待训练的网络模型中的多模态特征提取模型中,得到各行为内容分别对应的第一序列特征;将所述样本行为内容序列对应的提示文本输入至所述多模态特征提取模型中,得到第一文本特征;基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的预测结果。
[0008]一种可选的实施方式中,所述待训练的网络模型包括内容序列模型和行为预测模型;所述基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的
预测结果,包括:将所述第一序列特征输入至所述内容序列模型中,得到所述样本行为内容序列的各行为内容分别对应的深层序列特征;将所述第一文本特征和所述深层序列特征输入至所述行为预测模型中,得到所述预测结果。
[0009]一种可选的实施方式中,所述样本行为内容序列包括初始行为内容序列,以及增强行为内容序列;所述方法还包括根据以下方法确定所述增强行为内容序列,以及所述增强行为内容序列对应的提示文本:对所述初始行为内容序列进行增强处理,得到至少一个增强行为内容序列;以及,基于所述增强行为内容序列对应的标注信息,确定所述增强行为内容序列对应的提示文本。
[0010]一种可选的实施方式中,所述将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果,包括:将所述增强行为内容序列和所述增强行为内容序列对应的提示文本输入至所述待训练网络模型中,得到所述增强行为内容序列对应的预测结果,以及所述增强行为内容序列对应的预测增强处理方法;所述基于在获取所述提示文本时确定的,所述预测结果对应的真值数据以及所述预测结果,对所述待训练的网络模型进行训练,包括:基于在获取所述提示文本时确定的,所述预测结果对应的真值数据、所述预测结果、所述预测增强处理方法、以及所述增强行为内容序列对应的真实增强处理方法,对所述待训练的网络模型进行训练。
[0011]一种可选的实施方式中,所述交互行为类别包括:序列类别分析任务、序列质量分析任务、序列兴趣变化分析任务和序列点击预测任务中的任意一种。
[0012]第二方面,本公开实施例还提供一种内容推送方法,该方法包括:获取待预测行为内容序列;将所述待预测行为内容序列输入至基于上述第一方面或者第一方面中任一项所述的用于进行交互行为预测的网络模型的训练方法训练得到的目标网络模型中,确定所述待预测行为内容序列对应的交互行为预测结果;基于所述交互行为预测结果进行内容推送。
[0013]第三方面,本公开实施例还提供一种用于进行交互行为预测的网络模型的训练装置,该装置包括:第一获取单元,用于获取样本行为内容序列,以及所述样本行为内容序列对应的提示文本;其中,所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征,所述样本行为内容序列对应的交互行为预测结果;预测单元,用于将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果;训练单元,用于基于在获取所述提示文本时确定的,所述预测结果对应的真值数据以及所述预测结果,对所述待训练的网络模型进行训练,以基于训练好的网络模型进行交互行为预测。
[0014]第四方面,本公开实施例还提供一种内容推送装置,该装置包括:第二获取单元,用于获取待预测行为内容序列;确定单元,用于将所述待预测行为内容序列输入至基于上述第一方面或者第一方面中任一项所述的用于进行交互行为预测的网络模型的训练方法训练得到的目标网络模型中,确定所述待预测行为内容序列对应的交互行为预测结果;推送单元,用于基于所述交互行为预测结果进行内容推送。
[0015]第五方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与
所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或者,执行上述第二方面中的步骤。
[0016]第六方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或者,执行上述第二方面中的步骤。
[0017]上述实施方式中,可以通过获取样本行为内容序列对应的提示文本,并将该提示文本以及样本行为内容序列输入至待训练网络模型中,以得到样本行为内容序列对应的预测结果,由于提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征,所述样本行为内容序列对应的交互行为预测结果,所述提示文本是与所述待训练的网络模型的预测任务相关联的,因此可以基于该提示文本建立样本行为内容序列与预测任务之间的关联关系,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于进行交互行为预测的网络模型的训练方法,其特征在于,包括:获取样本行为内容序列,以及所述样本行为内容序列对应的提示文本;5其中,所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征,所述样本行为内容序列对应的交互行为预测结果;将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果;0基于在获取所述提示文本时确定的,所述预测结果对应的真值数据以及所述预测结果,对所述待训练的网络模型进行训练,以基于训练好的网络模型进行交互行为预测。2.根据权利要求1所述的方法,其特征在于,通过以下方式确定所述样本行为内容序列对应的提示文本:5获取与所述待训练的网络模型预测的交互行为类别相匹配的提示文本模板;针对任一样本行为内容序列,获取该样本行为内容序列对应的交互行为标注信息;其中,所述交互行为标注信息包括提示结果,以及待预测结果对应的真值数据;0基于所述提示文本模板以及该样本行为内容序列对应的所述交互行为标注信息中的提示结果,确定该样本行为内容序列对应的提示文本。3.根据权利要求1所述的方法,其特征在于,所述将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果,包括:5将所述样本行为内容序列中的各行为内容分别输入至所述待训练的网络模型中的多模态特征提取模型中,得到各行为内容分别对应的第一序列特征;将所述样本行为内容序列对应的提示文本输入至所述多模态特征提取模型中,得到第一文本特征;基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的预测结果。4.根据权利要求3所述的方法,其特征在于,所述待训练的网络模型包括内容序列模型和行为预测模型;所述基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的预测结果,包括:将所述第一序列特征输入至所述内容序列模型中,得到所述样本行为内容序列的各行为内容分别对应的深层序列特征;将所述第一文本特征和所述深层序列特征输入至所述行为预测模型中,得到所述预测结果。5.根据权利要求1所述的方法,其特征在于,所述样本行为内容序列包括初始行为内容序列,以及增强行为内容序列;所述方法还包括根据以下方法确定所述增强行为内容序列,以及所述增强行为内容序列对应的提示文本:对所述初始行为内容序列进行增强处理,得到至少一个增强行为内容序列;以及,基于所述增强行为内容序列对应的标注信息,确定所述增强行为内容序列对应的提示文本。6.根据权利要求5所述的方法,其特征在于,所述将所述样本行为内容序列和所述样本
行为内容序列对应的提示文本输入至所述待训练的网络模型中,得到所述样本行为内容序列对应的预测结果,包括:将所述增强行为内容序...

【专利技术属性】
技术研发人员:苏利会袁泽寰卢靓妮
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1