用于进行交互行为预测的网络模型的训练方法及装置制造方法及图纸

技术编号：36929658 阅读：8 留言：0更新日期：2023-03-22 18:52

本公开提供了一种用于进行交互行为预测的网络模型的训练方法及装置，其中，该方法包括：获取样本行为内容序列，以及所述样本行为内容序列对应的提示文本；其中，所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征，所述样本行为内容序列对应的交互行为预测结果；将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中，得到所述样本行为内容序列对应的预测结果；基于在获取所述提示文本时确定的，所述预测结果对应的真值数据以及所述预测结果，对所述待训练的网络模型进行训练，以基于训练好的网络模型进行交互行为预测。测。测。

全部详细技术资料下载

【技术实现步骤摘要】
用于进行交互行为预测的网络模型的训练方法及装置

[0001]本公开涉及互联网
，具体而言，涉及一种用于进行交互行为预测的网络模型的训练方法及装置。

技术介绍

[0002]随着互联网技术发展，网络上包含的内容也越来越多。目前，可以通过神经网络模型对网络上的内容的变化进行预测，并基于预测结果为用户推送更加符合浏览需求的内容，从而节省用户的搜索时间，提高效率。
[0003]相关技术中可以对该神经网络模型进行在线训练，然而，这种训练方法需要大量的计算资源，并且计算延迟较高，得到的训练之后的神经网络模型的性能也较差，进而难以满足预测需求。

技术实现思路

[0004]本公开实施例至少提供一种用于进行交互行为预测的网络模型的训练方法及装置。
[0005]第一方面，本公开实施例提供了一种用于进行交互行为预测的网络模型的训练方法，该方法包括：获取样本行为内容序列，以及所述样本行为内容序列对应的提示文本；其中，所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征，所述样本行为内容序列对应的交互行为预测结果；将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中，得到所述样本行为内容序列对应的预测结果；基于在获取所述提示文本时确定的，所述预测结果对应的真值数据以及所述预测结果，对所述待训练的网络模型进行训练，以基于训练好的网络模型进行交互行为预测。
[0006]一种可选的实施方式中，通过以下方式确定所述样本行为内容序列对应的提示文本：获取与所述待训练...

【技术保护点】

【技术特征摘要】
1.一种用于进行交互行为预测的网络模型的训练方法，其特征在于，包括：获取样本行为内容序列，以及所述样本行为内容序列对应的提示文本；5其中，所述提示文本中的提示结果和待训练的网络模型输出的预测结果用于表征，所述样本行为内容序列对应的交互行为预测结果；将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中，得到所述样本行为内容序列对应的预测结果；0基于在获取所述提示文本时确定的，所述预测结果对应的真值数据以及所述预测结果，对所述待训练的网络模型进行训练，以基于训练好的网络模型进行交互行为预测。2.根据权利要求1所述的方法，其特征在于，通过以下方式确定所述样本行为内容序列对应的提示文本：5获取与所述待训练的网络模型预测的交互行为类别相匹配的提示文本模板；针对任一样本行为内容序列，获取该样本行为内容序列对应的交互行为标注信息；其中，所述交互行为标注信息包括提示结果，以及待预测结果对应的真值数据；0基于所述提示文本模板以及该样本行为内容序列对应的所述交互行为标注信息中的提示结果，确定该样本行为内容序列对应的提示文本。3.根据权利要求1所述的方法，其特征在于，所述将所述样本行为内容序列和所述样本行为内容序列对应的提示文本输入至所述待训练的网络模型中，得到所述样本行为内容序列对应的预测结果，包括：5将所述样本行为内容序列中的各行为内容分别输入至所述待训练的网络模型中的多模态特征提取模型中，得到各行为内容分别对应的第一序列特征；将所述样本行为内容序列对应的提示文本输入至所述多模态特征提取模型中，得到第一文本特征；基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的预测结果。4.根据权利要求3所述的方法，其特征在于，所述待训练的网络模型包括内容序列模型和行为预测模型；所述基于所述第一序列特征以及所述第一文本特征确定所述样本行为内容序列对应的预测结果，包括：将所述第一序列特征输入至所述内容序列模型中，得到所述样本行为内容序列的各行为内容分别对应的深层序列特征；将所述第一文本特征和所述深层序列特征输入至所述行为预测模型中，得到所述预测结果。5.根据权利要求1所述的方法，其特征在于，所述样本行为内容序列包括初始行为内容序列，以及增强行为内容序列；所述方法还包括根据以下方法确定所述增强行为内容序列，以及所述增强行为内容序列对应的提示文本：对所述初始行为内容序列进行增强处理，得到至少一个增强行为内容序列；以及，基于所述增强行为内容序列对应的标注信息，确定所述增强行为内容序列对应的提示文本。6.根据权利要求5所述的方法，其特征在于，所述将所述样本行为内容序列和所述样本
行为内容序列对应的提示文本输入至所述待训练的网络模型中，得到所述样本行为内容序列对应的预测结果，包括：将所述增强行为内容序...

【专利技术属性】
技术研发人员：苏利会，袁泽寰，卢靓妮，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人