行为预测模型的训练方法、行为预测方法及装置、设备制造方法及图纸

技术编号:28420402 阅读:17 留言:0更新日期:2021-05-11 18:27
本公开的实施方式提供了一种行为预测模型的训练方法及行为预测方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。该行为预测模型的训练方法包括:获取多个用户群体对目标信息的行为数据,并根据所述行为数据生成所述目标信息的标签组;将所述目标信息的特征信息输入待训练的行为预测模型,得到所述目标信息的用户行为预测数据组;根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数;根据所述损失函数对所述行为预测模型的模型参数进行调整,以训练所述行为预测模型。本公开实施例的技术方案,能够提高模型的准确性。

【技术实现步骤摘要】
行为预测模型的训练方法、行为预测方法及装置、设备
本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及一种行为预测模型的训练方法及装置、行为预测方法及装置、电子设备以及计算机可读存储介质。
技术介绍
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着大数据的发展,了解用户的阅读偏好对推荐结果是否准确至关重要。因此,需要准确地确定所有用户对于某一个目标信息的用户行为的倾向性。相关技术中,对针对于目标信息的用户行为的用户群体进行分析时,一般通过启发式算法和监督学习算法来计算。其中启发式算法通过人为阅读和调研大量数据,并从大量数据当中总结出规律,进而设计对应的规则引擎去完成用户群体的分析。而基于监督学习的算法,则是通过大量人工标注好的数据去学习目标信息到用户群体之间的映射关系。
技术实现思路
但是,相关技术中,总结出来的规则引擎难以覆盖到全部的情况,具有一定的局限性且难以复用,通过人工标注的数据学习的映射关系的准确性较低。为此,非常需要一种改进的行为预测模型的训练方法,以便于根据训练好的行为预测模型来准确地对各个用户群体的用户行为进行预测。在本上下文中,本公开的实施方式期望提供一种行为预测模型的训练方法、行为预测模型的训练装置、行为预测方法、行为预测装置、电子设备及计算机可读存储介质。根据本公开的一个方面,提供一种行为预测模型的训练方法,包括:获取多个用户群体对目标信息的行为数据,并根据所述行为数据生成所述目标信息的标签组,所述标签组包括各用户群体对应的标签;将所述目标信息的特征信息输入待训练的行为预测模型,得到所述目标信息的用户行为预测数据组,所述用户行为预测数据组包括各用户群体对应的用户行为预测数据;根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数;根据所述损失函数对所述行为预测模型的模型参数进行调整,以训练所述行为预测模型。在本公开的一种示例性实施例中,所述根据所述行为数据生成所述目标信息的标签组,包括:将所述多个用户群体对所述目标信息的行为数据进行归一化处理,得到归一化行为数据;根据所述归一化行为数据生成所述目标信息的标签组。在本公开的一种示例性实施例中,所述将所述多个用户群体对所述目标信息的行为数据进行归一化处理,得到归一化行为数据,包括:在每个用户群体对每个样本信息的行为数据中,确定全局行为数据最大值与全局行为数据最小值;根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据。在本公开的一种示例性实施例中,在根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据后,所述方法还包括:在每个用户群体对所述目标信息的行为数据中,确定局部行为数据最大值与局部行为数据最小值;根据所述局部行为数据最大值与局部行为数据最小值,对所述归一化行为数据进行再次归一化处理,以更新所述归一化行为数据。在本公开的一种示例性实施例中,所述根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数,包括:根据所述标签组以及所述用户行为预测数据组确定期望损失项;根据所述用户行为预测数据组中多个用户群体的数据分布状态确定正则项;对所述期望损失项和所述正则项进行逻辑组合,确定所述损失函数。在本公开的一种示例性实施例中,所述正则项包括第一正则项与第二正则项;所述根据所述用户行为预测数据组中多个用户群体的数据分布状态确定正则项,包括:根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项;根据所述多个用户群体中目标用户群体的预测数据确定第二正则项;所述目标用户群体为所述标签组中数值最大的标签所对应的用户群体。在本公开的一种示例性实施例中,所述根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项,包括:计算所述相邻用户群体的预测数据之间的差值,并根据所述差值确定所述第一正则项。根据本公开的一个方面,提供一种行为预测方法,包括:获取待处理信息,并获取所述待处理信息的多个特征信息;将所述多个特征信息输入至行为预测模型,对多个用户群体针对所述待处理信息的用户行为进行预测,得到所述多个用户群体对应的预测数据;其中,所述行为预测模型为根据上述任意一项所述的行为预测模型的训练方法训练得到的模型。根据本公开的一个方面,提供一种行为预测模型的训练装置,包括:标签生成模块,用于获取多个用户群体对目标信息的行为数据,并根据所述行为数据生成所述目标信息的标签组,所述标签组包括各用户群体对应的标签;预测数据确定模块,用于将所述目标信息的特征信息输入待训练的行为预测模型,得到所述目标信息的用户行为预测数据组,所述用户行为预测数据组包括各用户群体对应的用户行为预测数据;损失函数确定模块,用于根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数;模型训练模块,用于根据所述损失函数对所述行为预测模型的模型参数进行调整,以训练所述行为预测模型。在本公开的一种示例性实施例中,所述标签生成模块包括:归一化模块,用于将所述多个用户群体对所述目标信息的行为数据进行归一化处理,得到归一化行为数据;生成控制模块,用于根据所述归一化行为数据生成所述目标信息的标签组。在本公开的一种示例性实施例中,所述归一化模块包括:全局数据确定模块,用于在每个用户群体对每个样本信息的行为数据中,确定全局行为数据最大值与全局行为数据最小值;归一化控制模块,用于根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据。在本公开的一种示例性实施例中,在根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据后,所述装置还包括:局部数据确定模块,用于每个用户群体对所述目标信息的行为数据中,确定局部行为数据最大值与局部行为数据最小值;归一化更新模块,用于根据所述局部行为数据最大值与所述局部行为数据最小值,对所述归一化行为数据进行再次归一化处理,以更新所述归一化行为数据。在本公开的一种示例性实施例中,所述损失函数确定模块,包括:期望损失项确定模块,用于根据所述标签组以及所述用户行为预测数据组确定期望损失项;正则项确定模块,用于根据所述预测数据组中多个用户群体的数据分布状态确定正则项;逻辑组合模块,用于对所述期望损失项和所述正则项进行逻辑组合,确定所述损失函数。在本公开的一种示例性实施例中,所述正则项包括第一正则项与第二正则项;所述正则项确定模块包括:第一确定模块,用于根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项;第二确定模本文档来自技高网...

【技术保护点】
1.一种行为预测模型的训练方法,其特征在于,包括:/n获取多个用户群体对目标信息的行为数据,并根据所述行为数据生成所述目标信息的标签组,所述标签组包括各用户群体对应的标签;/n将所述目标信息的特征信息输入待训练的行为预测模型,得到所述目标信息的用户行为预测数据组,所述用户行为预测数据组包括各用户群体对应的用户行为预测数据;/n根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数;/n根据所述损失函数对所述行为预测模型的模型参数进行调整,以训练所述行为预测模型。/n

【技术特征摘要】
1.一种行为预测模型的训练方法,其特征在于,包括:
获取多个用户群体对目标信息的行为数据,并根据所述行为数据生成所述目标信息的标签组,所述标签组包括各用户群体对应的标签;
将所述目标信息的特征信息输入待训练的行为预测模型,得到所述目标信息的用户行为预测数据组,所述用户行为预测数据组包括各用户群体对应的用户行为预测数据;
根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数;
根据所述损失函数对所述行为预测模型的模型参数进行调整,以训练所述行为预测模型。


2.根据权利要求1所述的行为预测模型的训练方法,其特征在于,所述根据所述行为数据生成所述目标信息的标签组,包括:
将所述多个用户群体对所述目标信息的行为数据进行归一化处理,得到归一化行为数据;
根据所述归一化行为数据生成所述目标信息的标签组。


3.根据权利要求2所述的行为预测模型的训练方法,其特征在于,所述将所述多个用户群体对所述目标信息的行为数据进行归一化处理,得到归一化行为数据,包括:
在每个用户群体对每个样本信息的行为数据中,确定全局行为数据最大值与全局行为数据最小值;
根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据。


4.根据权利要求3所述的行为预测模型的训练方法,其特征在于,在根据所述全局行为数据最大值与全局行为数据最小值,将每个用户群体对所述目标信息的行为数据进行归一化处理,得到所述归一化行为数据后,所述方法还包括:
在每个用户群体对所述目标信息的行为数据中,确定局部行为数据最大值与局部行为数据最小值;
根据所述局部行为数据最大值与局部行为数据最小值,对所述归一化行为数据进行再次归一化处理,以更新所述归一化行为数据。


5.根据权利要求1所述的行为预测模型的训练方法,其特征在于,所述根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态,确定所述行为预测模型的损失函数,包括:
根据所述标...

【专利技术属性】
技术研发人员:刘宸
申请(专利权)人:网易传媒科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1