【技术实现步骤摘要】
模型处理方法、装置、设备及存储介质
[0001]本申请涉及人工智能领域,尤其涉及一种模型处理方法、装置、设备及存储介质。
技术介绍
[0002]在广告信息、活动信息等资讯信息的推送场景中,通常可以通过训练一个神经网络模型来预测对象的行为参数,进而通过行为参数的高低判断是否将该资讯信息推送至该对象,行为参数可用于衡量对象在接收到推送的资讯信息后,对该资讯信息执行的某一种反馈行为的重要度。目前,通常是通过对比对样本对象标注得到的行为参数,和神经网络模型针对样本对象预测得到的行为参数之间的差异,来对神经网络模型进行训练的;但由于存在行为参数的样本对象少,这样会导致神经网络模型的训练样本少,而较少的训练样本容易使得神经网络模型在训练过程中无法快速达到收敛,导致模型训练时长较长,从而使得模型训练效率较低。
技术实现思路
[0003]本申请实施例提供一种模型处理方法、装置、设备、存储介质,可以提升模型的收敛速度,减少模型的训练时长,提高模型的训练效率。
[0004]一方面,本申请实施例提供了一种模型处理方法,包括:
[0005]获取候选样本对以及相应的样本标注标签;所述候选样本对包括候选对象集中的两个对象标识,所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定的,任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的重要度,所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集中的位置关系;
[0006]调用待更新的目标模型根据所述候选 ...
【技术保护点】
【技术特征摘要】
1.一种模型处理方法,其特征在于,包括:获取候选样本对以及相应的样本标注标签;所述候选样本对包括候选对象集中的两个对象标识,所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定的,任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的重要度,所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集中的位置关系;调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息;采用位置预测函数根据预测出的各个描述信息,对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测,得到目标位置预测结果;根据所述样本标注标签和所述目标位置预测结果,更新所述目标模型的模型参数,以得到所述目标资讯信息对应的更新后的目标模型;其中,所述目标资讯信息对应的更新后的目标模型所预测出的描述信息,用于决策是否将所述目标资讯信息推送给相应对象。2.如权利要求1所述的方法,其特征在于,所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置,所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置;所述获取候选样本对以及相应的样本标注标签,包括:获取所述候选样本对,以及所述候选样本对中各个对象标识的目标行为参数;若所述候选样本对中的第一个对象标识的目标行为参数,大于所述候选样本对中的第二个对象标识的目标行为参数,则将第一标签确定为所述样本标注标签,所述第一标签用于指示:所述第一排列位置位于所述第二排列位置之前;若所述候选样本对中的第一个对象标识的目标行为参数,等于所述候选样本对中的第二个对象标识的目标行为参数,则将第二标签确定为所述样本标注标签,所述第二标签用于指示:所述第一排列位置和所述第二排列位置为同一位置;若所述候选样本对中的第一个对象标识的目标行为参数,小于所述候选样本对中的第二个对象标识的目标行为参数,则将第三标签确定为所述样本标注标签,所述第三标签用于指示:所述第一排列位置位于所述第二排列位置之后。3.如权利要求1或2所述的方法,其特征在于,任一对象特征包括N个属性特征,N为正整数;所述调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息,包括:调用所述待更新的目标模型,分别对所述候选样本对中的第i个对象标识对应的对象特征中的各个属性特征进行特征降维处理,得到N个中间特征;i∈[1,2];获取所述N个中间特征中每个中间特征的特征权重;任一特征权重用于指示相应的中间特征的重要度;根据所述每个中间特征以及相应的特征权重,预测所述第i个对象标识在所述目标行为类型下的行为参数的描述信息。4.如权利要求3所述的方法,其特征在于,任一中间特征是一个多维向量;所述获取所述N个中间特征中每个中间特征的特征权重,包括:分别对所述N个中间特征中每个中间特征进行特征挤压处理,得到N个特征挤压值;任
一特征挤压值为一维数值;根据所述N个中间特征中第n个中间特征对应的特征挤压值与各个特征挤压值之间的相关性,确定所述第n个中间特征的特征权重,n∈[1,N]。5.如权利要求1所述的方法,其特征在于,所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置,所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置;所述采用位置预测函数根据预测出的各个描述信息,对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测,得到目标位置预测结果,包括:采用所述位置预测函数根据所述预测出的各个描述信息,对所述第一排列位置位于所述第二排列位置之前的概率进行预测,得到预测概率;以及,将所述预测概率作为所述目标位置预测结果;其中,当所述预测概率大于基准概率时,指示预测出的位置关系为:所述第一排列位置位于所述第二排列位置之前;当所述预测概率等于所述基准概率时,指示预测出的位置关系为:所述第一排列位置和所述第二排列位置为同一位置;当所述预测概率小于所述基准概率时,指示预测出的位置关系为:所述第一排列位置位于所述第二排列位置之后。6.如权利要求5所述的方法,其特征在于,所述样本标注标签包括数值,且所述数值处于预设数值区间内;任一描述信息包括:一个用于描述目标行为类型下的行为参数的预测分值;所述采用所述位置预测函数根据所述预测出的各个描述信息,对所述第一排列位置位于所述第二排列位置之前的概率进行预测,得到预测概率,包括:采用所述位置预测函数对所述候选样本对中的第一个对象标识在所述目标行为类型下的预测分值与第二个对象标识在所述目标行为类型下的预测分值进行差值运算,得到差值运算结果;将所述差值运算结果映射至所述预设数值区间中,得到所述预测概率。7.如权利要求1所述的方法,其特征在于,所述方法还包括:获取用于更新初始模型的原始对象集;所述原始对象集包括:历史接收到所述目标资讯信息的多个对象的对象标识;从所述原始对象集中选取两个对象标识构建原始样本对,并获取基于所述原始样本对中各个对象标识的行为标签所得到的原始标注标签;任一行为标签指示相应对象是否对所述目标资讯信息执行过反馈行为;所述原始标注标签指示所述原始样本对中的两个对象标识在所述原始对象集中的位置关系;调用所述初始模型根据所述原始样本对中各个对象标识对应的对象特征,分别对相应对象的行为执行情况进行预测,得到相应的行为预测结果;任一行为预测结果用于指示:相应对象对所述目标资讯信息执行反馈行为的概率;采用所述位置预测函数根据得到的各个行为预测结果,对所述原始样本对中的两个对象标识在所述原始对象集中的位置关系进行预测,得到所述原始样本对所对应...
【专利技术属性】
技术研发人员:杨诏,佟建锋,张蔚,石兮若,陈琼,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。