模型处理方法、装置、设备及存储介质制造方法及图纸

技术编号:35108451 阅读:31 留言:0更新日期:2022-10-01 17:20
本申请公开一种模型处理方法、装置、设备及存储介质,其相关实施例可应用于人工智能等场景。该方法包括:获取候选样本对以及相应的样本标注标签;候选样本对包括候选对象集中的两个对象标识;调用待更新的目标模型根据候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在目标行为类型下的行为参数的描述信息;采用位置预测函数根据预测出的各个描述信息,对候选样本对中的两个对象标识在候选对象集中的位置关系进行预测,得到目标位置预测结果;根据样本标注标签和目标位置预测结果,更新目标模型的模型参数,以得到目标资讯信息对应的更新后的目标模型;可以提升模型的收敛速度,减少模型的训练时长,提高模型的训练效率。训练效率。训练效率。

【技术实现步骤摘要】
模型处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种模型处理方法、装置、设备及存储介质。

技术介绍

[0002]在广告信息、活动信息等资讯信息的推送场景中,通常可以通过训练一个神经网络模型来预测对象的行为参数,进而通过行为参数的高低判断是否将该资讯信息推送至该对象,行为参数可用于衡量对象在接收到推送的资讯信息后,对该资讯信息执行的某一种反馈行为的重要度。目前,通常是通过对比对样本对象标注得到的行为参数,和神经网络模型针对样本对象预测得到的行为参数之间的差异,来对神经网络模型进行训练的;但由于存在行为参数的样本对象少,这样会导致神经网络模型的训练样本少,而较少的训练样本容易使得神经网络模型在训练过程中无法快速达到收敛,导致模型训练时长较长,从而使得模型训练效率较低。

技术实现思路

[0003]本申请实施例提供一种模型处理方法、装置、设备、存储介质,可以提升模型的收敛速度,减少模型的训练时长,提高模型的训练效率。
[0004]一方面,本申请实施例提供了一种模型处理方法,包括:
[0005]获取候选样本对以及相应的样本标注标签;所述候选样本对包括候选对象集中的两个对象标识,所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定的,任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的重要度,所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集中的位置关系;
[0006]调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息;
[0007]采用位置预测函数根据预测出的各个描述信息,对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测,得到目标位置预测结果;
[0008]根据所述样本标注标签和所述目标位置预测结果,更新所述目标模型的模型参数,以得到所述目标资讯信息对应的更新后的目标模型;其中,所述目标资讯信息对应的更新后的目标模型所预测出的描述信息,用于决策是否将所述目标资讯信息推送给相应对象。
[0009]一方面,本申请实施例提供了一种模型处理装置,包括:
[0010]获取用于更新初始模型的原始对象集;所述原始对象集包括:历史接收到所述目标资讯信息的多个对象的对象标识;
[0011]从所述原始对象集中选取两个对象标识构建原始样本对,获取基于所述原始样本对中各个对象标识的行为标签所得到的原始标注标签;任一行为标签指示相应对象是否对所述目标资讯信息执行过反馈行为;所述原始标注标签指示所述原始样本对中的两个对象
标识在所述原始对象集中的位置关系;
[0012]调用所述初始模型根据所述原始样本对中各个对象标识对应的对象特征,分别对相应对象的行为执行情况进行预测,得到相应的行为预测结果;任一行为预测结果用于指示:相应对象对所述目标资讯信息执行反馈行为的概率;
[0013]采用所述位置预测函数根据得到的各个行为预测结果,对所述原始样本对中的两个对象标识在所述原始对象集中的位置关系进行预测,得到所述原始样本对所对应的位置预测结果;
[0014]基于所述原始标注标签和所述原始样本对所对应的位置预测结果更新所述初始模型,以得到待更新的目标模型。
[0015]一方面,本申请实施例提供了一种电子设备,其特征在于,所述电子设备包括输入接口和输出接口,还包括:
[0016]处理器,适于实现一条或多条指令;以及,
[0017]计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行上述模型处理方法。
[0018]一方面,本申请实施例提供了一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行上述模型处理方法。
[0019]一方面,本申请实施例提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序存储在计算机存储介质中;电子设备的处理器从计算机存储介质中读取该计算机程序,处理器执行该计算机程序,使得电子设备执行上述模型处理方法。
[0020]本申请实施例可构建目标模型,以用于预测对象的对象标识在目标行为类型下的行为参数的描述信息,在采用候选对象集对目标模型进行训练的过程中,可以获取包括了候选对象集中的两个对象标识的候选样本对,以及相应的用于标记候选样本对中的两个对象标识在候选对象集中的位置关系的样本标注标签,其中,样本标注标签是基于候选样本对中各个对象标识的目标行为参数确定的。然后利用排序学习的思想,调用目标模型根据候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在目标行为类型下的行为参数的描述信息,并根据预测出的各个描述信息,对候选样本对中的两个对象标识在候选对象集中的位置关系进行预测,得到目标位置预测结果,从而基于样本标注标签和目标位置预测结果来更新目标模型的模型参数。可见,本申请实施例通过利用排序学习的思想,使得可通过对候选对象集中的各个对象标识进行两两组合的方式来进行训练样本的扩充,在一定程度上提升目标模型的训练样本(一个训练样本为一个样本对)的数量,这样不仅可解决因训练样本少带来的模型过拟合问题,还可使得目标模型在训练过程中可以通过较为丰富的训练样本来学习到更多的知识,从而可以提升目标模型的收敛速度,减少目标模型的训练时长,提高目标模型的训练效率,并进一步提升目标模型的模型训练效果,使得更新后的目标模型可具有表现力好、鲁棒性高等优势,进而使得更新后的目标模型可以较为准确地预测出任一对象的对象标识在目标行为类型下的行为参数的描述信息,以根据描述信息准确决策出是否将目标资讯信息推送给相应对象,提高资讯信息的推送效果。
附图说明
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1a是本申请实施例提供的一种由终端设备和服务器共同执行模型处理方案的示意图;
[0023]图1b是本申请实施例提供的另一种由终端设备和服务器共同执行模型处理方案的示意图;
[0024]图2是本申请实施例提供的一种模型处理方法的流程示意图;
[0025]图3是本申请实施例提供的另一种模型处理方法的流程示意图;
[0026]图4是本申请实施例提供的一种目标模型的结构示意图;
[0027]图5是本申请实施例提供的一种通过权重学习层对中间特征进行处理的示意图;
[0028]图6是本申请实施例提供的一种向目标对象推送目标资讯信息的示意图;
[0029]图7是本申请实施例提供的一种向多个对象推送目标资讯信息的示意图;
[0030]图8是本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法,其特征在于,包括:获取候选样本对以及相应的样本标注标签;所述候选样本对包括候选对象集中的两个对象标识,所述样本标注标签是基于所述候选样本对中各个对象标识的目标行为参数确定的,任一目标行为参数指示相应对象对目标资讯信息执行的目标行为类型下的反馈行为的重要度,所述样本标注标签用于标记所述候选样本对中的两个对象标识在所述候选对象集中的位置关系;调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息;采用位置预测函数根据预测出的各个描述信息,对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测,得到目标位置预测结果;根据所述样本标注标签和所述目标位置预测结果,更新所述目标模型的模型参数,以得到所述目标资讯信息对应的更新后的目标模型;其中,所述目标资讯信息对应的更新后的目标模型所预测出的描述信息,用于决策是否将所述目标资讯信息推送给相应对象。2.如权利要求1所述的方法,其特征在于,所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置,所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置;所述获取候选样本对以及相应的样本标注标签,包括:获取所述候选样本对,以及所述候选样本对中各个对象标识的目标行为参数;若所述候选样本对中的第一个对象标识的目标行为参数,大于所述候选样本对中的第二个对象标识的目标行为参数,则将第一标签确定为所述样本标注标签,所述第一标签用于指示:所述第一排列位置位于所述第二排列位置之前;若所述候选样本对中的第一个对象标识的目标行为参数,等于所述候选样本对中的第二个对象标识的目标行为参数,则将第二标签确定为所述样本标注标签,所述第二标签用于指示:所述第一排列位置和所述第二排列位置为同一位置;若所述候选样本对中的第一个对象标识的目标行为参数,小于所述候选样本对中的第二个对象标识的目标行为参数,则将第三标签确定为所述样本标注标签,所述第三标签用于指示:所述第一排列位置位于所述第二排列位置之后。3.如权利要求1或2所述的方法,其特征在于,任一对象特征包括N个属性特征,N为正整数;所述调用待更新的目标模型根据所述候选样本对中各个对象标识对应的对象特征,分别预测相应对象标识在所述目标行为类型下的行为参数的描述信息,包括:调用所述待更新的目标模型,分别对所述候选样本对中的第i个对象标识对应的对象特征中的各个属性特征进行特征降维处理,得到N个中间特征;i∈[1,2];获取所述N个中间特征中每个中间特征的特征权重;任一特征权重用于指示相应的中间特征的重要度;根据所述每个中间特征以及相应的特征权重,预测所述第i个对象标识在所述目标行为类型下的行为参数的描述信息。4.如权利要求3所述的方法,其特征在于,任一中间特征是一个多维向量;所述获取所述N个中间特征中每个中间特征的特征权重,包括:分别对所述N个中间特征中每个中间特征进行特征挤压处理,得到N个特征挤压值;任
一特征挤压值为一维数值;根据所述N个中间特征中第n个中间特征对应的特征挤压值与各个特征挤压值之间的相关性,确定所述第n个中间特征的特征权重,n∈[1,N]。5.如权利要求1所述的方法,其特征在于,所述候选样本对中的第一个对象标识在所述候选对象集中的排列位置称为第一排列位置,所述候选样本对中的第二个对象标识在所述候选对象集中的排列位置称为第二排列位置;所述采用位置预测函数根据预测出的各个描述信息,对所述候选样本对中的两个对象标识在所述候选对象集中的位置关系进行预测,得到目标位置预测结果,包括:采用所述位置预测函数根据所述预测出的各个描述信息,对所述第一排列位置位于所述第二排列位置之前的概率进行预测,得到预测概率;以及,将所述预测概率作为所述目标位置预测结果;其中,当所述预测概率大于基准概率时,指示预测出的位置关系为:所述第一排列位置位于所述第二排列位置之前;当所述预测概率等于所述基准概率时,指示预测出的位置关系为:所述第一排列位置和所述第二排列位置为同一位置;当所述预测概率小于所述基准概率时,指示预测出的位置关系为:所述第一排列位置位于所述第二排列位置之后。6.如权利要求5所述的方法,其特征在于,所述样本标注标签包括数值,且所述数值处于预设数值区间内;任一描述信息包括:一个用于描述目标行为类型下的行为参数的预测分值;所述采用所述位置预测函数根据所述预测出的各个描述信息,对所述第一排列位置位于所述第二排列位置之前的概率进行预测,得到预测概率,包括:采用所述位置预测函数对所述候选样本对中的第一个对象标识在所述目标行为类型下的预测分值与第二个对象标识在所述目标行为类型下的预测分值进行差值运算,得到差值运算结果;将所述差值运算结果映射至所述预设数值区间中,得到所述预测概率。7.如权利要求1所述的方法,其特征在于,所述方法还包括:获取用于更新初始模型的原始对象集;所述原始对象集包括:历史接收到所述目标资讯信息的多个对象的对象标识;从所述原始对象集中选取两个对象标识构建原始样本对,并获取基于所述原始样本对中各个对象标识的行为标签所得到的原始标注标签;任一行为标签指示相应对象是否对所述目标资讯信息执行过反馈行为;所述原始标注标签指示所述原始样本对中的两个对象标识在所述原始对象集中的位置关系;调用所述初始模型根据所述原始样本对中各个对象标识对应的对象特征,分别对相应对象的行为执行情况进行预测,得到相应的行为预测结果;任一行为预测结果用于指示:相应对象对所述目标资讯信息执行反馈行为的概率;采用所述位置预测函数根据得到的各个行为预测结果,对所述原始样本对中的两个对象标识在所述原始对象集中的位置关系进行预测,得到所述原始样本对所对应...

【专利技术属性】
技术研发人员:杨诏佟建锋张蔚石兮若陈琼
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1