模型训练方法及装置制造方法及图纸

技术编号:12298638 阅读:133 留言:0更新日期:2015-11-11 09:36
本发明专利技术公开了一种模型训练方法及装置,属于计算机技术领域。所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明专利技术解决了代价函数为非凸函数的预估模型的模型质量波动大的问题,达到了提高最终训练得到的预估模型的模型质量的效果。

【技术实现步骤摘要】

本专利技术涉及计算机
,特别涉及一种模型训练方法及装置
技术介绍
内容点击率预估用于预估用户点击一个内容的概率。内容点击率的影响因素包括用户特征和内容特征,即,用户的喜好、不同内容的投放位置、展现形式、内容素材等会影响内容点击率的预估值,因此,可以根据内容被用户点击和未被用户点击的历史数据来训练预估模型,通过预估模型来预估内容点击率。现有的一种模型训练方法包括:构造深度神经网络;获取历史数据,并将历史数据中的每个用户特征、与每个用户特征对应的内容特征、用户对内容采取的实际行为确定为一个训练样本;从各个训练样本中学习非线性信息;通过对非线性信息设置固定的迭代轮数来训练深度神经网络,得到预估模型。由于深度神经网络的代价函数是非凸函数,因此,该预估模型在训练过程中的模型质量的波动较大,最终训练得到的预估模型的模型质量不稳定。
技术实现思路
为了解决代价函数是非凸函数的预估模型的模型质量波动大,最终训练得到的预估模型的模型质量不稳定的问题,本专利技术实施例提供了一种模型训练方法及装置。所述技术方案如下:第一方面,提供了一种模型训练方法,所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到η个候选模型,η为大于I的正整数;将所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。第二方面,提供了一种模型训练装置,所述装置包括:模型构造模块,用于构造代价函数为非凸函数的模型;样本集获取模块,用于获取训练样本集,所述训练样本集包括用于训练所述模型构造模块构造的所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;候选模型获取模块,用于根据所述样本集获取模块得到的所述训练样本集对所述模型进行训练,得到η个候选模型,η为大于I的正整数;预估模型确定模块,用于将所述候选模型获取模块得到的所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本专利技术实施例提供的技术方案的有益效果是:通过构造代价函数为非凸函数的模型;获取训练样本集,该训练样本集包括用于训练模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据训练样本集对模型进行训练,得到η个候选模型;将η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型,解决了代价函数是非凸函数的预估模型的模型质量波动大,最终训练得到的预估模型的模型质量不稳定的问题,达到了提高最终训练得到的预估模型的模型质量的效果。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例提供的模型训练方法的方法流程图;图2是本专利技术另一实施例提供的模型训练方法的方法流程图;图3是本专利技术一个实施例提供的模型训练装置的结构框图;图4是本专利技术再一实施例提供的模型训练装置的结构框图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。请参考图1,其示出了本专利技术一个实施例提供的模型训练方法的方法流程图,该模型训练方法可以应用于服务器中。该模型训练方法,包括:步骤101,构造代价函数为非凸函数的模型。步骤102,获取训练样本集,该训练样本集包括用于训练模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值。步骤103,根据该训练样本集对模型进行训练,得到η个候选模型,η为大于I的正整数。步骤104,将η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。综上所述,本专利技术实施例提供的模型训练方法,通过构造代价函数为非凸函数的模型;获取训练样本集,该训练样本集包括用于训练模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据训练样本集对模型进行训练,得到η个候选模型;将η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型,解决了代价函数是非凸函数的预估模型的模型质量波动大,最终训练得到的预估模型的模型质量不稳定的问题,达到了提高最终训练得到的预估模型的模型质量的效果。请参考图2,其示出了本专利技术另一实施例提供的模型训练方法的方法流程图,该模型训练方法可以应用于服务器中。该模型训练方法,包括:步骤201,构造代价函数为非凸函数的模型。本实施例中的模型用于预估用户对某一个内容所采取的实际行为,该实际行为为点击行为或非点击行为,该内容可以是广告、文本、图片、视频、音频等等,本实施例不作限定。由于模型需要根据用户特征和内容特征对实际行为进行预估,而用户特征和内容特征包括非线性信息,因此,服务器构造的模型需要能够从用户特征和内容特征中学习非线性信息。即,服务器构造的模型应该是非线性模型。本实施中的用户特征可以有多种表达方式,此处以用户特征用向量表示来举例说明,则该向量中的每个分量对应于一个特征,当用户具有某一个特征时,该特征所对应的分量值为I;当用户不具有某一个特征时,该特征所对应的分量值为O。同样,内容特征也可以这样表示,本实施例不作赘述。在一种可能的实现方式中,服务器构造的模型可以是深度神经网络。其中,深度神经网络中包括一个或多个隐藏在输入和输出神经节点之间的层,且每层中的每个神经节点模型包含一个可微的非线性激活函数。由于深度神经网络的代价函数是非凸函数,且当代价函数为非凸函数时,模型在训练过程中的模型质量的波动较大,因此,最后训练得到的模型不一定有最好的模型质量,此时需要选择模型质量最好的模型。其中,凸函数是指定义在某个向量空间的凸子集上的实值函数,非凸函数是指不满足上述特征的函数。代价函数用于度量模型的预估值与实际值之间的某种距离。代价函数的函数值越小,预估值与实际值之间的距离越小,预估值越准确,此时模型的模型质量越高。步骤202,获取构造的模型的上线时间;根据在上线时间之前的预定时段内的样本生成测试样本集,该预定时段的结束时间与上线时间之间的差值小于预定阈值;根据在预定时段外的样本生成训练样本集。样本用于表示历史时刻的用户与内容之间的关系,每个样本包括用户特征、内容特征和用户对内容采取的实际行为所对应的操作值。比如,当用户点击内容时,操作值为I ;当用户未点击内容时,操作值为O。本实施例中,将用于训练模型的样本称为训练样本,将各个训练样本所组成的集合称为训练样本集。将用于测试模型的样本称为测试样本,将各个测试样本所组成的集合称为测试样本集。其中,每个测试样本与每个训练样本不同,以保证测试的准确性。在通过模型预估在线内容点击率时,最好的测试样本集是该模型上线后的实际的数据集,显然这个数据集在训练模型时还没来得及产生,因此,无法使用该数据集来测试模型。本实施例中,服务器先确定结束时间与上线时间之间的差值小于预定阈值的预定时段,将该预定时段本文档来自技高网...
模型训练方法及装置

【技术保护点】
一种模型训练方法,其特征在于,所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:金涬李毅邹永强郭志懋薛伟肖磊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1