模型训练方法及装置制造方法及图纸

技术编号：12298638 阅读：133 留言：0更新日期：2015-11-11 09:36

本发明专利技术公开了一种模型训练方法及装置，属于计算机技术领域。所述方法包括：构造代价函数为非凸函数的模型；获取训练样本集，所述训练样本集包括用于训练所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据所述训练样本集对所述模型进行训练，得到n个候选模型，n为大于1的正整数；将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明专利技术解决了代价函数为非凸函数的预估模型的模型质量波动大的问题，达到了提高最终训练得到的预估模型的模型质量的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种模型训练方法及装置。
技术介绍
内容点击率预估用于预估用户点击一个内容的概率。内容点击率的影响因素包括用户特征和内容特征，即，用户的喜好、不同内容的投放位置、展现形式、内容素材等会影响内容点击率的预估值，因此，可以根据内容被用户点击和未被用户点击的历史数据来训练预估模型，通过预估模型来预估内容点击率。现有的一种模型训练方法包括:构造深度神经网络；获取历史数据，并将历史数据中的每个用户特征、与每个用户特征对应的内容特征、用户对内容采取的实际行为确定为一个训练样本；从各个训练样本中学习非线性信息；通过对非线性信息设置固定的迭代轮数来训练深度神经网络，得到预估模型。由于深度神经网络的代价函数是非凸函数，因此，该预估模型在训练过程中的模型质量的波动较大，最终训练得到的预估模型的模型质量不稳定。
技术实现思路
为了解决代价函数是非凸函数的预估模型的模型质量波动大，最终训练得到的预估模型的模型质量不稳定的问题，本专利技术实施例提供了一种模型训练方法及装置。所述技术方案如下:第一方面，提供了一种模型训练方法，所述方法包括:构造代价函数为非凸函数的模型；获取训练样本集，所述训练样本集包括用于训练所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据所述训练样本集对所述模型进行训练，得到η个候选模型，η为大于I的正整数；将所述η个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。第二方面，提供了一种模型训练装置，所述装置包括:模型构造模块，用于构造代价函数为非凸函...
模型训练方法及装置

【技术保护点】
一种模型训练方法，其特征在于，所述方法包括：构造代价函数为非凸函数的模型；获取训练样本集，所述训练样本集包括用于训练所述模型的各个训练样本，每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值；根据所述训练样本集对所述模型进行训练，得到n个候选模型，n为大于1的正整数；将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。

【技术特征摘要】

【专利技术属性】
技术研发人员：金涬，李毅，邹永强，郭志懋，薛伟，肖磊，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人