The embodiment of the present invention discloses a training model generation method, which includes: model training of the acquired first training data to obtain the first training model parameters; in which the attribute data of the first training data to be the first training sample and the historical use data of the information to be processed generated by the first training sample in a predetermined period of time are acquired; Two data to be trained; where the second data to be trained is the attribute data of the second training sample of the predicted object and the real-time data generated by the second training sample; the type of the first training sample is the same as that of the second training sample; the second model parameters are obtained by model training of the second data to be trained; and based on the first model parameters. The number and the second model parameters are used to generate the target training model. The embodiment of the present invention also discloses a training model generation device, device and computer storage medium.
【技术实现步骤摘要】
一种训练模型生成方法、装置、设备和计算机存储介质
本专利技术涉及计算机领域中的训练模型生成技术,尤其涉及一种训练模型生成方法、装置、设备和计算机存储介质。
技术介绍
效果广告提高收益的一个手段是通过提每一千次展示可以获得的广告收入(effectiveCostPerMille,eCPM),由于广告主对于每个点击的出价是固定的,所以提高点击率有助于提高收益。因此,生成预估广告点击率等的模型已经成为一种趋势。目前,智汇推效果广告的点击率预估模型训练中,包括离线训练和实时训练两个部分。实时训练的部分的一个重要方法是在线学习算法,现在常用的在线学习算法是谷歌提出的FTRL(FollowTheregularizedLeader)算法,此算法对数据复杂度要求是线性的,因此很适合大规模的在线学习,但该算法的学习率是递减的,也就是说算法运行一段时间后,会出现学习率过低从而导致模型无法很好地拟合数据的情况。为解决上述问题,现有技术提出了两种方案:一种是调整样本权重,每训练一条样本,降低样本所对应的属性取值的其他样本权重,即降低了历史数据的权重。另一种是模型的参数会在多个分片上被保存,防止数据丢失。但是,上述两种方案仍然存在大数据环境中,数据权重衰减会造成历史数据权重很低,甚至会丢弃大量历史数据,进而得到的训练模型效果较差,并且存在小流量的广告数据得不到充分训练的问题。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种训练模型生成方法、装置、设备和计算机存储介质,解决了现有生成训练模型的方法中得到的训练结果不准确的问题,实现了小流量的数据也可以得到充分的训练,保证了得 ...
【技术保护点】
1.一种训练模型生成方法,其特征在于,所述方法包括:对获取的第一待训练数据进行模型训练,得到第一模型参数;其中,所述第一待训练数据为第一训练样本的属性数据和所述第一训练样本在预设时间段内所产生的历史数据;获取第二待训练数据;其中,所述第二待训练数据为第二训练样本的属性数据和所述第二训练样本所产生的实时数据;所述第一训练样本的类型与所述第二训练样本的类型相同;对所述第二待训练数据进行模型训练,得到第二模型参数;基于所述第一模型参数和所述第二模型参数,生成目标训练模型。
【技术特征摘要】
1.一种训练模型生成方法,其特征在于,所述方法包括:对获取的第一待训练数据进行模型训练,得到第一模型参数;其中,所述第一待训练数据为第一训练样本的属性数据和所述第一训练样本在预设时间段内所产生的历史数据;获取第二待训练数据;其中,所述第二待训练数据为第二训练样本的属性数据和所述第二训练样本所产生的实时数据;所述第一训练样本的类型与所述第二训练样本的类型相同;对所述第二待训练数据进行模型训练,得到第二模型参数;基于所述第一模型参数和所述第二模型参数,生成目标训练模型。2.根据权利要求1所述的方法,其特征在于,所述对获取的第一待训练数据进行模型训练,得到第一模型参数,包括:对所述第一待训练数据进行模型训练,得到第一训练模型;获取所述第一训练模型的第一模型指标;其中,所述第一模型指标用于描述所述第一训练模型的准确性;对所述第一模型指标进行校验,若所述第一模型指标校验成功,获取所述第一训练模型的所述第一模型参数。3.根据权利要求2所述的方法,其特征在于,所述对第一模型指标进行校验,包括:将第一预设数据输入所述第一训练模型,得到所述第一模型指标;其中,所述第一预设数据是用于校验所述第一模型指标的数据;若所述第一模型指标的值大于第一预设数值,确定所述第一模型指标校验成功。4.根据权利要求1所述的方法,其特征在于,所述对所述第二待训练数据进行模型训练,得到第二模型参数,包括:获取所述第二待训练数据的统计参数的值;对所述统计参数的值进行校验,若所述统计参数的值校验成功,对所述第二待训练数据进行模型训练得到所述第二模型参数。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述统计参数的值校验失败,从预设模型参数中获取与所述第二待训练数据匹配的第三模型参数;其中,所述第三模型参数是与产生所述第二待训练数据的时间距离最近的待训练数据生成的;基于所述第三模型参数和所述第一模型参数,生成所述目标训练模型。6.根据权利要求4所述的方法,其特征在于,所述对统计参数的值进行校验,包括:确定所述统计参数的值与预设指标值之间的关系;若所述统计参数的值与所述预设指标值匹配,确定所述统计参数的值校验成功。7.根据权利要求1所述的方法,其特征在于,所述基于所述第一模型参数和所述第二模型参数,生成目标训练模型,包括:基于所述第二模型参数更新所述第一模型参数,得到更新模型参数;...
【专利技术属性】
技术研发人员:洪福兴,陈戈,黄东波,姜磊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。