【技术实现步骤摘要】
模型生成方法、装置、计算机设备和存储介质
本申请涉及计算机
,尤其涉及一种模型生成方法、装置、计算机设备和存储介质。
技术介绍
在使用机器学习方法解决分类或回归问题时,会采用不同来源、不同形式的数据作为输入特征。其中比较常见的一种是统计信息特征,统计信息样本总数量、样本使用次数、样本其中任意一个类型样本的数量等,以点击率预估为例,可以把历史一段时间内某个广告的平均点击率作为一个特征。统计信息特征通常和待预测的变量有较好的线性相关性,从而在模型打分的过程中具有比较高的重要性权重。同时由于在统计特征的过程中聚合了历史信息,这类特征对于加快模型收敛也有明显的帮助。以历史平均点击率ctr为例,它的统计方法为计算在某段时间内某个广告对应的点击数click与曝光数目impression的比例如公式(1)所示:但是这个统计值在impression较小的时候,对应的值不太可信,即置信度低。例如,过去3个月中,某个广告A共获得了5次曝光,其中有2次被点击;广告B获得了5000次曝光,其中有1990次被点击。那么直 ...
【技术保护点】
1.一种模型生成方法,其特征在于,所述方法包括:/n获取原始统计数据,根据所述原始统计数据计算得到至少一个统计项特征和对应的平滑项特征;/n输入各个所述统计项特征和对应的所述平滑项特征至待训练模型,通过所述待训练模型的初始加权系数和学习规则学习所述统计项特征和所述平滑项特征,直至所述待训练模型满足预设收敛条件,得到所述统计项特征和所述平滑项特征的目标加权系数,将包含所述目标加权系数的待训练模型作为目标模型。/n
【技术特征摘要】
1.一种模型生成方法,其特征在于,所述方法包括:
获取原始统计数据,根据所述原始统计数据计算得到至少一个统计项特征和对应的平滑项特征;
输入各个所述统计项特征和对应的所述平滑项特征至待训练模型,通过所述待训练模型的初始加权系数和学习规则学习所述统计项特征和所述平滑项特征,直至所述待训练模型满足预设收敛条件,得到所述统计项特征和所述平滑项特征的目标加权系数,将包含所述目标加权系数的待训练模型作为目标模型。
2.根据权利要求1所述的方法,其特征在于,所述原始统计数据包括第一统计值、第二统计值和参考值,所述根据所述原始统计数据计算统计项特征和平滑项特征,包括:
计算所述第一统计值和所述参考值的和,得到第一值;
计算所述第二统计值和所述第一值的比值,得到所述统计项特征;
计算所述参考值和所述第一值的比值,得到所述平滑项特征。
3.根据权利要求1所述的方法,其特征在于,所述原始统计数据中还包括非统计特征;
所述输入各个所述统计项特征和对应的所述平滑项特征至待训练模型,通过所述待训练模型的初始加权系数和学习规则学习所述统计项特征和所述平滑项特征,直至所述待训练模型满足预设收敛条件,得到所述统计项特征和所述平滑项特征的目标加权系数,将包含所述目标加权系数的待训练模型作为目标模型,包括:输入所述各个所述统计项特征和对应的所述平滑项特征和各个所述非统计特征的至所述待训练模型,通过所述待训练模型的初始加权系数和学习规则学习所述统计项特征、所述平滑项特征和各个所述非统计特征,直至所述待训练模型满足预设收敛条件,得到所述统计项特征、所述平滑项特征和各个所述非统计特征的目标加权系数,将包含所述目标加权系数的待训练模型作为所述目标模型。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述目标模型为消息评价模型,所述将包含所述目标加权系数的待训练模型作为目标模型之后,所述方法还包括:
获取候选信息对应的统计数据,根据所述候选信息的统计数据计算得到至少一个待处理统计项特征和对应的待处理平滑项特征;
通过所述消息评价模型中目标加权系数对所述候选信息的待处理统计项特征和对应的待处理平滑项特征进行加权,得到所述候选信息的目标...
【专利技术属性】
技术研发人员:黄蔚,庞礴,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。