模型训练方法、人群拓展方法、介质、装置和计算设备制造方法及图纸

技术编号:37879509 阅读:14 留言:0更新日期:2023-06-15 21:07
本公开的实施方式提供了一种模型训练方法、人群拓展方法、介质、装置和计算设备,涉及计算机技术领域,该模型训练方法包括:获取媒体资源对应的种子用户,根据种子用户以及预设媒体资源特征,确定预设媒体资源特征对应的显著性指数;确定显著性指数大于或等于指数阈值的预设媒体资源特征为目标特征;基于种子用户、种子用户对应目标特征的第一目标群体指数以及目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型。本公开能够得到准确度更高的人群拓展模型,进而在将人群拓展模型用于人群拓展时,能够更加准确地获得拓展人群。群。群。

【技术实现步骤摘要】
模型训练方法、人群拓展方法、介质、装置和计算设备


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及一种模型训练方法、人群拓展方法、介质、装置和计算设备。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]人群拓展常用于广告等媒体资源的投放或者商家的营销活动,例如,在进行广告投放时,基于广告主提供的种子人群进行人群拓展,能够有效提升广告的点击转化率或者购买转化率。
[0004]目前,通常基于有监督的学习算法进行人群拓展。具体地,以指定样本(即种子人群)作为正样本,在其余样本中随机抽取样本作为负样本,来训练分类模型,然后通过训练好的分类模型对候选人群进行筛选,以得到拓展人群。但通过上述方式不能够准确地获得拓展人群。

技术实现思路

[0005]本公开提供一种模型训练方法、人群拓展方法、介质、装置和计算设备,以解决通过目前方式不能够准确地获得拓展人群的问题。
[0006]在本公开实施方式的第一方面中,提供了一种模型训练方法,包括:
[0007]获取媒体资源对应的种子用户;
[0008]根据种子用户以及预设媒体资源特征,确定预设媒体资源特征对应的显著性指数;
[0009]确定显著性指数大于或等于指数阈值的预设媒体资源特征为目标特征;
[0010]基于种子用户、种子用户对应目标特征的第一目标群体指数以及目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型,人群拓展模型用于基于种子用户进行人群拓展。
[0011]第二方面,本公开实施例提供一种人群拓展方法,包括:
[0012]获取媒体资源对应的候选用户;
[0013]根据候选用户以及人群拓展模型对应的种子用户和目标特征,确定候选用户对应目标特征的目标群体指数,人群拓展模型为采用如本公开第一方面所述的模型训练方法训练得到的;
[0014]将候选用户和候选用户对应目标特征的目标群体指数输入人群拓展模型,得到候选用户对应的预测概率值,预测概率值用于确定候选用户是否为可拓展用户。
[0015]第三方面,本公开实施例提供一种模型训练装置,包括:
[0016]获取模块,用于获取媒体资源对应的种子用户;
[0017]第一确定模块,用于根据种子用户以及预设媒体资源特征,确定预设媒体资源特
征对应的显著性指数;
[0018]第二确定模块,用于确定显著性指数大于或等于指数阈值的预设媒体资源特征为目标特征;
[0019]训练模块,用于基于种子用户、种子用户对应目标特征的第一目标群体指数以及目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型,人群拓展模型用于基于种子用户进行人群拓展。
[0020]第四方面,本公开实施例提供一种人群拓展装置,包括:
[0021]获取模块,用于获取媒体资源对应的候选用户;
[0022]确定模块,用于根据候选用户以及人群拓展模型对应的种子用户和目标特征,确定候选用户对应目标特征的目标群体指数,人群拓展模型为采用如本公开第一方面所述的模型训练方法训练得到的;
[0023]处理模块,用于将候选用户和候选用户对应目标特征的目标群体指数输入人群拓展模型,得到候选用户对应的预测概率值。
[0024]第五方面,本公开实施例提供一种计算设备,包括:处理器,以及与处理器通信连接的存储器;
[0025]存储器存储计算机执行指令;
[0026]处理器执行存储器存储的计算机执行指令,以实现如本公开第一方面所述的模型训练方法或第二方面所述的人群拓展方法。
[0027]第六方面,本公开实施例提供一种存储介质,存储介质中存储有计算机程序指令,计算机程序指令被执行时,实现如本公开第一方面所述的模型训练方法或第二方面所述的人群拓展方法。
[0028]第七方面,本公开实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如本公开第一方面所述的模型训练方法或第二方面所述的人群拓展方法。
[0029]本公开实施例提供的模型训练方法、人群拓展方法、介质、装置和计算设备,通过获取媒体资源对应的种子用户,根据种子用户以及预设媒体资源特征,确定预设媒体资源特征对应的显著性指数;确定显著性指数大于或等于指数阈值的预设媒体资源特征为目标特征;基于种子用户、种子用户对应目标特征的第一目标群体指数以及目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型。由于本公开根据种子用户以及预设媒体资源特征确定的预设媒体资源特征对应的显著性指数,来确定目标特征,能够更加准确地获得目标特征,进而基于目标特征、种子用户以及种子用户对应目标特征的第一目标群体指数来训练,获得训练好的人群拓展模型,能够得到准确度更高的人群拓展模型,进而在将人群拓展模型用于人群拓展时,能够更加准确地获得拓展人群。
附图说明
[0030]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
[0031]图1为本公开实施例提供的一种应用场景示意图;
[0032]图2为本公开一实施例提供的模型训练方法的流程图;
[0033]图3为本公开另一实施例提供的模型训练方法的流程图;
[0034]图4为本公开一实施例提供的对人群拓展模型进行迭代训练的示意图;
[0035]图5为本公开一实施例提供的人群拓展方法的流程图;
[0036]图6为本公开一实施例提供的模型训练装置的结构示意图;
[0037]图7为本公开一实施例提供的人群拓展装置的结构示意图;
[0038]图8为本公开一实施例提供的存储介质示意图;
[0039]图9为本公开一实施例提供的计算设备的结构示意图。
[0040]在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
[0041]下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0042]本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[0043]根据本公开的实施方式,提出了一种模型训练方法、人群拓展方法、介质、装置和计算设备。
[0044]在本文中,需要理解的是,所涉及的术语:
[0045]目标群体指数(Target Group Index,TGI)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:获取媒体资源对应的种子用户;根据所述种子用户以及预设媒体资源特征,确定所述预设媒体资源特征对应的显著性指数;确定所述显著性指数大于或等于指数阈值的预设媒体资源特征为目标特征;基于所述种子用户、所述种子用户对应所述目标特征的第一目标群体指数以及所述目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型,所述人群拓展模型用于基于所述种子用户进行人群拓展。2.根据权利要求1所述的模型训练方法,所述根据所述种子用户以及预设媒体资源特征,确定所述预设媒体资源特征对应的显著性指数,包括:获取预设时间范围内的全量用户;基于预设分箱规则,确定所述全量用户对应所述预设媒体资源特征的每个分箱的第一用户占比以及所述种子用户对应所述预设媒体资源特征的每个分箱的第二用户占比;根据所述第一用户占比和所述第二用户占比,确定所述预设媒体资源特征的每个分箱对应的第二目标群体指数,以及所述种子用户对应所述预设媒体资源特征的第一目标群体指数;确定所述预设媒体资源特征下大于目标群体指数均值的第二目标群体指数对应的第二用户占比的汇总值,所述目标群体指数均值是根据所述第二目标群体指数获得的;根据所述汇总值和所述预设媒体资源特征的每个分箱对应的第二目标群体指数,确定所述预设媒体资源特征对应的显著性指数。3.根据权利要求2所述的模型训练方法,所述根据所述汇总值和所述预设媒体资源特征的每个分箱对应的第二目标群体指数,确定所述预设媒体资源特征对应的显著性指数,包括:根据所述预设媒体资源特征下第二目标群体指数的均值以及所述第二目标群体指数,确定所述预设媒体资源特征下的第二目标群体指数的标准差;确定所述预设媒体资源特征对应的显著性指数为所述汇总值和所述标准差的乘积。4.根据权利要求2所述的模型训练方法,所述目标群体指数均值是根据以下至少一种方式获得的:确定所述目标群体指数均值为所述第二目标群体指数的平均值;对所述第二目标群体指数和所述第二目标群体指数对应的第二用户占比进行加权处理,得到所述目标群体指数均值;对所述第二目标群体指数进行排序,确定排序后的第二目标群体指数中的中位数为所述目标群体指数均值;对所述第二目标群体指数对应的全量用户的数量进行排序,确定最大数量对应的第二目标群体指数为所述目标群体指数均值。5.根据权利要求1至4中任一项所述的模型训练方法,所述基于所述种子用户、所述种子用户对应所述目标特征的第一目标群体指数以及所述目标特征,对人群拓展模型进行迭代训练,获得训练好的人群拓展模型,包括:按照显著性指数由高到低的顺序遍历所述目标特征,对遍历到的目标特征,...

【专利技术属性】
技术研发人员:肖美丽李锦添齐妙王佳捷李勇
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1