【技术实现步骤摘要】
对象筛选方法、装置、电子设备、存储介质及程序产品
[0001]本申请涉及机器学习
,具体而言,本申请涉及一种对象筛选方法、装置、电子设备、存储介质及程序产品。
技术介绍
[0002]子集抽样是机器学习领域重要的研究问题,并且在现实生活中有广泛的应用场景,例如商品推荐等。
[0003]现有的子集抽样方法往往和抽样顺序相关,例如在商品推荐的场景中,推荐完第一个商品后,第一个商品会影响推荐第二个商品的选择。
[0004]然而,在现实生活中,子集抽样受集合中元素排列顺序的影响,会降低抽样精度。
技术实现思路
[0005]本申请实施例的目的旨在能解决子集抽样受集合中元素排列顺序的影响,导致的抽样精度降低的问题。
[0006]根据本申请实施例的一个方面,提供了一种对象筛选,该方法包括:
[0007]获取目标对象数据集,目标对象数据集中包括多个待筛选的目标对象;
[0008]基于已构建的能量模型,确定目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基 ...
【技术保护点】
【技术特征摘要】
1.一种对象筛选方法,其特征在于,包括:获取目标对象数据集,所述目标对象数据集中包括多个待筛选的目标对象;基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,其中,针对任一数据子集,基于所述能量模型对目标对象顺序变换后的数据子集确定的概率分布信息是相同的;根据所述概率分布信息,从所述各个数据子集中确定至少一个目标数据子集,以得到对象筛选结果。2.根据权利要求1所述的对象筛选方法,其特征在于,所述任一数据子集的概率与通过以下方式得到的特征变换结果成正比:将所述任一数据子集中的各目标对象分别映射为第一维度的向量,得到所述任一数据子集的第一特征变换结果;将所述任一数据子集中的目标对象的个数作为向量的第二维度,并将所述第一特征变换结果基于所述第二维度进行融合,得到融合结果;将所述融合结果进行非线性变换,得到第二特征变换结果。3.根据权利要求1所述的对象筛选方法,其特征在于,所述基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,包括:确定所述各个数据子集分别被筛选出的概率表示;将各个所述概率表示进行指数归一化,得到所述各个数据子集被筛选出的概率分布信息。4.根据权利要求1
‑
3任一项所述的对象筛选方法,其特征在于,所述基于已构建的能量模型,确定所述目标对象数据集的各个数据子集被筛选出的概率分布信息,包括:基于优化后的变分模型来变分推断所述能量模型针对所述各个数据子集的输出结果,得到所述各个数据子集被筛选出的概率分布信息,其中,所述优化后的变分模型使得所述概率分布信息与所述输出结果之间的距离最小化。5.根据权利要求4所述的对象筛选方法,其特征在于,所述变分模型是通过以下方式进行优化的:获取与所述目标对象的类型相关的训练样本,所述训练样本包括第一集合样本和第二集合样本,所述第二集合样本是所述第一集合样本的子集;基于所述训练样本,对所述变分模型的参数进行迭代优化;其中,对于每次优化,基于所述变分模型,计算所述第一集合样本的变分参数,若基于所述变分参数和所述第二集合样本,确定满足训练结束条...
【专利技术属性】
技术研发人员:欧子菁,卞亚涛,徐挺洋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。