目标对象的确定方法、装置、介质及电子设备制造方法及图纸

技术编号:35088022 阅读:16 留言:0更新日期:2022-10-01 16:42
本公开提供一种目标对象的确定方法、装置、介质及电子设备,涉及数据处理技术领域。该方法包括:确定在进行迭代计算之前第i实验组与对照组之间关于目标指标的差值的数据分布,得到先验分布;根据总样本量、在k次迭代过程中关于第i实验组的样本量和关于对照组的样本量,计算第i实验组与对照组之间关于目标指标的差值的第i数据分布,k为正整数;根据先验分布和第i数据分布,确定第i实验组与对照组之间关于目标指标的差值的第i后验分布;根据N个实验组分别对应的后验分布更新N个实验组各自的流量,并根据N个实验组更新后的流量确定目标对象。本方案无需大量的数据支持,同时能够有效提升目标对象的确定准确度。效提升目标对象的确定准确度。效提升目标对象的确定准确度。

【技术实现步骤摘要】
目标对象的确定方法、装置、介质及电子设备


[0001]本公开涉及数据处理
,具体而言,涉及一种目标对象的确定方法、目标对象的确定装置,以及实现上述方法的计算机可读存储介质和电子设备。

技术介绍

[0002]日常工作或者生活中,经常会遇到需要在众多对象中确定出一个或多个对象的情景。例如,在众多视频中选择待观看的视频,在众多首歌曲中确定出待听的歌曲,或者在浏览购物网站时从众多商品中筛选出待点击以浏览详情的商品等等。
[0003]相关技术提供的确定目标对象的方案一般是采用机器学习技术的方式实现。然而,为了提升对目标对象的预测准确度,需要海量的样本来训练机器学习模型,因而相关技术提供的方案需要大量的数据支持以及较多的算力资源。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种目标对象的确定方法、目标对象的确定装置、电子设备以及计算机可读存储介质,无需大量的数据支持且在一定程度上节省算力资源。
[0006]根据本公开的一个方面,提供一种目标对象的确定方法,该方法包括:确定在进行迭代计算之前第i实验组与对照组之间关于目标指标的差值的数据分布,得到先验分布;根据总样本量、在k次迭代过程中关于上述第i实验组的样本量和关于上述对照组的样本量,计算上述第i实验组与上述对照组之间关于上述目标指标的差值的第i数据分布,k为正整数;根据上述先验分布和上述第i数据分布,确定上述第i实验组与上述对照组之间关于上述目标指标的差值的第i后验分布;根据N个实验组分别对应的后验分布更新上述N个实验组各自的流量,并根据上述N个实验组更新后的流量确定目标对象,N为正整数,i为不大于N的正整数。
[0007]根据本公开的一个方面,提供一种目标对象的确定装置,所述装置包括:先验分布确定模块、计算模块、后验分布确定模块以及目标对象确定模块。
[0008]其中,上述先验分布确定模块,被配置为:确定在进行迭代计算之前第i实验组与对照组之间关于目标指标的差值的数据分布,得到先验分布;上述计算模块,被配置为:根据总样本量、在k次迭代过程中关于上述第i实验组的样本量和关于上述对照组的样本量,计算上述第i实验组与上述对照组之间关于上述目标指标的差值的第i数据分布,k为正整数;上述后验分布确定模块,被配置为:根据上述先验分布和上述第i数据分布,确定上述第i实验组与上述对照组之间关于上述目标指标的差值的第i后验分布;以及,上述目标对象确定模块,被配置为:根据N个实验组分别对应的后验分布更新上述N个实验组各自的流量,并根据上述N个实验组更新后的流量确定目标对象,N为正整数,i为不大于N的正整数。
[0009]在示例性的实施例中,基于前述方案,上述计算模块被具体配置为:确定在第j次
迭代时上述第i实验组的第一样本量、第一样本均值以及第一方差估计值,j为不大于k的正整数;确定在第j次迭代时上述对照组的第二样本量、第二样本均值以及第二方差估计值;根据上述总样本量、上述第一样本量、上述第二样本量、上述第一样本均值以及上述第二样本均值,确定关于上述第i数据分布的均值;根据上述总样本量、上述第一样本量、上述第二样本量、上述第一方差估计值以及上述第二方差估计值,确定关于上述第i数据分布的方差。
[0010]在示例性的实施例中,基于前述方案,上述后验分布确定模块被具体配置为:根据上述先验分布的方差和上述第i数据分布的方差,确定上述第i后验分布的方差;以及,根据上述先验分布的均值、上述先验分布的方差、上述第i数据分布的均值以及上述第i数据分布的方差,确定上述第i后验分布的均值。
[0011]在示例性的实施例中,基于前述方案,上述先验分布为正态分布,上述第i数据分布为正态分布,以及上述后验分布为正态分布。
[0012]在示例性的实施例中,基于前述方案,上述目标对象确定模块包括流量更新子模块。
[0013]其中,上述流量更新子模块被配置为:通过对第k次迭代时所述第i实验组的样本进行采样;获取满足所述后验分布的目标采样点;根据所述目标采样点与总采样点的比例,确定所述第i实验组更新后的流量与总流量的比例,得到对N个实验组各自的流量。
[0014]在示例性的实施例中,基于前述方案,上述目标对象确定模块还包括目标确定子模块。
[0015]其中,上述目标确定子模块被配置为:获取每个实验组更新后的流量与总流量的比例,在确定存在流量比例大于第一预设值的实验组的情况下,将流量较多的M个实验组作为所述目标对象,M为小于N的正整数;或,计算上述N个实验组的剩余价值,在确定存在剩余价值小于第二预设值的实验组的情况下,将流量较多的M个实验组作为所述目标对象。
[0016]在示例性的实施例中,基于前述方案,上述装置还包括:运行时长确定模块。
[0017]其中,上述运行时长确定模块被配置为:获取迭代运行时长;在确定迭代运行时长不高于第三预设值的情况下,计算所述第i实验组与所述对照组之间关于所述目标指标的差值的第i数据分布。
[0018]在示例性的实施例中,基于前述方案,上述装置还包括:防控指标模块。
[0019]其中,上述防控指标模块被配置为:在确定迭代运行时长高于所述第三预设值的情况下,确定所述第i实验组与所述对照组之间关于所述目标指标的差值不低于第四预设值。
[0020]在示例性的实施例中,基于前述方案,上述装置还包括:流量分配模块。
[0021]其中,上述流量分配模块被配置为:在确定关于上述第i实验组与上述对照组之间关于上述目标指标的差值低于上述第四预设值的情况下,将上述第i实验组对应的流量分配至其他实验组。
[0022]在示例性的实施例中,基于前述方案,上述流量分配确定模块被具体配置为:根据上述其他实验组的数据,将上述第i实验组对应的流量平均分配至上述其他实验组中的每个实验组。
[0023]在示例性的实施例中,基于前述方案,上述目标指标为视频点击率、视频收藏量、
视频转发量或播放时长与视频总时长的占比,上述对照组和上述N个实验组为不同的视频,上述流量为点击观看视频的用户数,上述样本为点击观看视频的用户,其中,上述目标对象确定模块,被具体配置为:根据点击观看视频的用户数,在多个视频中确定出一个或多个目标视频。
[0024]在示例性的实施例中,基于前述方案,上述目标指标为商品点击率、商品收藏量或商品转发量,上述对照组和上述N个实验组为不同的商品,上述流量为点击浏览商品的用户数,上述样本为点击浏览商品的用户,其中,上述目标对象确定模块,还被具体配置为:根据点击浏览商品的用户数,在多个商品中确定出一个或多个目标商品,以供用户点击查看目标商品的详情。
[0025]根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任意实施例所述的目标对象的确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象的确定方法,其特征在于,所述方法包括:确定在进行迭代计算之前第i实验组与对照组之间关于目标指标的差值的数据分布,得到先验分布;根据总样本量、在k次迭代过程中关于所述第i实验组的样本量和关于所述对照组的样本量,计算所述第i实验组与所述对照组之间关于所述目标指标的差值的第i数据分布,k为正整数;根据所述先验分布和所述第i数据分布,确定所述第i实验组与所述对照组之间关于所述目标指标的差值的第i后验分布;根据N个实验组分别对应的后验分布更新所述N个实验组各自的流量,并根据所述N个实验组更新后的流量确定目标对象,N为正整数,i为不大于N的正整数。2.根据权利要求1所述的方法,其特征在于,根据总样本量、在k次迭代过程中关于所述第i实验组的样本量和关于所述对照组的样本量,计算所述第i实验组与所述对照组之间关于所述目标指标的差值的第i数据分布,包括:确定在第j次迭代时所述第i实验组的第一样本量、第一样本均值以及第一方差估计值,j为不大于k的正整数;确定在第j次迭代时所述对照组的第二样本量、第二样本均值以及第二方差估计值;根据所述总样本量、所述第一样本量、所述第二样本量、所述第一样本均值以及所述第二样本均值,确定关于所述第i数据分布的均值;根据所述总样本量、所述第一样本量、所述第二样本量、所述第一方差估计值以及所述第二方差估计值,确定关于所述第i数据分布的方差。3.根据权利要求1所述的方法,其特征在于,根据所述先验分布和所述第i数据分布,确定所述第i实验组与所述对照组之间关于所述目标指标的差值的第i后验分布,包括:根据所述先验分布的方差和所述第i数据分布的方差,确定所述第i后验分布的方差;根据所述先验分布的均值、所述先验分布的方差、所述第i数据分布的均值以及所述第i数据分布的方差,确定所述第i后验分布的均值。4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述先验分布为正态分布,所述第i数据分布为正态分布以及所述后验分布为正态分布。5.根据权利要求1至3中任意一项所述的方法,其特征在于,根据N个实验组分别对应的后验分布更新所述N个实验组各自的流量,包括:通过对第k次迭代时所述第i实验组的样本进行采样;获取满足所述后验分布的目标采样点;根据所述目标采样点与总采样点的比例,确定所述第i实验组更新后的流量与总流量的比例,得到对N个实验组各自的流量。6.根据权利要求1至3中任意一项所述的方法,其特征在于,根据所述N个实验组更新后的流量确定目标对象,包括:获取每个实验组更新后的流量与总流量的比例,在确定存在流量比例大于第一预设值的实验组的情况下,将流量较多的M个实验组作为所述目标对象,M为小于N的正整数;或,计算所述N个实验组的剩余价值,在确定存在剩余价值小于第二预设值的实验组的情况下,将流量较多的M个实验组作为所述目标对象。
7.根据权利要求1至3中任意一项所述的方法,其特征在于,计算所述第i实验组与所述对照组之间关于所述目...

【专利技术属性】
技术研发人员:赵朋磊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1