样本比例不匹配的归因方法、装置、存储介质及程序产品制造方法及图纸

技术编号:39239898 阅读:23 留言:0更新日期:2023-10-30 11:52
本申请公开了一种样本比例不匹配的归因方法、装置、存储介质及程序产品,属于数据分析技术领域。包括:在线获取AB测试的实验组中的实验样本对象数量,和对照组中的对照样本对象数量;将所述实验样本对象数量和所述对照样本对象数量输入至所述AB测试平台中的样本分布检验模型中进行检验,得到样本对象统计量;将所述样本对象统计量与检验阈值进行对比,确定所述AB测试中的样本对象数量的分布比例的匹配情况;在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,对所述AB测试进行检测,输出所述样本对象数量的分布比例不匹配的原因。通过上述方法,可以快速检测到导致样本对象数量的分布比例不匹配的原因,提高了检测效率。效率。效率。

【技术实现步骤摘要】
样本比例不匹配的归因方法、装置、存储介质及程序产品


[0001]本申请实施例涉及数据分析
,特别涉及一种样本比例不匹配的归因方法、装置、存储介质及程序产品。

技术介绍

[0002]样本比例不匹配(Sample Ratio Mismatch,SRM)是指不同数据集中的样本对象数量极不均衡。例如,在AB测试中,不均衡的样本对象比例会使得用户对数据集的分析结果更加偏向于样本对象数量较多的那一侧,从而导致数据分析结果产生大的偏差。
[0003]在相关技术中,用户获取A、B两个数据集中的样本对象数量,通过人工检验A、B两个数据集中实际分布的样本对象数量比例与AB测试前在A、B两个数据集中配置的样本对象数量比例是否匹配,从而确定两个数据集中的样本对象数量是否均衡。在AB测试中的样本对象数量的分布比例不匹配的情况下,通过人工分析产生此次不匹配的原因。
[0004]但是,在数据集较大的情况下,通过人工检测SRM产生的原因,该过程较为复杂,需要排查的链路很长,涉及的环节较多,导致无法准确确定SRM产生的具体原因,进而导致AB测试的评估结果准本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本比例不匹配的归因方法,其特征在于,所述方法由AB测试平台执行,所述方法包括:在线获取AB测试的实验组中的实验样本对象数量,和对照组中的对照样本对象数量;将所述实验样本对象数量和所述对照样本对象数量输入至所述AB测试平台中的样本分布检验模型中进行检验,得到样本对象统计量;将所述样本对象统计量与检验阈值进行对比,确定所述AB测试中的样本对象数量的分布比例的匹配情况;所述样本对象数量的分布比例是指所述实验样本对象数量和所述对照样本对象数量的比例,所述匹配情况是指所述AB测试中所述样本对象数量在所述实验组、所述对照组中的实际分布比例,与所述AB测试前所述样本对象数量在所述实验组、所述对照组中的配置分布比例之间的匹配情况;在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,对所述AB测试进行检测,输出所述样本对象数量的分布比例不匹配的原因。2.根据权利要求1所述的方法,其特征在于,所述样本对象数量的分布比例不匹配的原因包括如下中的至少一种:所述样本对象分流不均匀;上报的样本对象数据发生错误;所述AB测试的交互操作发生错误。3.根据权利要求2所述的方法,其特征在于,所述AB测试平台包括分流检测网络;所述在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,对所述AB测试进行检测,输出所述样本对象数量的分布比例不匹配的原因,包括:在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,所述分流检测网络对所述AB测试中的分流因素进行检测,输出样本对象数量的分布比例不匹配的原因为:所述样本对象分流不均匀。4.根据权利要求2所述的方法,其特征在于,所述AB测试平台包括数据质量检测网络;所述在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,对所述AB测试进行检测,输出所述样本对象数量的分布比例不匹配的原因,包括:在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,所述数据质量检测网络对所述样本对象数据的数据参数进行检测,输出所述样本对象数量的分布比例不匹配的原因为:所述上报的所述样本对象数据发生错误。5.根据权利要求2所述的方法,其特征在于,所述AB测试平台包括交互操作检测网络;所述在所述AB测试中的所述样本对象数量的分布比例不匹配的情况下,对所述AB测试进行检测,输出所述样本对象数量的分布比例不匹配的原因,包括:在所述A...

【专利技术属性】
技术研发人员:王柏林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1