【技术实现步骤摘要】
一种聚类采样方法、设备、介质及程序产品
[0001]本申请涉及通信领域,尤其涉及一种聚类采样技术。
技术介绍
[0002]AB测试是评估因果效果效应的黄金准则,但在某些场景下无法开展AB测试或者成本过高。例如,针对服务推广效果评估场景,统计发现,参与过服务的用户比未参与的用户后续打开频次和收入更高,但参与服务的用户本身质量更高,推广前各项指标表现就更好,因此,存在非AB测试下如何进行因果推断的问题。还例如,新产品用户长期生命周期价值预估:由于创新产品上线周期较短无法直接统计用户长期价值,因此有时候会现有历史数据拟合函数,然后预测新产品用户生命周期价值,但现有产品的特征属性与新产品可能有较大的不同,因此会出现比较大的偏差。
技术实现思路
[0003]本申请的一个目的是提供一种聚类采样方法、设备、介质及程序产品。
[0004]根据本申请的一个方面,提供了一种聚类采样方法,其中,该方法包括:
[0005]获取基于原始数据特征分类得到的第一数据组及第二数据组,其中,所述第一数据组包括满足原始数据特征的特征条件的数据,所述第二数据组包括未满足原始数据特征的特征条件的数据;
[0006]获取至少一个目标数据特征在所述第一数据组中的第一目标特征分布信息,及所述至少一个目标数据特征在所述第二数据组中的第二目标特征分布信息,其中,所述至少一个目标数据特征不包含所述原始数据特征;
[0007]根据所述第一数据组及所述第二数据组之一,以及所述第一目标特征分布信息、所述第二目标特征信息及确定对 ...
【技术保护点】
【技术特征摘要】
1.一种聚类采样方法,其中,该方法包括:获取基于原始数据特征分类得到的第一数据组及第二数据组,其中,所述第一数据组包括满足原始数据特征的特征条件的数据,所述第二数据组包括未满足原始数据特征的特征条件的数据;获取至少一个目标数据特征在所述第一数据组中的第一目标特征分布信息,及所述至少一个目标数据特征在所述第二数据组中的第二目标特征分布信息,其中,所述至少一个目标数据特征不包含所述原始数据特征;根据所述第一数据组及所述第二数据组之一,以及所述第一目标特征分布信息、所述第二目标特征信息及确定对应的第三数据组,其中,所述第三数据组包括关于原始数据特征的反事实假设条件对应的数据。2.根据权利要求1所述的方法,其中,所述至少一个目标数据特征包括一个目标数据特征;其中,所述获取至少一个目标数据特征在所述第一数据组中的第一目标特征分布信息,及所述至少一个目标数据特征在所述第二数据组中的第二目标特征分布信息,包括:根据所述目标数据特征确定所述第一数据组中满足所述目标数据特征的第一目标数据数量,根据所述第一目标数据数量及所述第一数据组的总数据数量确定所述第一数据组中的第一目标特征分布信息;根据所述目标数据特征确定所述第二数据组中满足所述目标数据特征的第二目标数据数量,根据所述第二目标数据数量及所述第一数据组的总数据数量确定所述第一数据组中的第二目标特征分布信息。3.根据权利要求2所述的方法,其中,所述至少一个目标数据特征包括多个目标数据特征;其中,所述获取至少一个目标数据特征在所述第一数据组中的第一目标特征分布信息,及所述至少一个目标数据特征在所述第二数据组中的第二目标特征分布信息,包括:根据所述多个目标数据特征确定每个目标数据特征在所述第一数据组中的第一单元目标特征分布信息,以获取所述多个目标数据特征信息的多个第一单元目标特征分布信息,并根据所述多个第一单元目标特征分布信息确定所述第一数据组中的第一目标特征分布信息;根据所述多个目标数据特征确定每个目标数据特征在所述第二数据组中的第二单元目标特征分布信息,以获取所述多个目标数据特征信息的多个第二单元目标特征分布信息,并根据所述多个第二单元目标特征分布信息确定所述第二数据组中的第二目标特征分布信息。4.根据权利要求3所述的方法,其中,所述根据所述多个目标数据特征确定每个目标数据特征在所述第一数据组中的第一单元目标特征分布信息,包括:从所述多个目标数据特征中依次取一个待确定目标数据特征,根据所述待确认目标数据特征确定所述第一数据组中满足所述待确定目标数据特征的第一目标数据数量,根据所述第一目标数据数量及所述第一数据组的总数据数量确定所述第一数据组中的第一单元目标特征分布信息;其中,所述根据所述多个目标数据特征确定每个目标数据特征在所述第二数据组中的第二单元目标特征分布信息,包括:从所述多个目标数据特征中依次取一个待确定目标数据特征,根据所述待确认目标数
据特征确定所述第二数据组中满足所述待确定目标数据特征的第二目标数据数量,根据所述第二目标数据数量及所述第二数据组的总数据数量确定所述第二数据组中的第二单元目标特征分布信息。5.根据权利要求3或4所述的方法,其中,所述根据所述多个第一单元目标特征分布信息确定所述第一数据组中的第一目标特征分布信息,包括:将所述多个目标数据...
【专利技术属性】
技术研发人员:刘明,
申请(专利权)人:上海连尚网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。