数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34936787 阅读:8 留言:0更新日期:2022-09-15 07:34
本申请提供了一种数据处理方法、装置、电子设备及存储介质,涉及大数据技术领域。方法包括:基于实验地域和至少一个待选地域在第一阶段的指标数据,从至少一个待选地域中,确定出与实验地域匹配的对照地域;基于第一阶段指标数据差异和第二阶段指标数据差异,确定与目标服务策略对应的实验结果;其中,第一阶段为未投放目标服务策略的阶段;第二阶段为已向实验地域投放目标服务策略的阶段。本申请技术方案以地域为分流单元,通过预先匹配出实验地域和对照地域,并计算二者之间的天然差异和目标服务策略投放后的观测差异,得到实验地域和对照地域之间的实际差异,以验证目标服务策略是否达到预期目标,进而实现在特定群组之间开展AB实验。AB实验。AB实验。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质


[0001]本申请涉及大数据
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]AB实验通过随机分流构造出条件和特征类似的两个群组,其中一个作为实验组,另一个作为对照组,对实验组投放服务策略,经过一段时间后,对实验组和对照组之间的指标差异进行分析,从而得到投放的服务策略是否符合预期效果的实验结果。当投放的服务策略是实验组和对照组之间唯一的变量时,实验结果便能真实反映指标差异是否可以归因于所投放的服务策略。然而,在一些场景中,群组之间可能存在天然差异,导致分组很难实现随机分流,即分流出的实验组和对照组之间存在着天然差异,这种天然差异也将成为实验组和对照组之间的变量,从而导致实验结果不能够真实反映投放的服务策略的效果。

技术实现思路

[0003]本申请实施例提供一种数据处理方法、装置、电子设备及存储介质,以解决或缓解现有技术中所存在的技术问题。第一方面,本申请实施例提供了一种数据处理方法,包括:基于实验地域和至少一个待选地域在第一阶段的指标数据,从所述至少一个待选地域中,确定出与所述实验地域匹配的对照地域;其中,所述第一阶段为未投放目标服务策略的阶段;获取所述实验地域和所述对照地域在第二阶段的指标数据;其中,所述第二阶段为已向所述实验地域投放所述目标服务策略的阶段;基于第一阶段指标数据差异和第二阶段指标数据差异,确定与所述目标服务策略对应的实验结果;其中,所述第一阶段指标数据差异为所述实验地域与所述对照地域在所述第一阶段的指标数据的差异,所述第二阶段指标数据差异为所述实验地域和所述对照地域在所述第二阶段的指标数据的差异。
[0004]第二方面,本申请实施例提供了一种数据处理方法,包括:获取第一目标地域和第二目标地域在相同服务策略下的指标数据;基于获取到的指标数据,确定所述第一目标地域与所述第一目标地域之间的匹配度;在所述匹配度满足匹配阈值条件的情况下,将所述第一目标地域与所述第一目标地域作为实验

对照地域组。
[0005]第三方面,本申请实施例提供了一种数据处理装置,包括:对照地域确定模块,用于基于实验地域和至少一个待选地域在第一阶段的指标数据,从所述至少一个待选地域中,确定出与所述实验地域匹配的对照地域;其中,所述第一阶段为未投放目标服务策略的阶段;
第二阶段指标数据获取模块,用于获取所述实验地域和所述对照地域在第二阶段的指标数据;其中,所述第二阶段为已投放所述目标服务策略的阶段;实验结果确定模块,用于基于第一阶段指标数据差异和第二阶段指标数据差异,确定与所述目标服务策略对应的实验结果;其中,所述第一阶段指标数据差异为所述实验地域与所述对照地域在所述第一阶段的指标数据的差异,所述第二阶段指标数据差异为所述实验地域和所述对照地域在所述第二阶段的指标数据的差异。
[0006]第四方面,本申请实施例提供了一种数据处理装置,包括:指标数据获取模块,用于获取第一目标地域和第二目标地域在相同服务策略下的指标数据;匹配度确定模块,用于基于获取到的指标数据,确定所述第一目标地域和所述第二目标地域之间的匹配度;实验

对照地域组确定模块,用于在所述匹配度满足匹配阈值条件的情况下,将所述第一目标地域与所述第一目标地域作为实验

对照地域组。
[0007]第五方面,本申请实施例提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现本申请任一实施例提供的方法。
[0008]第六方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例提供的方法。
[0009]与现有技术相比,本申请具有如下优点:本申请的技术方案以地域为分流单元,通过在未投放目标服务策略之前预先匹配出可进行AB实验的实验地域和对照地域,并计算实验地域和对照地域之间的天然差异(第一阶段指标数据差异),在目标服务策略投放后,计算实验地域和对照地域之间所表现出来的观测差异(第二阶段指标数据差异),并以此计算出实验地域和对照地域之间的实际差异,得到目标服务策略的净升值,以验证下发的目标服务策略是否达到预期目标,进而实现以地域为最小单元,在特定群组之间开展AB实验。
[0010]上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
[0011]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
[0012]图1为本申请实施例一提供的数据处理方法的流程图;图2为本申请实施例提供的数据处理方法的系统结构示例图;图3为本申请实施例一提供的平行性检测法的流程图;图4A和图4B为本申请实施例一提供的平行性检测结果的示意图;图5为本申请实施例一提供的双重差分算法原理的示意图;图6为本申请实施例二提供的数据处理方法的流程图;图7为本申请实施例三提提供的数据处理方法的流程图;
图8为本申请实施例四提供的数据处理方法的流程图;图9为本申请实施例四提供的城市预匹配的示例图;图10为本申请实施例四提供的回归系数计算的应用示例图;图11为本申请实施例四提供的平行性检测法的应用示例图;图12为本申请实施例四提供的双重差分模型的应用示意图;图13为本申请实施例四提供的双重差分算法的应用示例图;图14为本申请实施例四提供的实验结果展示的示意图;图15为本申请实施例五提供的数据处理装置的示意图;图16为本申请实施例五提供的数据处理装置的示意图;图17为用来实现本申请实施例的电子设备的框图。
具体实施方式
[0013]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明,以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0014]在本文中使用以下术语。
[0015]AB实验:对样本进行随机分流构造出条件和特征类似的两个群组,其中一个群组作为实验组,另一个群组作为对照组,对实验组投放服务策略,经过一段时间后,对实验组和对照组之间的指标差异进行分析,从而得到投放的服务策略是否符合预期效果的实验结果。当投放的服务策略是实验组和对照组之间唯一的变量时,实验结果便能真实反映指标差异是否可以归因于所投放的服务策略。
[0016]服务策略:在某一业务领域中,可以实现某一目标的方案或方针。如向B端用户投放的营销方案、规划本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:基于实验地域和至少一个待选地域在第一阶段的指标数据,从所述至少一个待选地域中,确定出与所述实验地域匹配的对照地域;其中,所述第一阶段为未投放目标服务策略的阶段;获取所述实验地域和所述对照地域在第二阶段的指标数据;其中,所述第二阶段为已向所述实验地域投放所述目标服务策略的阶段;基于第一阶段指标数据差异和第二阶段指标数据差异,确定与所述目标服务策略对应的实验结果;其中,所述第一阶段指标数据差异为所述实验地域与所述对照地域在所述第一阶段的指标数据的差异,所述第二阶段指标数据差异为所述实验地域和所述对照地域在所述第二阶段的指标数据的差异。2.根据权利要求1所述的数据处理方法,其中,基于实验地域和至少一个待选地域在第一阶段的指标数据,从所述至少一个待选地域中,确定出与所述实验地域匹配的对照地域,包括:基于所述实验地域与所述待选地域在所述第一阶段的指标数据,确定所述实验地域与所述待选地域之间的匹配度;基于各所述待选地域与所述实验地域之间的匹配度,从各所述待选地域中确定出所述对照地域。3.根据权利要求2所述的数据处理方法,其中,基于所述实验地域与所述待选地域在所述第一阶段的指标数据,确定所述实验地域与所述待选地域之间的匹配度,包括:基于所述实验地域在所述第一阶段的指标数据,生成第一线性回归直线;基于所述待选地域在所述第一阶段的指标数据,生成第二线性回归直线;基于所述第二线性回归直线与所述第一线性回归直线之间的平行度,确定所述实验地域与所述待选地域之间的匹配度。4.根据权利要求2所述的数据处理方法,其中,基于各所述待选地域与所述实验地域之间的匹配度,从各所述待选地域中确定出所述对照地域,包括:从各所述待选地域中,筛选出匹配度满足匹配度阈值条件的多个初选地域;从各所述初选地域中,选择与所述实验地域属于同一服务管理区的初选地域作为所述对照地域。5.根据权利要求1所述的数据处理方法,所述方法还包括:基于各目标地域在所述第一阶段的指标数据,确定各所述目标地域之间的匹配度,其中,所述目标地域包括所述实验地域和所述待选地域;基于各所述目标地域之间的匹配度,从各所述目标地域中确定出多组匹配度满足匹配阈值条件的实验

对照地域组,其中,所述实验

对照地域组用于确定与所述实验地域对应的对照地域。6.根据权利要求5所述的数据处理方法,基于实验地域和至少一个待选地域在第一阶段的指标数据,从所述至少一个待选地域中,确定出与所述实验地域匹配的对照地域,包括:从多组实验

对照地域组中,确定与所述实验地域对应的对照地域。7.根据权利要求1至6任一项所述的数据处理方法,所述方法还包括:
基于各目标地域在当前周期的指标...

【专利技术属性】
技术研发人员:易伟杰马超群丁文祥
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1