数据处理方法、介质、装置及计算设备制造方法及图纸

技术编号:37818285 阅读:13 留言:0更新日期:2023-06-09 09:50
本公开的实施方式提供了一种数据处理方法、介质、装置及计算设备,通过确定使用目标应用程序的对照组用户和实验组用户分别在实验开始前的第一指标数据以及实验后的第二指标数据;实验开始后,目标应用程序向实验组用户提供预设功能;针对实验后的任一天,根据两组用户分别对应的第二指标数据确定第一差异,根据两组用户分别对应的第一指标数据对第一差异进行修正,得到第二差异;根据第二差异确定实验后任一天对应的假设检验判断指标,从而输出是否应用预设功能的指示信息,通过对实验后的第一差异进行修正,实现方差缩减,提高实验检测的灵敏度,且可以更加高效准确的确定是否上线预设功能,使得预设功能的上线符合客户的需求,提升用户体验。提升用户体验。提升用户体验。

【技术实现步骤摘要】
数据处理方法、介质、装置及计算设备


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及数据处理方法、介质、装置及计算设备。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]AB实验本质上为对照实验,在互联网应用场景中特指在线对照实验,例如将某一目标应用程序的线上用户中的一部分用户随机均匀的划分不同的组,为实验组用户对应的应用程序提供预设功能,记录用户行为形成实验数据,最后通过统计的手段评估实验效果,即通过对比某一指标数据来判断实验效果是否显著,从而确定是否将该预设功能应用到该目标应用程序上。
[0004]在判定实验效果是否显著时,通常做法是根据AB实验后的样本指标进行双样本假设检验,具体的,将线上的用户随机均匀的分为实验组和对照组,在向实验组用户对应的目标应用程序提供预设功能后,分别统计每天实验组和对照组的样本指标,基于两组样本的均值、方差以及样本量计算出p值,基于p值来判定实验效果是否显著。
[0005]上述方法中,由于线上分流的随机性和用户特征的多样性,样本指标数据不可避免的具有较大的方差,根据检验统计量的计算方式可知,当分母较大时,也就是实验后实验组和对照组的样本均值的差的方差越大时,检验统计量的值往往较小,p值往往较大,此时很难说明实验效果显著,即检测的灵敏度较低。

技术实现思路

[0006]本公开提供一种数据处理方法、介质、装置及计算设备,以修正实验后实验组和对照组的样本均值差,从而降低修正后的样本均值差对应的方差,提高对实验检测的灵敏度。
[0007]在本公开实施方式的第一方面中,提供了一种数据处理方法,所述方法包括:
[0008]确定使用目标应用程序的对照组用户和实验组用户,分别获取两组用户在实验开始前N天中每天的第一指标数据以及实验后M天中每天的第二指标数据;其中,实验开始后,所述目标应用程序向实验组用户提供预设功能;
[0009]针对实验后的任一天,根据两组用户分别对应的第二指标数据确定第一差异,根据两组用户分别对应的第一指标数据对所述第一差异进行修正,得到第二差异;
[0010]根据所述第二差异确定实验后任一天对应的假设检验判断指标,根据实验后M天的假设检验判断指标输出是否在所述目标应用程序上应用所述预设功能的指示信息。
[0011]在本公开实施方式的第二方面,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如第一方面提供的方法。
[0012]在本公开实施方式的第三方面,提供了一种数据处理装置,所述装置包括:
[0013]用户确定模块,用于确定使用目标应用程序的对照组用户和实验组用户,分别获取两组用户在实验开始前N天中每天的第一指标数据以及实验后M天中每天的第二指标数据;其中,实验开始后,所述目标应用程序向实验组用户提供预设功能;
[0014]修正模块,针对实验后的任一天,用于根据两组用户分别对应的第二指标数据确定第一差异,根据两组用户分别对应的第一指标数据对所述第一差异进行修正,得到第二差异;
[0015]输出模块,用于根据所述第二差异确定实验后任一天对应的假设检验判断指标,根据实验后M天的假设检验判断指标输出是否在所述目标应用程序上应用所述预设功能的指示信息。
[0016]在本公开实施方式的第四方面,提供了一种计算设备,包括:至少一个处理器和存储器;存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面提供的方法。
[0017]在本公开实施方式中,通过确定使用目标应用程序的对照组用户和实验组用户分别在实验开始前的第一指标数据以及实验后的第二指标数据;实验开始后,目标应用程序向实验组用户提供预设功能;针对实验后的任一天,根据两组用户分别对应的第二指标数据确定第一差异,根据两组用户分别对应的第一指标数据对第一差异进行修正,得到第二差异;根据第二差异确定实验后任一天对应的假设检验判断指标,根据假设检验判断指标输出是否在目标应用程序上应用预设功能的指示信息,通过采用实验前的第一指标数据对实验后的第一差异进行修正,实现第二差异的方差相比于第一差异的方差缩减,以提高实验检测的灵敏度,此外,该方法还可以更加高效准确的确定是否向目标应用程序提供预设功能,使得最终预设功能的上线可以符合客户的需求,提升用户的体验。
附图说明
[0018]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
[0019]图1示意性地示出了根据本公开实施方式提供的应用场景示意图;
[0020]图2示意性地示出了根据本公开一实施例提供的一种数据处理方法的流程示意图;
[0021]图3示意性地示出了根据本公开一实施例提供的另一种数据处理方法的流程示意图;
[0022]图4示意性地示出了根据本公开一实施例提供的一种用户回溯数据展示及计算统计量的示意图;
[0023]图5示意性地示出了根据本公开一实施例提供的一种在线实验验证曲线图;
[0024]图6示意性地示出了根据本公开一实施例提供的计算机可读存储介质的结构示意图;
[0025]图7示意性地示出了根据本公开一实施例提供的数据处理装置的结构示意图;
[0026]图8示意性地示出了根据本公开一实施例提供的计算设备的结构示意图。
[0027]在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
[0028]下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0029]本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[0030]根据本公开的实施方式,提出了一种数据处理方法、介质、装置及计算设备。
[0031]在本文中,需要理解的是,所涉及的术语仅用于方便理解,并未表示对含义的限制。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
[0032]另外,本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据,对数据的采集、传播、使用等,均符合国家相关法律法规要求,本公开实施方式/实施例可以互相组合。
[0033]下面是本公开中涉及的术语说明:
[0034]指标数据:可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:确定使用目标应用程序的对照组用户和实验组用户,分别获取两组用户在实验开始前N天中每天的第一指标数据以及实验后M天中每天的第二指标数据;其中,实验开始后,所述目标应用程序向实验组用户提供预设功能;针对实验后的任一天,根据两组用户分别对应的第二指标数据确定第一差异,根据两组用户分别对应的第一指标数据对所述第一差异进行修正,得到第二差异;根据所述第二差异确定实验后任一天对应的假设检验判断指标,根据实验后M天的假设检验判断指标输出是否在所述目标应用程序上应用所述预设功能的指示信息。2.根据权利要求1所述的方法,其特征在于,根据两组用户分别对应的第一指标数据对所述第一差异进行修正,得到第二差异,包括:针对实验组和对照组中任一用户,根据所述用户对应的N个第一指标数据确定第一平均值;针对所述实验组和对照组,分别根据每一用户对应的所述第一平均值确定第二平均值;计算所述实验组对应的第二平均值和所述对照组对应的第二平均值的差值,根据所述差值对所述第一差异进行修正,得到第二差异。3.根据权利要求2所述的方法,其特征在于,根据所述差值对所述第一差异进行修正,得到第二差异,包括:确定修正系数与所述差值的乘积,将所述第一差异与所述乘积的差值确定为所述第二差异的表达式;所述第一差异为两组用户分别对应的第二指标数据的第三平均值的差值。4.根据权利要求3所述的方法,其特征在于,根据所述第二差异确定实验后任一天对应的假设检验判断指标,包括:根据所述第二差异的表达式确定所述第二差异的方差对应的表达式;当所述第二差异的方差最小时,确定实验后任一天对应的修正系数的取值;根据所述修正系数的取值确定实验后任一天对应的假设检验判断指标。5.根据权利要求4所述的方法,其特征在于,确定实验后任一天对应的修正系数的取值,包括:分别根据所述实验组和对照组中各个用户对应的第二指标数据和所述第一平均值确定实验后任一天对应的协方差,确定所述实验组和对照组分别对应的用户数量,以及,根据所述实验组和对照组各个用户分别对应的第一平均值确定第一方差;所述协方差表示实验前第一指标数据的平均值与所述用户实验后第二指...

【专利技术属性】
技术研发人员:郭先文卜天宇李方健吴官林
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1