数据干扰消除方法及相关装置制造方法及图纸

技术编号:30967067 阅读:13 留言:0更新日期:2021-11-25 20:39
本发明专利技术的实施例提供了一种数据干扰消除方法及相关装置,通过分别获得第一采集指标差异信息与第二采集指标差异信息,由于第一采集指标差异信息表征在未配置测试策略时,第一用户数据集合与第二用户数据集合的差异信息,而第二采集指标差异信息表征在已配置测试策略时,第一用户数据集合与第二用户数据集合的差异信息。进而通过计算第二采集指标差异信息与第一采集指标差异信息的差值信息,从而使得差值信息消除了在未配置测试策略时,由于无法保证第一用户采集指标与第二用户采集指标存在的非同质数据差异,而产生的数据干扰,从而利用该差值信息作为测试衡量参数,提高数据分析的准确度。的准确度。的准确度。

【技术实现步骤摘要】
数据干扰消除方法及相关装置


[0001]本专利技术涉及数据分析领域,具体而言,涉及一种数据干扰消除方法及相关装置。

技术介绍

[0002]针对互联网相关的软件产品,为了能够更加准确的对产品功能的使用情况、用户行为进行分析,以便对产品进行优化。通常需要对产品运行中的数据进行统计分析。
[0003]现有技术中,为了实现对于数据的分析,往往通过设置不同实验数据组别进行数据采集与分析。通常基于不同组别进行数据分析时,通常基于不同的测试阶段以不同的实验策略进行数据的采集。例如,在某一阶段,不对不同组别的终端下发测试策略,此阶段的目的在于需要在不同组别的终端在尽可能同质的前提下,采集各个终端的数据;进而在另一个阶段,对不同组别的终端下发测试策略,此时则需要根据测试策略对某一组的终端引入需要察的变量,进而在不同组别的终端不同质的前提下,采集各个终端的数据。最终,以同质阶段的数据作为标准,分析不同质阶段的数据的结果,获得测试的分析结论。
[0004]但是,在上述基于不同数据组别的分析中,在同质阶段,往往并不能够真正地消除不同组别之间的数据差异。从而导致后续的数据分析过程中也带入了同质阶段的数据差异,进而降低了分析结果的准确性。

技术实现思路

[0005]本专利技术的目的在于,针对上述现有技术中的不足,提供了一种数据干扰消除方法及相关装置,通过消除已配置测试策略时对照组和实验组的差异,保证测试实验最终结果的准确性。
[0006]本专利技术的实施例可以这样实现:
[0007]第一方面,本专利技术实施例提供了一种数据干扰消除方法,方法包括:分别获得第一采集指标差异信息与第二采集指标差异信息;其中,第一采集指标差异信息表征在未配置测试策略时,第一用户数据集合包含的第一用户采集指标与第二用户数据集合包含的第二用户采集指标的差异信息;第二采集指标差异信息表征在已配置测试策略时,第一用户数据集合包含的第三用户采集指标与第二用户数据集合包含的第四用户采集指标的差异信息;计算第二采集指标差异信息与第一采集指标差异信息的差值信息;将差值信息作为测试衡量参数。
[0008]可选地,所述第一用户采集指标为第一历史时段内的第一用户采集指标,所述第二用户采集指标为第一历史时段内的第二用户采集指标;所述第三用户采集指标为第二历史时段内的第三用户采集指标,所述第四用户采集指标为第二历史时段内的第四用户采集指标;
[0009]则所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤,包括:
[0010]根据所述第一用户采集指标,获得所述第一历史时段内的第一用户采集均值;
[0011]根据所述第二用户采集指标,获得所述第一历史时段内的第二用户采集均值;
[0012]将所述第一用户采集均值与所述第二用户采集均值的差值作为所述第一采集指标差异信息;
[0013]根据所述第三用户采集指标,获得所述第二历史时段内的第三用户采集均值;
[0014]根据所述第四用户采集指标,获得所述第二历史时段内的第四用户采集均值;
[0015]将所述第三用户采集均值与所述第四用户采集均值的差值作为所述第二采集指标差异信息。
[0016]可选地,在所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤之前,还包括:
[0017]通过预测模型,分别获得所述第一用户采集指标对应的第一用户预测指标以及所述第二用户采集指标对应的第二用户预测指标;
[0018]确定所述第一用户预测指标与所述第一用户采集指标,以及所述第二用户预测指标与所述第二用户采集指标,是否均满足稳定条件;
[0019]若是,则执行所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤;
[0020]若否,则更新所述预测模型的参数,直至通过更新后的预测模型获得的第一用户预测指标与所述第一用户采集指标,以及获得的第二用户预测指标与所述第二用户采集指标均满足稳定条件。
[0021]第二方面,本专利技术实施例提供一种数据干扰消除装置,包括:信息获取模块,用于分别获得第一采集指标差异信息与第二采集指标差异信息;
[0022]其中,第一采集指标差异信息表征在未配置测试策略时,第一用户数据集合包含的第一用户采集指标与第二用户数据集合包含的第二用户采集指标的差异信息;第二采集指标差异信息表征在已配置测试策略时,第一用户数据集合包含的第三用户采集指标与第二用户数据集合包含的第四用户采集指标的差异信息;
[0023]差值计算模块,用于计算第二采集指标差异信息与第一采集指标差异信息的差值信息;
[0024]参数获取模块,用于将差值信息作为测试衡量参数。
[0025]可选地,所述第一用户采集指标为第一历史时段内的第一用户采集指标,所述第二用户采集指标为第一历史时段内的第二用户采集指标;所述第三用户采集指标为第二历史时段内的第三用户采集指标,所述第四用户采集指标为第二历史时段内的第四用户采集指标,所述信息获取模块包括:
[0026]均值获取单元,用于根据所述第一用户采集指标,获得所述第一历史时段内的第一用户采集均值;根据所述第二用户采集指标,获得所述第一历史时段内的第二用户采集均值;根据所述第三用户采集指标,获得所述第二历史时段内的第三用户采集均值;根据所述第四用户采集指标,获得所述第二历史时段内的第四用户采集均值;
[0027]差异信息获取单元,用于将所述第一用户采集均值与所述第二用户采集均值的差值作为所述第一采集指标差异信息;将所述第三用户采集均值与所述第四用户采集均值的差值作为所述第二采集指标差异信息。
[0028]可选地,所述装置还包括:稳定判断模块;
[0029]所述稳定判断模块包括:
[0030]预测指标获取单元,用于通过预测模型,分别获得所述第一用户采集指标对应的第一用户预测指标以及所述第二用户采集指标对应的第二用户预测指标;
[0031]稳定判断单元,用于确定所述第一用户预测指标与所述第一用户采集指标,以及所述第二用户预测指标与所述第二用户采集指标均满足稳定条件时,则运行所述信息获取模块,以分别获得第一采集指标差异信息与第二采集指标差异信息;
[0032]所述稳定判断单元,还用于确定所述第一用户预测指标与所述第一用户采集指标,以及所述第二用户预测指标与所述第二用户采集指标不满足稳定条件时,则更新所述预测模型的参数,直至通过更新后的预测模型获得的第一用户预测指标与所述第一用户采集指标,以及获得的第二用户预测指标与所述第二用户采集指标均满足稳定条件。
[0033]第三方面,本专利技术实施例提供一种数据干扰消除系统,包括:数据采集设备、前述实施方式中任意一项的装置;
[0034]数据采集设备用于采集分别在未配置测试策略时及已配置测试策略时,采集第一用户数据集合与第二用户数据集合;其中,在未配置测试策略时,第一用户数据集合包含的第一用户采集指标与第二用户数据集合包含的第二用户采集指标的差异信息;在已配置测试策略时,第一用户数据集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据干扰消除方法,其特征在于,包括:分别获得第一采集指标差异信息与第二采集指标差异信息;其中,所述第一采集指标差异信息表征在未配置测试策略时,第一用户数据集合包含的第一用户采集指标与第二用户数据集合包含的第二用户采集指标的差异信息;所述第二采集指标差异信息表征在已配置测试策略时,所述第一用户数据集合包含的第三用户采集指标与所述第二用户数据集合包含的第四用户采集指标的差异信息;计算所述第二采集指标差异信息与所述第一采集指标差异信息的差值信息;将所述差值信息作为测试衡量参数。2.根据权利要求1所述的方法,其特征在于,所述第一用户采集指标为第一历史时段内的第一用户采集指标,所述第二用户采集指标为第一历史时段内的第二用户采集指标;所述第三用户采集指标为第二历史时段内的第三用户采集指标,所述第四用户采集指标为第二历史时段内的第四用户采集指标;则所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤,包括:根据所述第一用户采集指标,获得所述第一历史时段内的第一用户采集均值;根据所述第二用户采集指标,获得所述第一历史时段内的第二用户采集均值;将所述第一用户采集均值与所述第二用户采集均值的差值作为所述第一采集指标差异信息;根据所述第三用户采集指标,获得所述第二历史时段内的第三用户采集均值;根据所述第四用户采集指标,获得所述第二历史时段内的第四用户采集均值;将所述第三用户采集均值与所述第四用户采集均值的差值作为所述第二采集指标差异信息。3.根据权利要求2所述的方法,其特征在于,在所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤之前,还包括:通过预测模型,分别获得所述第一用户采集指标对应的第一用户预测指标以及所述第二用户采集指标对应的第二用户预测指标;确定所述第一用户预测指标与所述第一用户采集指标,以及所述第二用户预测指标与所述第二用户采集指标,是否均满足稳定条件;若是,则执行所述分别获得第一采集指标差异信息与第二采集指标差异信息的步骤;若否,则更新所述预测模型的参数,直至通过更新后的预测模型获得的第一用户预测指标与所述第一用户采集指标,以及获得的第二用户预测指标与所述第二用户采集指标均满足稳定条件。4.一种数据干扰消除装置,其特征在于,包括:信息获取模块,用于分别获得第一采集指标差异信息与第二采集指标差异信息;其中,所述第一采集指标差异信息表征在未配置测试策略时,第一用户数据集合包含的第一用户采集指标与第二用户数据集合包含的第二用户采集指标的差异信息;所述第二采集指标差异信息表征在已配置测试策略时,所述第一用户数据集合包含的第三用户采集指标与所述第二用户数据集合包含的第四用户采集指标的差异信息;差值计算模块,用于计算所述第二采集指标差异信息与所述第一采集指标差异信息的差值信息;
...

【专利技术属性】
技术研发人员:陈友洋
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1