数据分析方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:38849810 阅读:21 留言:0更新日期:2023-09-17 09:58
本公开涉及一种数据分析方法、装置、计算机可读介质及电子设备,方法包括:获取针对业务系统的测试数据和预设分析指标;在不同数据维度下将所述测试数据处理为二分类数据;确定每一所述二分类数据中每类数据之间的分布差异度,并根据所述预设分析指标,确定每一所述二分类数据中每类数据的类别解释度;根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群。通过上述技术方案,可以对每个测试数据的不同数据维度进行自动分析,以从不同的数据维度中准确的确定出符合预设分析指标的目标数据子群。分析指标的目标数据子群。分析指标的目标数据子群。

【技术实现步骤摘要】
数据分析方法、装置、计算机可读介质及电子设备


[0001]本公开涉及计算机
,具体地,涉及一种数据分析方法、装置、计算机可读介质及电子设备。

技术介绍

[0002]在实际业务场景中,通常基于测试数据来对不同维度的数据进行差异化处理效应(Heterogeneity of treatment effect,HTE)分析,以定位到符合某些目标指标的子群(人群/事物),从而对该子群生效具体的业务策略。
[0003]相关技术中,一般采用人工拆解分析方法来对测试数据进行维度拆解,并根据拆解后的维度进行差异化处理效应分析,以定位到符合某些目标指标的子群。但是,人工拆解分析方法效率较低,耗时过长,且很难通过穷尽不同维度的交叉组合寻找到最佳子群。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种数据分析本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获取针对业务系统的测试数据和预设分析指标,所述预设分析指标用于表征期望从所述测试数据中得到的目标数据与目标指标之间的关系,所述测试数据包括实验组数据和对照组数据,所述目标指标由第一数据指标除以第二数据指标得到,所述第一数据指标基于所述实验组数据与所述对照组数据在第一子数据指标下的第一差值数据得到,所述第二数据指标基于所述实验组数据与所述对照组数据在第二子数据指标下的第二差值数据得到;在不同数据维度下将所述测试数据处理为二分类数据;确定每一所述二分类数据中每类数据之间的分布差异度,并根据所述预设分析指标,确定每一所述二分类数据中每类数据的类别解释度,所述类别解释度用于表征所述每类数据对应的所述第一差值数据或所述第二差值数据在所述测试数据中的数据占比;根据所述分布差异度和所述类别解释度,在所述测试数据中确定目标数据子群。2.根据权利要求1所述的方法,其特征在于,所述在不同数据维度下将所述测试数据处理为二分类数据,包括:针对所述测试数据对应的每一数据维度,确定所述数据维度的类型,并根据所述数据维度的类型,确定所述数据维度对应的目标划分信息;根据所述目标划分信息,从不同的数据维度将所述测试数据处理为二分类数据。3.根据权利要求2所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的目标划分信息,包括:根据所述数据维度的类型,确定所述数据维度对应的候选划分信息;确定将所述测试数据按照所述候选划分信息划分后每类数据之间的分布差异度;根据按照所述候选划分信息划分后每类数据之间的分布差异度,在所述候选划分信息中确定目标划分信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的候选划分信息,包括:当所述数据维度的类型为定量维度类型时,将所述数据维度下的每一维度元素分别作为一划分信息,得到所述数据维度对应的候选划分信息。5.根据权利要求3所述的方法,其特征在于,所述根据所述数据维度的类型,确定所述数据维度对应的候选划分信息,包括:当所述数据维度的类型为定性维度类型时,根据所述预设分析指标,确定所述数据维度下每一维度元素的数据在所述测试数据中的元素解释度,并根据所述元素解释度将所述数据维度下的所述维度元素进行排序,得到排序维度元素,所述元素解释度用于表征所述维度元素对应的所述第一差值数据或所述第二差值数据在所述测试数据中的数据占比;依次根据所述排序维度元素中每两个所述维度元素确定一划分信息,得到所述数据维度对应的候选划分信息。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据所述预设分析指标、所述维度元素对应的所述第一差值数据在所述测试数据中的数据占比和所述维度元素对应的所述第二差值数据在所述测试数据中的数据占比,确定所述维度元素对应的指标差异值;根据所述指标差异值和所述元素解释度,对所述数据维度下的所述维度元素进行筛
选,得到目标维度元素;所述根据所述元素解释度将所述数据维度下的所述维度元素进行排序,包括:根据所述元素解释度将所述目标维度元素进行排序。7.根据权利要求3

6任一项所述的方法,其特征在于,所述确定将所述测试数据按照所述候选划分信息划分后每类数据之间的分布差异度,包括:确定将所述测试数据按照所述候选划分信息划分后每类数据对应的所述第一差值数据在所述测试数据中的分子占比、以及所述每类数据对应的所述第二差值数据在所述测试数据中的分母占比;根据所述分子占比和所述分母占比的正负情况,对所述分子占比和所述分母占比进行转换,以使所述分子占比和所述分母占比均为正数,得到目标分子占比和目标分母占比;根据所述目标分子占比和所述目标分母占比,确定...

【专利技术属性】
技术研发人员:柯珍梅
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1