一种数据处理方法和装置制造方法及图纸

技术编号:30425231 阅读:28 留言:0更新日期:2021-10-24 16:57
本申请实施例提供一种数据处理方法和装置,其中,方法包括:通过确定待分析指标的维度集合中的维度项,该维度集合中的维度项包括单一维度项和交叉维度项,根据获取的分析日期和参考日期中各维度项的剪枝参数,对待分析指标的维度集合中的维度项进行剪枝,基于维度筛选系数,从剪枝后的维度集合中确定候选维度;基于维度项排序参数,从候选维度的维度项中确定待分析指标的目标维度项。本申请实施例可以实现交叉维度的剪枝问题,且当维度较多时仍能快速准确处理得到归因结果,提高数据异常归因处理的效率和准确率。理的效率和准确率。理的效率和准确率。

【技术实现步骤摘要】
一种数据处理方法和装置


[0001]本申请涉及数据处理领域,具体涉及一种数据处理方法和装置。

技术介绍

[0002]所有业务都会面对“为什么涨、为什么降、原因是什么?”这种简单粗暴又不易定位的业务问题。如在业务发展过程中,由于投放、产品迭代、热点事件等因素的变化,会带来业务核心指标的波动,业务面临每次较大波动都需要进行问题定位分析,然后再采取进一步措施。例如,在产品研发和迭代过程中,需要时刻关注各种指标及其变化。如:每日活跃用户、用户总时长、留存率等。由于产品迭代、关键事件营销、投放策略等的改变可能会影响指标的变化,但由于影响指标的因子的多样性,因此在某些指标出现异常波动时,需要逐项去排查可疑因素。
[0003]传统的解决方案中,由分析师针对目标指标,按照目标指标所涉及的维度一个一个的逐项去排查可疑因素,单次执行一个维度所对应的任务的时间占用在5~10min之间,通常维度有30~50个,在所有维度排查完之后,才能找到最关键的指标影响维度因素,如此耗时较长,如耗时0.5天~2天等。这种传统数据异常归因方式非常耗时,且精准度较低容易遗漏关键本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待分析指标、以及分析日期和参考日期;获取所述待分析指标的至少两个归因维度,各归因维度包括至少两个单一维度项;获取所述分析日期和所述参考日期中各维度项的剪枝参数;根据所述各维度项的剪枝参数,对所述待分析指标的维度集合中的维度项进行剪枝,所述维度集合中的维度项包括单一维度项和交叉维度项,所述交叉维度项由属于不同归因维度的单一维度项组合形成;基于维度筛选参数,从剪枝后的维度集合中确定候选维度;基于维度项排序参数,从所述候选维度的维度项中确定所述待分析指标的目标维度项。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述各维度项的剪枝参数,对所述待分析指标的维度集合中的维度项进行剪枝的步骤,包括:根据所述归因维度中的单一维度确定所述归因维度中的交叉维度;将所述单一维度和所述交叉维度作为所述待分析指标的维度集合;确定所述维度集合中的维度项;根据所述各维度项的剪枝参数,对所述待分析指标的所述维度项进行剪枝。3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述各维度项的剪枝参数,对所述待分析指标的所述维度项进行剪枝的步骤,包括:根据所述各维度项的剪枝参数,确定所述各维度项的离析度值;根据所述离析度值,对所述待分析指标的交叉维度项进行剪枝。4.根据权利要求3所述的数据处理方法,其特征在于,所述根据所述离析度值,对所述待分析指标的交叉维度项进行剪枝的步骤,包括:当所述交叉维度项的离析度值大于所述交叉维度项中各单一维度项的离析度值时,确定所述交叉维度项无需进行剪枝;当所述交叉维度项的离析度值不大于所述交叉维度项中各单一维度项的离析度值时,确定所述交叉维度项需进行剪枝,并对所述交叉维度项进行剪枝。5.根据权利要求1所述的数据处理方法,其特征在于,所述基于维度筛选参数,从剪枝后的维度集合中确定候选维度的步骤,包括:确定所述分析日期和所述参考日期中各维度项的维度项参数值;根据所述各维度项的维度项参数值确定维度筛选参数;根据所述维度筛选参数,从剪枝后的维度集合中确定候选维度。6....

【专利技术属性】
技术研发人员:王欢胡仲旻
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1