【技术实现步骤摘要】
大数据指标构建方法、装置、设备及存储介质
本专利技术涉及大数据
,尤其涉及一种大数据指标构建方法、装置、设备及存储介质。
技术介绍
随着社会的进步和大数据的发展,固定维度的指标I的发展迎来了挑战。固定维度的指标I的基础是利用生产数据,提炼出对应的生产指标,在这个过程中需要对生产数据进行大量的计算。同时,根据不同指标层级的划分,需要非常灵活的计算。随着生产数据的暴涨和应用场景的灵活,固定维度的指标I服务无法再提供有效的服务。以往的解决方案是通过提供更多的计算资源或者提供更高的计算引擎来解决问题,然而在数据量的暴涨下,也耗费了大量的资源。在计算模型方面,虽实现了指标计算的灵活,但却增加了指标计算耗时,为了满足计算模型和计算资源的一致性,大数据的固定维度的指标I计算往往局限于单一的计算引擎。
技术实现思路
本专利技术的主要目的在于解决只能使用单一数据引擎和维度建模的技术问题。本专利技术第一方面提供了一种大数据指标构建方法,包括:获取待预测数据;对所述待预测数据进行解析,构建 ...
【技术保护点】
1.一种大数据指标构建方法,其特征在于,所述大数据指标构建方法包括以下步骤:/n获取待预测数据;/n对所述待预测数据进行解析,构建多个携带不同维度属性信息的指标;/n根据线性回归算法,计算所述指标的访问频率,并判断所述指标是否关联有预置维度表;/n基于所述访问频率,确定所述指标的指标类型,其中,所述指标类型包括多维度聚合的指标和固定维度的指标;/n基于所述指标类型,根据预设的指标类型与存储计算引擎之间的对应关系表,以及指标类型与指标的维度建模方式之间的对应关系表,确定与所述指标对应的存储计算引擎和维度建模方式;/n根据所述维度建模方式,确定所述指标所关联的预置维度表,其中, ...
【技术特征摘要】
1.一种大数据指标构建方法,其特征在于,所述大数据指标构建方法包括以下步骤:
获取待预测数据;
对所述待预测数据进行解析,构建多个携带不同维度属性信息的指标;
根据线性回归算法,计算所述指标的访问频率,并判断所述指标是否关联有预置维度表;
基于所述访问频率,确定所述指标的指标类型,其中,所述指标类型包括多维度聚合的指标和固定维度的指标;
基于所述指标类型,根据预设的指标类型与存储计算引擎之间的对应关系表,以及指标类型与指标的维度建模方式之间的对应关系表,确定与所述指标对应的存储计算引擎和维度建模方式;
根据所述维度建模方式,确定所述指标所关联的预置维度表,其中,所述预置维度表包括基于所述指标类型对应的维度建模方式构建的维度表或基于所有维度建模方式构建的维度表;
利用路由决策引擎调用所述存储计算引擎执行所述预置维度表,计算出所述指标对应的指标值。
2.根据权利要求1所述的大数据指标构建方法,其特征在于,所述对所述待预测数据进行解析,以构建多个携带不同维度属性信息的指标包括:
对所述待预测数据进行解析,定义多个指标;
利用预置模型对所述指标进行分级,并增加维度属性;
基于所述指标和所述维度属性,将所述指标和所述维度属性组合,获取多个不同维度属性的指标。
3.根据权利要求1所述的大数据指标构建方法,其特征在于,在所述根据线性回归算法,计算所述指标的访问频率,并判断所述指标是否关联有预置维度表之前,还包括:
获取包含所述指标的历史数据,其中,所述历史数据包括特定时期内的指标、所述指标在特定时期内的访问次数,以及影响所述指标在特定时期内访问次数的指标因子;
将所述历史数据作为样本数据,并对所述样本数据进行偏相关分析,提取指标,并分别建立所述指标与对应指标因子的映射关系方程式;
分别对所述映射关系方程式进行T检验,确定影响所述指标访问频率的主要指标因子。
4.根据权利要求1所述的大数据指标构建方法,其特征在于,所述根据线性回归算法,计算所述指标的访问频率,并判断所述指标是否关联有预置维度表包括:
基于线性回归算法,确定影响所述指标访问频率的主要指标因子;
建立所述指标与所述主要指标因子的映射关系方程式,并采用弹性系数法预测所述主要指标因子的参数值;
将所述指标因子的参数值代入所述映射关系方程式中,计算所述指标的访问频率。
5.根据权利要求1所述的大数据指标构建方法,其特征在于,所述基于所述访问频率,确定所述指标的指标类型包括:
若所述指标的访问频率大于预设阈值且计算所述指标的访问频率需要关联其他维度表,则所述指标为需要多维度聚合的指标类型;
若所述指标的访问频率大于预设阈值且计算所述指标的访问频率不需要关联其他维度表,则所述指标类型为固定维度的指标类型。
6.根据权利要求1所述的大数据指标构建方法,...
【专利技术属性】
技术研发人员:陈志兴,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。