一种数据指标关联关系的确定方法及装置制造方法及图纸

技术编号:16456076 阅读:49 留言:0更新日期:2017-10-25 20:36
本申请涉及计算机技术,公开了一种数据指标关联关系的确定方法及装置,用于实现数据指标的准确优化。该方法为:本申请实施例中,是基于目标数据指标的待调整属性,从目标数据指标的关联关系树的底层的数据节点进行层层洄溯,筛选出生成脚本中的计算过程涉及到目标数据指标的待调整属性的所有数据节点,再将筛选出的数据节点及相应的生成脚本进行输出,这样,便可以获得所有会影响目标数据指标的待调整属性的数据节点的生成脚本,从而可以在后续操作中有针对性地对这些生成脚本进行优化,将待调整属性调整至理想状态,进而有效地实现了目标数据指标的准确优化。

Method and device for determining correlation relation of data index

The application involves computer technology, and discloses a method and device for determining the correlation relation of data indexes, so as to realize the accurate optimization of the data indexes. The method is as follows: the embodiment of the invention, is the target data to be adjusted based on the properties of the layers of whirl back from the data nodes in the underlying index target data association tree, screening out the calculation process of generating scripts involved in all of the data nodes to be adjusted to properties of the target data, then screened the data node and the corresponding generated script output, so that they can get to be adjusted to generate a script attribute data for all nodes will affect the target data, and in the subsequent operation for optimization of these scripts will be generated to adjust the properties adjusted to the desired state, thus effectively realized accurate optimization target data index.

【技术实现步骤摘要】
一种数据指标关联关系的确定方法及装置
本申请涉及计算机技术,特别涉及一种数据指标关联关系的确定方法及装置。
技术介绍
随着信息时代的到来,目前,各行各业的数据规模不断增长,在过去几年里产生的数据量比以往四五年的数据量都要大。大数据可以来自方方面面,从日常生活购物到社交网络,从地理位置定位到在线视频都会产生大量的数据。而通过这些大数据可以提炼出所需的数据指标,而这些数据指标正是进行各种决策的关键,跟我们的生活都是息息相关,因此,大数据的准确率越高,相应决策就越实用,就会使生活越有效率。实际应用中,基于大数据提炼数据指标时,数据指标是基于多层数据表进行层层计算获得的,这种计算过程就好像是将最原始的大数据通过多层沙漏进行过滤一样,只不过是每层沙漏过滤的规则都是不一样的,而每层的计算都会影响数据指标的准确性。目前,针对如何提高数据指标的准确性还没有具体的实现方案,仅仅是针对数据指标给出相关属性值,以描述数据指标的准确程序。例如,以现有数据计算过程中,在对数据指标的取值(value数值)进行计算时,会计算出某个数据指标下有多少条数据是空值,进而得到该数据指标的空值率。某个数据指标的空值率过高时本文档来自技高网...
一种数据指标关联关系的确定方法及装置

【技术保护点】
一种数据指标关联关系的确定方法,其特征在于,包括:确定待分析的目标数据指标及待调整属性;确定所述目标数据指标对应的底层的数据节点以及与所述底层数据节点存在关联关系的数据节点;对所述底层的数据节点以及与所述底层的数据节点存在关联关系的数据节点进行解析,以筛选出与所述待调整属性相关联的数据节点;对筛选出的数据节点的生成脚本进行输出。

【技术特征摘要】
1.一种数据指标关联关系的确定方法,其特征在于,包括:确定待分析的目标数据指标及待调整属性;确定所述目标数据指标对应的底层的数据节点以及与所述底层数据节点存在关联关系的数据节点;对所述底层的数据节点以及与所述底层的数据节点存在关联关系的数据节点进行解析,以筛选出与所述待调整属性相关联的数据节点;对筛选出的数据节点的生成脚本进行输出。2.如权利要求1所述的方法,其特征在于,所述底层的数据节点表示用于记录所述目标数据指标的数据表。3.如权利要求1所述的方法,其特征在于,确定与所述底层的数据节点存在关联关系的数据节点,包括:从所述底层的数据节点开始确定,在所述底层的数据节点和源数据节点之间,逐级确定出与所述底层的数据节点存在关联关系的数据节点,其中,每确定一个数据节点,执行以下操作:基于当前确定的一个数据节点对应的生成脚本中记录的关联数据节点的标识信息,提取出与当前确定的一个数据节点存在关联关系的下一个数据节点。4.如权利要求1、2或3所述的方法,其特征在于,对所述底层数据节点以及与所述底层数据节点存在关联关系的数据节点进行的解析,包括:每确定一个数据节点,对当前确定的一个数据节点对应的生成脚本进行词法分析,确定所述生成脚本中计算所述目标数据指标采用的计算语句;将获得的计算语句与预设的规则库进行匹配,根据匹配结果从当前确定的一个数据节点的上一级的数据节点中筛选出与所述待调整属性相关联的数据节点;其中,所述规则库中记录的规则用于指示不同的计算语句下,当前确定的一个数据节点中记录的目标数据指标的待调整属性来源于哪一个上一级的数据节点;将针对当前确定的一个数据节点筛选出的上一级的数据节点作为下一个进行词法分析的对象,直至确定与所述目标数据指标的目标调优属性关联的最终的数据节点为止。5.如权利要求4所述的方法,其特征在于,对一个数据节点的生成脚本进行词法分析,确定所述生成脚本中计算所述目标数据指标时采用的计算语句,包括:获取所述生成脚本对应的源程序;按照构词规则将源程序分解为一系列的单词符号;按照预设的语法规则对获得的单词符号进行处理,输出计算语句,并从中筛选出与所述目标数据指标相关的计算语句。6.如权利要求4所述的方法,其特征在于,确定与所述目标数据指标的待调整属性关联的最终的数据节点,包括:判定当前确定的一个数据节点对应的生成脚本中不包括涉及所述目标数据指标的待调整属性的计算语句时,将上一次确定的一个数据节点作为最终的数据节点;或者,判定当前确定的一个数据节点对应的生成脚本中包括涉及所述目标数据指标的待调整属性的计算语句,且所述当前确定的一个数据节点为源数据节点时,将所述当前确定的一个数据节点为最终的数据节点。7.一种数据指标关联关系的确定装置,其特征在于,包括:第一处理单元,用于确...

【专利技术属性】
技术研发人员:赵宁宋科峰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1