一种数据分析方法和装置制造方法及图纸

技术编号:34287535 阅读:62 留言:0更新日期:2022-07-27 08:41
本发明专利技术实施例公开了一种数据分析方法和装置,在接收到数据分析任务时,根据该数据分析任务的类型,可以从对应的矩阵库中确定出该类型对应的特征矩阵,并可以由该特征矩阵对该数据分析任务对应的待分析数据进行处理,可见,从矩阵库获取对应的特征矩阵来用于对一个数据分析任务的处理,以获取所述特征矩阵的输出特征,根据所述输出特征确定所述数据分析任务的分析结果。而不用为这个数据分析任务专门配置特征矩阵,从而省去了原本需要根据所需分析的数据及数据分析任务的需求来配置特征矩阵的时间,提高了数据分析效率。提高了数据分析效率。提高了数据分析效率。

【技术实现步骤摘要】
一种数据分析方法和装置
[0001]本申请为2016年09月27日提交的申请号为201610854748.7的专利技术专利申请的分案申请。


[0002]本专利技术涉及数据处理领域,特别是涉及一种数据分析方法和装置。

技术介绍

[0003]随着数据分析技术的发展,数据的重要性随之提升,对数据进行数据分析的分析结果往往可以作为一些公司决策、发展的重要参考。
[0004]数据分析的过程需要使用到特征矩阵和模型对所需分析的数据进行处理,从而得到分析结果。数据分析的分析结果越准确,起到的参考价值就越高。
[0005]目前,在进行数据分析的过程中,在执行每一次数据分析任务时,都需要为该数据分析任务专门配置特征矩阵,每次配置特征矩阵都会消耗大量时间,数据分析的效率有待提高。

技术实现思路

[0006]为了解决上述技术问题,本专利技术实施例提供了一种数据分析方法和装置,可以节省配置特征矩阵的时间,提高数据分析效率。
[0007]第一方面,本专利技术实施例提供了一种数据分析方法,该方法包括:
[0008]接收数据分析任务;获取该数据分析任务对应的待分析数据;根据该数据分析任务的类型从矩阵库中确定出该类型对应的特征矩阵;根据该特征矩阵的处理逻辑对该数据进行处理,以获取该特征矩阵的输出特征;根据该输出特征确定该数据分析任务的分析结果。
[0009]可见,在接收到数据分析任务时,根据该数据分析任务的类型,可以从对应的矩阵库中确定出该类型对应的特征矩阵,并可以由该特征矩阵对该数据分析任务所需分析的数据进行处理,可见,从矩阵库获取对应的特征矩阵来用于对一个数据分析任务的处理,而不用为这个数据分析任务专门配置特征矩阵,从而省去了原本需要根据所需分析的数据及数据分析任务的需求来配置特征矩阵的时间,提高了数据分析效率。
[0010]在第一方面的第一种可能的实现方式中,该矩阵库包括在历史任务的分析过程中所配置的特征矩阵,该历史任务为已完成的数据分析任务,该历史任务的类型与该数据分析任务的类型相同。
[0011]可见,将历史任务的特征矩阵应用于数据分析任务的分析中,达到了对特征矩阵重复使用的效果。减少了对该数据分析任务进行数据分析所耗费的时间,进而提高了数据分析的效率。若矩阵库中存放的特征矩阵越全面,特征矩阵对应的数据分析任务的类型越多,则在接收到新的数据分析任务时,从矩阵库中直接重复使用之前保存下来的特征矩阵进行处理的机率越大。
[0012]结合第一方面的第一种的实现方式,在第二种可能的实现方式中,还包括:
[0013]根据该类型从特征工程库中确定出与该类型对应的特征工程,该特征工程包括从获取所需分析的数据到从特征矩阵得到输出特征之间的数据分析过程;该根据该特征矩阵的处理逻辑对该数据进行处理,获取该特征矩阵的输出特征,包括:按照该特征工程中包括的数据分析过程,根据该特征矩阵的处理逻辑对该数据进行处理,获取该特征矩阵的输出特征。
[0014]可见,可以通过预先建立特征工程库,并将历史任务在分析过程中所配置出的特征工程、以及该历史任务的类型与其所配置的特征工程具有的对应关系均保存在该特征工程库中,方便在接收到的数据分析任务时,能够依据该数据分析任务的类型直接从特征工程库中匹配到与该类型对应的特征工程,省去了配置繁琐的数据分析步骤的时间,提高了数据分析效率。
[0015]结合第一方面的第二种的实现方式,在第三种可能的实现方式中,该数据分析过程还包括对所需分析的数据进行预处理的过程,该预处理的过程包括数据去重、数据抽样和数据优化中任意一项或多项的组合。
[0016]可见,通过记录待分析数据的预处理过程,在针对数据分析任务复用该数据分析过程时,免去手动配置繁琐的预处理步骤,节省了时间,提高了数据分析的效率。
[0017]在第一方面的第四种可能的实现方式中,该矩阵库中包括的该特征矩阵为根据特征库中保存的特征与处理逻辑所配置得到的,该特征库中保存的特征为根据历史数据所构建得到的。
[0018]可见,可以预先通过一个领域中的数据构建出与这个领域相关的特征库,从而在需要为一个数据分析任务配置对应的特征矩阵时,可以直接依据特征库中已经确定好的特征和处理逻辑进行配置,从而可以一定程度上节省配置特征矩阵的所消耗的时间。
[0019]结合第一方面的第四种的实现方式,在第五种可能的实现方式中,该历史数据属于电信领域,则该特征库中保存的特征为根据该领域中数据所构建得到的,包括:该特征库中保存的特征为基于数据所携带的属性,对该电信领域中的数据进行构建得到的,该属性包括用户属性、位置属性、业务属性、终端属性和网络属性中任意一项或多项的组合。
[0020]可见,针对电信领域的特点,通过用户属性、位置属性、业务属性、终端属性和网络属性中任意一项或多项的组合,可以根据电信领域的历史数据构建出针对电信领域的特征库,以便于提高电信领域的数据分析任务的数据分析效率。
[0021]在第一方面的第六种可能的实现方式中,该根据该输出特征确定该数据分析任务的分析结果,包括:从模型库中查找与该数据分析任务的类型相匹配的模型;根据查找到的模型对该输出特征进行处理,以得到该分析结果。
[0022]可见,可以通过预先构建模型库,并将历史任务在分析过程中所配置出的模型、以及该历史任务的类型与其所配置的模型具有的对应关系保存在该模型库中,方便在接收到的数据分析任务时,依据该数据分析任务的类型可以直接从模型库中匹配到与该类型对应的模型,并可以根据该模型对特征矩阵的输出特征进行处理,省去了重新为该数据分析任务配置模型的时间,提高了数据分析效率。
[0023]结合第一方面的第六种的实现方式,在第七种可能的实现方式中,该模型库包括在历史任务的分析过程中所配置的模型,该历史任务为已完成的数据分析任务,该历史任
务的类型与该数据分析任务的类型相同。
[0024]可见,同类型的数据分析任务所配置的模型基本类似,将历史任务的模型保存在模型库中,处理同类型的数据分析任务时可以进行复用,省去为数据分析任务配置模型的时间。
[0025]第二方面,本专利技术实施例提供了一种数据分析装置,该装置包括接收单元、获取单元、确定单元和处理单元,用于执行上述第一方面或第一方面的任一种实现方式所描述的方法。
[0026]第三方面,提供一种数据分析服务器,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行程序,当所述程序被执行时,所述处理器具体用于执行上述第一方面或第一方面的任一种实现方式所描述的方法。
[0027]第四方面,提供一种计算机可读介质,所述计算机可读介质用于存储程序代码,所述程序代码包含用于实现上述第一方面或第一方面的任一种实现方式所描述的方法的指令。
[0028]由上述技术方案可以看出,在接收到数据分析任务时,根据该数据分析任务的类型,可以从对应的矩阵库中确定出该类型对应的特征矩阵,并可以由该特征矩阵对该数据分析任务所需分析的数据进行处理,可见,从矩阵库获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:接收数据分析任务;获取所述数据分析任务对应的待分析数据;根据所述数据分析任务的类型得到所述类型对应的特征矩阵;根据所述特征矩阵的处理逻辑对所述数据进行处理,以获取所述特征矩阵的输出特征;根据所述输出特征确定所述数据分析任务的分析结果。2.根据权利要求1所述的方法,其特征在于,所述特征矩阵是根据所属数据分析任务的类型,基于矩阵库得到的,所述矩阵库包括在历史任务的分析过程中所配置的特征矩阵,所述历史任务为已完成的数据分析任务,所述历史任务的类型与所述数据分析任务的类型相同。3.根据权利要求2所述的方法,其特征在于,还包括:根据所述类型从特征工程库中确定出与所述类型对应的特征工程,所述特征工程包括从获取所需分析的数据到从特征矩阵得到输出特征之间的数据分析过程;所述根据所述特征矩阵的处理逻辑对所述数据进行处理,获取所述特征矩阵的输出特征,包括:按照所述特征工程中包括的数据分析过程,根据所述特征矩阵的处理逻辑对所述数据进行处理,获取所述特征矩阵的输出特征。4.根据权利要求3所述的方法,其特征在于,所述数据分析过程还包括对所需分析的数据进行预处理的过程,所述预处理的过程包括数据去重、数据抽样和数据优化中任意一项或多项的组合。5.根据权利要求2所述的方法,其特征在于,所述矩阵库中包括的所述特征矩阵是根据特征库中保存的特征与处理逻辑所配置得到的,所述特征库中保存的特征为根据历史数据所构建得到的。6.根据权利要求5所述的方法,其特征在于,所述历史数据属于电信领域,则所述特征库中保存的特征为根据所述领域中数据所构建得到的,包括:所述特征库中保存的特征为基于数据所携带的属性,对所述电信领域中的数据进行构建得到的,所述属性包括用户属性、位置属性、业务属性、终端属性和网络属性中任意一项或多项的组合。7.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征确定所述数据分析任务的分析结果,包括:从模型库中查找与所述数据分析任务的类型相匹配的模型;根据查找到的模型对所述输出特征进行处理,以得到所述分析结果。8.根据权利要求7所述的方法,其特征在于,所述模型库包括在历史任务的分析过程中所配置的模型,所述历史任务为已完成的数据分析任务,所述历史任务的类型与所述数据分析任务的类型相同。9.一种数据分析装置,其特征在于,所述装置...

【专利技术属性】
技术研发人员:洪斯宝夏命榛
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1