数据分析方法及装置、电子设备、存储介质制造方法及图纸

技术编号:21630282 阅读:29 留言:0更新日期:2019-07-17 11:31
本发明专利技术实施例提供了一种数据分析方法及装置、电子设备、存储介质。其中方法包括:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

Data Analysis Method and Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
数据分析方法及装置、电子设备、存储介质
本申请实施例涉及数据处理
,尤其涉及一种数据分析方法及装置、电子设备、存储介质。
技术介绍
随着网络平台(如交通工具调度平台)的业务发展,网络平台上的用户量以及与每一用户对应的用户数据的维度都不断增长。目前,出现了针对网络平台上产生的大量用户数据作数据分析的需求,以给平台的业务发展提供数据支持。而随着数据量级的日渐庞大,导致数据分析过程所带来的计算量较大,甚至无法在可接受的时间内完成计算。
技术实现思路
有鉴于此,本申请提供一种数据分析方法及装置、电子设备。为实现上述目的,本申请提供的技术方案如下:一种数据分析方法,包括:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种数据分析方法,包括:获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;根据所述清单和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种数据分析装置,包括:获得单元,用于获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;生成单元,用于根据所述群定义规则和所述数据分析目标生成待执行语句;索引创建单元,用于基于设定索引方式对用户数据创建索引库;查询单元,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种数据分析装置,包括:获得单元,用于获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;生成单元,用于根据所述清单和所述数据分析目标生成待执行语句;索引创建单元,用于基于设定索引方式对用户数据创建索引库;查询单元,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为:获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;根据所述清单和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;根据所述清单和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。通过以上技术方案可以看出,通过将用户数据采用设定索引方式创建索引库,在需要针对用户数据进行数据分析时,可以根据待分析用户群对应的信息(如群定义规则或清单)和所述数据分析目标生成待执行语句,最终,基于所述索引库调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。由于基于索引库来实现数据分析,且数据分析过程是针对特定的用户群来进行的,可以降低数据分析过程的计算量,提高了数据分析效率。附图说明图1为根据一示例性实施例示出的一种数据分析方法的流程图;图2为根据一示例性实施例示出的另一种数据分析方法的流程图;图3为根据一示例性实施例示出的电子设备的结构;图4为根据一示例性实施例示出的一种数据分析装置的框图。具体实施方式对于网络平台的用户,可将用户的每一用户属性定义为一个“维”(dimension),每个用户的用户数据可由多个“维”的数据来构成,每一“维”可对应于用户的一种用户属性。本文以通过网络实现对交通工具(如车辆)的调度的平台为例对本技术方案进行介绍。在交通工具调度平台的每一用户而言,用户属性可包括:性别、年龄、城市、消费类型、调度交通工具的频率、调度交通工具产生的费用等,每个用户属性对应着一个属性值,如,年龄:28,城市:北京。目前,出现了针对网络平台上产生的大量用户数据作多维数据分析的需求,并且希望在较短时间内完成多维分析过程。图1为根据一示例性实施例示出的一种数据分析方法的流程图,该方法的执行主体可以为各类电子设备(如网络设备、用户设备、终端设备或其他类型的计算设备)。如图1所示,在一实施例中,该方法可以通过下述步骤101~步骤105来实现,其中:在步骤101中,获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标。通常,数据分析工作往往可以针对特定的用户群来进行,而不是针对网络平台上的全量用户。在一实施例中,在步骤101之前,所述方法还可以包括:步骤102:创建用户群并存储用户群的群标识和群定义规则之间的对应关系,其中所述群定义规则包括至少一个用户属性对应的属性值。在一实施例中,可以预先创建多个候选的用户群,并设定各个用户群所对应的群定义规则。以交通工具调度平台为例,若需要创建由北京地区的高消费类型的用户组成的用户群,则该用户群所对应的群定义规则为:城市=“北京”&消费类型=“高消费类型”。每个用户群可以对应一个群标识,如:用户群1、用户群2、用户群3。在创建了用户群之后,可以通过如下过程来获得待分析用户群的群定义规则:步骤10:接收输入的群标识。如,可以在用户界面上提供多个已创建的用户群的标识供数据分析者来选择,用户选择某个用户群之后,则输入该被选择用户群对应的群标识。步骤20:根据用户群的群标识和群定义规则之间的对应关系,确定与输入的群标识对应的群定义规则。数据分析目标决定了用户需要通过数据分析得到什么样的分析结果。在一实施例中,数据分析目标可以包括选定的至少一个用户属性、针对选定的用户属性的分析指标(如:订单数、订单金额等)、与所述分析指标对应的聚合(aggregations)方式(如:求最大值、求最小值、求平均值等)。举例来说,当前需要分别分析出某个待分析用户群在性别、年龄、调度交通工具的频次这三个维度上的用户分布情况,则所述数据分析目标可以包含选定的用户属性:“性别”、“年龄”、“调度交通工具的频次”,以及分析指标:用户分布情况。又例如,当前需要分析某个待分析用户群的平均订单数,则所述数据分析目标可以包含分析指标:订单数,以及聚合方式:平均。在步骤103中,根据群定义规则和数据分析目标生成待执行语句。其中,生成的待执行语句可以为DSL(domainspecifi本文档来自技高网...

【技术保护点】
1.一种数据分析方法,其特征在于,所述方法包括:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;根据所述群定义规则和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。2.根据权利要求1所述的方法,其特征在于,所述索引库包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。3.根据权利要求2所述的方法,其特征在于,所述用户属性包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率或参与交通工具调度事件的次数。4.根据权利要求1所述的方法,其特征在于,在获得待分析用户群的群定义规则之前,还包括:创建用户群并存储用户群的群标识和群定义规则之间的对应关系,所述群定义规则包括至少一个用户属性对应的属性值;所述获得待分析用户群的群定义规则包括:接收输入的群标识;根据用户群的群标识和群定义规则之间的对应关系,确定与输入的群标识对应的群定义规则。5.根据权利要求1所述的方法,其特征在于,所述数据分析目标包括选定的至少一个用户属性、针对选定的用户属性的分析指标、与所述分析指标对应的聚合方式。6.根据权利要求5所述的方法,其特征在于,所述聚合方式包括求和、求平均值、求最大值、求最小值中的一种或多种。7.一种数据分析方法,其特征在于,所述方法包括:获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;根据所述清单和所述数据分析目标生成待执行语句;基于设定索引方式对用户数据创建索引库;调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。8.根据权利要求7所述的方法,其特征在于,所述索引库包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。9.根据权利要求8所述的方法,其特征在于,所述用户属性包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率或参与交通工具调度事件的次数。10.根据权利要求9所述的方法,其特征在于,所述聚合方式包括求和、求平均值、求最大值、求最小值中的一种或多种。11.一种数据分析装置,其特征在于,所述装置包括:获得单元,用于获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;生成单元,用于根据所述群定义规则和所述数据分析目标生成待执行语句;索引创建单元,用于基于设定索引方式对用户数据创建索引库;查询单元,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。12.根据权利要求11所述的装置,其特征在于,所述索引库包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。13.根据权利要求12所述的装置,其特征在于,所述用户属性包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率或参与交通工具调度事件的次数。14.根据权利要求11所述的装置,其特征在于,所述装置还包括:群创建单元,用于创建用户群并存储用户群的群标识和群定义规则之间的对应关系,所述群定义规则包括至少一个...

【专利技术属性】
技术研发人员:曹利锋李奘常智华凌宏博杨文君杨帆
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1