大数据的分析方法、及数据分析服务器技术

技术编号:23085006 阅读:27 留言:0更新日期:2020-01-11 01:07
本发明专利技术提供一种大数据的分析方法、及数据分析服务器,通过综合考虑不同兴趣度度量维度,以对每个维度的所有业务大数据进行聚类后,可以保证不同兴趣度度量维度在不同的数据挖掘项目待应用场景下性能表现更加统一,提高大数据挖掘的能力,并且可以根据各聚类簇的特征信息,动态确定待挖掘服务的多个数据挖掘项目。

Big data analysis method and data analysis server

【技术实现步骤摘要】
大数据的分析方法、及数据分析服务器
本申请涉及大数据
,具体而言,涉及一种大数据的分析方法、装置及数据分析服务器。
技术介绍
目前针对各个线上业务(例如订单行为业务、浏览行为业务等)等大数据挖掘方案,大多仅限使用一种兴趣度度量维度,虽然部分关注于不同兴趣度度量维度方式的属性和行为的研究,但是针对某个待挖掘服务,不同兴趣度度量维度在不同的数据挖掘项目待应用场景下,性能表现不一,其使用局限性限制了在大数据挖掘的能力。并且,在整个数据挖掘过程中,需要先对数据进行分析,然后才能确定挖掘项目。然而,现有的分析方法无法进行多维度的分析,并准确获得挖掘项目。
技术实现思路
为了至少克服现有技术中的上述不足,本申请的目的之一在于提供一种一种大数据的分析方法、装置及数据分析服务器。第一方面,本申请提供一种大数据的分析方法,应用于与待分析服务所对应的各个业务服务器通信连接的数据分析服务器,所述方法包括:从各个业务服务器中获取多个维度的业务大数据,并针对每个维度,对该维度的所有业务大数据进行聚类,得到每个维度的聚类簇;提取每个维度的聚类簇的特征信息,并根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目。在第一方面的一种可能的设计中,所述根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目的步骤,包括:从所述每个维度的聚类簇的特征信息中分析得到高贡献值特征与低贡献值特征;计算所述高贡献值特征在所述每个维度的聚类簇的特征信息中的第一占比以及所述低贡献值特征在所述每个维度的聚类簇的特征信息中的第二占比;根据所述第一占比和所述第二占比确定所述待挖掘服务的多个数据挖掘项目。在第一方面的一种可能的设计中,所述根据所述第一占比和所述第二占比确定所述待挖掘服务的多个数据挖掘项目的步骤,包括:根据所述第一占比与第一设定值之间的第一差值,以及所述第二占比与第二设定值之间的第二差值,分别确定高贡献值特征的第一挖掘系数和低贡献值特征的第二挖掘系数;根据所述第一挖掘系数和所述第二挖掘系数确定高贡献值特征所对应的数据挖掘项目的第一比例和低贡献值特征所对应的数据挖掘项目的第二比例;根据所述第一比例和所述第二比例确定所述待挖掘服务的多个数据挖掘项目。第二方面,本申请实施例提供一种数据分析服务器,包括处理器、存储器和网络接口。其中,存储器、网络接口处理器之间可以通过总线系统相连。网络接口用于接收报文,存储器用于存储程序、指令或代码,处理器用于执行存储器中的程序、指令或代码,以完成上述第一方面或第一方面的任意可能的设计方式中的所执行的操作。第三方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面的任意可能的设计方式中的方法。基于上述任意一个方面,本申请通过综合考虑不同兴趣度度量维度,以对每个维度的所有业务大数据进行聚类后,可以保证不同兴趣度度量维度在不同的数据挖掘项目待应用场景下性能表现更加统一,提高大数据挖掘的能力,并且可以根据各聚类簇的特征信息,动态准确的获取待挖掘服务的多个数据挖掘项目。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的大数据挖掘方法的应用场景示意图;图2为本申请实施例提供的大数据挖掘方法的流程示意图;图3为图2中所示的一种可能的实施方式中步骤S120包括的各个子步骤的流程示意图;图4为本申请实施例提供的用于执行上述的大数据挖掘方法的数据分析服务器的结构示意框图。具体实施方式下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。在本申请的描述中,除非另有说明,“至少一个”包括一个或多个。“多个”是指两个或两个以上。例如,A、B和C中的至少一个,包括:单独存在A、单独存在B、同时存在A和B、同时存在A和C、同时存在B和C,以及同时存在A、B和C。在本申请中,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。请参阅图1,为本申请实施例提供的大数据的分析方法的应用场景示意图。本实施例中,该应用场景可包括数据分析服务器100以及与该数据分析服务器100通信连接的多个业务服务器200。其中,数据分析服务器100可以为多个业务服务器200提供数据分析服务。每个业务服务器200可以是单独执行各个线上业务,例如订单业务、交易业务等。图2为本申请实施例提供的大数据的分析方法的流程示意图。本实施例中,该大数据的分析方法可以由图1中所示的数据分析服务器100执行,下面对该大数据的分析方法进行详细介绍。步骤S110,从各个业务服务器200中获取多个维度的业务大数据,并针对每个维度,对该维度的所有业务大数据进行聚类,得到每个维度的聚类簇。本实施例中,待挖掘服务可以是根据用户需求实际确定的挖掘服务,具体可以根据用户的设定选择与其相关联的业务服务器200,然后从这些业务服务器200中获取多个维度的业务大数据,并针对每个维度,对该维度的所有业务大数据进行聚类,从而得到每个维度的聚类簇。步骤S120,提取每个维度的聚类簇的特征信息,并根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目。本实施例中,例如,可以通过首先对每个维度的聚类簇进行加窗处理;将窗口内的每个维度的聚类簇输入到CCIPCA算法中计算所述每个维度的聚类簇的特征信息。在一种可能的设计中,请结合参阅图3,针对步骤S120,具体可以包括如下子步骤:子步骤S121,从所述每个维度的聚类簇的特征信息中分析得到高贡献值特征与低贡献值特征。子步骤S122,计算所述高贡献值特征在所述每个维度的聚类簇的特征信息中的第一占比以及所述低贡献值特征在每个维度的聚类簇的特征信息中的第二占比。子步骤S123,根据所述第一占比和所述第二占比确定所述待挖掘服务的多个数据挖掘项目。其中,针对子步骤S123,在一种可能的实现方式中,首先根据所述第一占比与第一设定值之间的第一差值,以及所述第二占比与第二设定值之间的第二差值,分别确定高贡献值特征的第一挖掘系数和低贡献值特征的第二挖掘系数。然后,根据所述第一挖掘系数和所述第二挖掘系数确定高贡献值特征所对应的数据挖掘项目的第一比例和低贡献值特征所对应的数据挖掘项目的第二比例,最后根据所述第一比例和所述第二比例确定所述待挖掘服务的多个数据挖掘项目。基于上述步骤,本实施例通过进本文档来自技高网...

【技术保护点】
1.一种大数据的分析方法,其特征在于,应用于与待分析服务所对应的各个业务服务器通信连接的数据分析服务器,所述方法包括:/n从各个业务服务器中获取多个维度的业务大数据,并针对每个维度,对该维度的所有业务大数据进行聚类,得到每个维度的聚类簇;/n提取每个维度的聚类簇的特征信息,并根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目。/n

【技术特征摘要】
1.一种大数据的分析方法,其特征在于,应用于与待分析服务所对应的各个业务服务器通信连接的数据分析服务器,所述方法包括:
从各个业务服务器中获取多个维度的业务大数据,并针对每个维度,对该维度的所有业务大数据进行聚类,得到每个维度的聚类簇;
提取每个维度的聚类簇的特征信息,并根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目。


2.根据权利要求1所述的大数据的分析方法,其特征在于,所述根据每个维度的聚类簇的特征信息,确定所述待挖掘服务的多个数据挖掘项目的步骤,包括:
从所述每个维度的聚类簇的特征信息中分析得到高贡献值特征与低贡献值特征;
计算所述高贡献值特征在所述每个维度的聚类簇的特征信息中的第一占比以及所述低贡献值特征在每个维度的聚类簇的特征信息中的第二占比;
根据所述第一占比和所述第二占比确定所述待挖掘服务的多个数据挖掘项目。


3.根据权利要求2所述的大数据的分析方法,其特征在于,所...

【专利技术属性】
技术研发人员:陈少海刘泉明罗茂锐
申请(专利权)人:厦门久凌创新科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1