一种聚类簇获取方法及装置制造方法及图纸

技术编号:11637700 阅读:59 留言:0更新日期:2015-06-24 12:24
本申请公开了一种聚类簇获取方法及装置,所述方法包括:获取目标数据,所述目标数据包括多个第一数据项;对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合,所述聚类集合中包括多个第二数据项;依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇,所述聚类族包括多个第三数据项。本申请实施例通过对目标数据进行两次聚类分析,提高最终得到的聚类簇的准确性。

【技术实现步骤摘要】

本申请涉及数据挖掘
,特别涉及一种聚类簇获取方法及装置
技术介绍
目前,企业数据库中的数据量越来越大,这些数据中包含了许多有利于商业运作、提高竞争力的信息,为改进和优化事务决策,提高企业的竞争力,需要即时准确地对这些信息做出准确的分析。例如,对于零售业中客户满意度数据的空间分布问题中,通常对规则空间分布的样本数据为数据基础采用局部最优策略实现样本数据中的聚类簇的获取。但上述方案得到的聚类簇由于其数据基础具有局限性,使得由此获取到的该聚类簇准确性较低。
技术实现思路
本申请所要解决的技术问题是提供一种聚类簇获取方法及装置,用以解决现有技术中通过对规则空间分布的样本数据采用局部最优策略获取聚类簇时,获取到的聚类簇具有局限性,使得该聚类簇准确性较低的技术问题。本申请提供了一种聚类簇获取方法,包括:获取目标数据,所述目标数据包括多个第一数据项;对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合,所述聚类集合中包括多个第二数据项;依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇,所述聚类族包括多个第三数据项。上述方法,优选的,所述对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合,包括:利用遗传算法确定所述目标数据中第一数据项中的全局最优数据项作为第二数据项;将所述第二数据项进行组合,得到所述目标数据中的聚类集合。上述方法,优选的,依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇,包括:对于每个所述第一数据项,分别获取所述第一数据项与所述聚类集合中每个第二数据项之间的近邻函数值;依据所述第一数据项对应的每个近邻函数值,确定最小的近邻函数值对应的第二数据项为第三数据项;将每个所述第一数据项各自对应的第三数据项进行组合,生成聚类簇。上述方法,优选的,所述分别获取所述第一数据项与所述聚类集合中每个第二数据项之间的近邻函数值,包括:分别获取所述第一数据项对每个所述第二数据项的第一近邻系数;分别获取每个所述第二数据项对所述第一数据项的第二近邻系数;依据所述第一近邻系数和所述第二近邻系数,分别获取所述第一数据项与所述聚类集合中每个第二数据项之间的近邻函数值。本申请还提供了一种聚类簇获取装置,包括:数据获取单元,用于获取目标数据,所述目标数据包括多个第一数据项;初始聚类单元,用于对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合,所述聚类集合中包括多个第二数据项;聚类簇获取单元,用于依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇;其中,所述聚类簇包括多个第三数据项。上述装置,优选的,所述初始聚类单元包括:最优确定子单元,用于利用遗传算法确定所述目标数据中第一数据项中的全局最优数据项作为第二数据项;数据项组合子单元,用于将所述第二数据项进行组合,得到所述目标数据中的聚类集合。上述装置,优选的,所述聚类簇获取单元包括:值获取子单元,用于对每个所述第一数据项,分别获取所述第一数据项与所述聚类集合中每个第二数据项之间的近邻函数值;最小确定子单元,用于依据所述第一数据项对应的每个近邻函数值,确定最小的近邻函数值对应的第二数据项为第三数据项;簇生成子单元,用于将每个所述第一数据项各自对应的第三数据项进行组合,生成聚类簇。上述装置,优选的,所述值获取子单元包括:第一系数获取模块,用于分别获取所述第一数据项对每个所述第二数据项的第一近邻系数;第二系数获取模块,用于分别获取每个所述第二数据项对所述第一数据项的第二近邻系数;近邻值获取模块,用于依据所述第一近邻系数和所述第二近邻系数,分别获取所述第一数据项与所述聚类集合中每个第二数据项之间的近邻函数值。由上述方案可知,本申请提供的一种聚类簇获取方法及装置,通过获取样本的目标数据,进而对该目标数据中的第一数据项进行第一次的初始聚类分析,得到该目标数据中的初始聚类集合,进而对该聚类集合进行第二次分析,即为依据目标数据中的第一数据项,获取聚类集合中的聚类簇,将聚类簇中的数据作为最优决策参考依据提供给用户。本申请通过对目标数据进行两次聚类分析,提高最终得到的聚类簇的准确性。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请提供的一种聚类簇获取方法实施例一的流程图;图2为本申请提供的一种聚类簇获取方法实施例二的部分流程图;图3为本申请提供的一种聚类簇获取方法实施例三的部分流程图;图4为本申请实施例三的另一部分流程图;图5为本申请提供的一种聚类簇获取装置实施例四的结构示意图;图6为本申请提供的一种聚类簇获取装置实施例五的部分结构示意图;图7为本申请提供的一种聚类簇获取装置实施例六的部分结构示意图;图8为本申请实施例六的另一部分结构示意图。【具体实施方式】下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。参考图1,为本申请提供的一种聚类簇获取方法实施例一的流程图,所述方法用于获取样本数据中的聚类簇,以作为用户做出最优决策的参考依据。其中,所述方法可以包括以下步骤:步骤101:获取目标数据。其中,所述目标数据中包括多个第一数据项。所述目标数据即为样本数据,如在各个零售商中统计获取购买香烟的客户相关数据,这些样本数据中可以包括多个样本数据项,即为所述第一数据项,每个第一数据项中可以包括如购买香烟的客户的分布地址信息、购买时间信息等数据信息。步骤102:对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合。其中,所述聚类集合中可以包括多个第二数据项。需要说明的是,所述步骤102中可以通过对所述目标数据中的每个第一数据项之间进行初始聚类分析,在所述目标数据的第一数据项中提取到满足初始聚类分析条件的数据项作为第二数据项,由此得到所述目标数据中的聚类集合。步骤103:依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇。其中,所述聚类簇中可以包括多个第三数据项。需要说明的是,所述步骤103是指,依据所述目标数据中的第一数据项,对所述聚类集合中的第二数据项进行最优项分析,提取该聚类集合中的数据项作为第三数据项,由此得到聚类簇。由上述方案可知,本申请提供的一种聚类簇获取方法实施例一,通过获取样本的目标数据,进而对该目标数据中的第一数据项进行第一次的初始聚类分析,得到该目标数据中的初当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种聚类簇获取方法,其特征在于,包括:获取目标数据,所述目标数据包括多个第一数据项;对所述目标数据中的第一数据项进行初始聚类分析,得到所述目标数据中的聚类集合,所述聚类集合中包括多个第二数据项;依据所述目标数据中的第一数据项,获取所述聚类集合中的聚类簇,所述聚类族包括多个第三数据项。

【技术特征摘要】

【专利技术属性】
技术研发人员:邓伟高青青田德振田斐
申请(专利权)人:北京慧眼智行科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1