基于多线程的聚类数据处理方法和数据处理设备技术

技术编号:30320999 阅读:21 留言:0更新日期:2021-10-09 23:41
本申请提供了一种基于多线程的聚类数据处理方法和数据处理设备,所述基于多线程的聚类数据处理方法包括:配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述n组参数;所述n个线程分别处理所述n组参数,得到n个近邻点组;所述n个线程分别处理所述n个近邻点组完成聚类处理。基于多线程的聚类数据处理方法和数据处理设备,根据多线程处理,提高聚类数据处理的计算速度。提高聚类数据处理的计算速度。提高聚类数据处理的计算速度。

【技术实现步骤摘要】
基于多线程的聚类数据处理方法和数据处理设备


[0001]本专利技术涉及计算机通信领域,尤其涉及一种基于多线程的聚类数据处理方法和数据处理设备。

技术介绍

[0002]聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
[0003]聚类分析是把参数相似的数据(例如位置相近的3D点)分成不同的簇,其应用非常广泛包含数据挖掘、机器学习等。聚类分析的算法有很多种,其中有一些是基于数据的密度,例如基于密度的聚类算法(density

based spatial clustering of applications with noise,DBSCAN)。
[0004]DBSCAN的现有算法的计算复杂度是O(N2)即点数量的平方,一旦点数量加大,便非常耗时。

技术实现思路

[0005]本申请的提供一种基于多线程的聚类数据处理方法和数据处理设备,根据多线程处理,提高聚类数据处理的计算速度。
[0006]DBSCAN的现有算法的计算复杂度是O(N2)即点数量的平方,一旦点数量加大,便非常耗时,有鉴于此,本申请第一方面提供了一种基于多线程的聚类数据处理方法,所述基于多线程的聚类数据处理方法包括:配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述n组参数;所述n个线程分别处理所述n组参数,得到n个近邻点组;所述n个线程分别处理所述n个近邻点组完成聚类处理。基于多线程的聚类数据处理方法和数据处理设备,根据多线程处理,提高聚类数据处理的计算速度。
[0007]基于本申请实施例第一方面,本申请实施例第一方面的第一种实施方式中,所述n个线程分别处理所述n个近邻点组完成聚类处理包括:所述n个线程根据所述n个近邻点组计算得到n个簇;所述n个线程根据所述n个簇完成聚类处理。
[0008]基于本申请实施例第一方面的第一种实施方式,本申请实施例第一方面的第二种实施方式中,所述所述n个线程根据所述n个簇完成聚类处理包括:当相邻簇之间是否相等时,所述n个线程计算完成聚类处理。
[0009]基于本申请实施例第一方面至本申请实施例第一方面的第二种实施方式中任一实施方式,本申请实施例第一方面的第三种实施方式中,所述预设参数包括:近邻距离和每个簇的最小数量。
[0010]本申请第二方面提供了一种数据处理设备,所述数据处理设备包括:配置单元,用于配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述
n组参数;第一处理单元,包括所述n个线程分别处理所述n组参数,得到n个近邻点组;第二处理单元,包括所述n个线程分别处理所述n个近邻点组完成聚类处理。基于多线程的聚类数据处理方法和数据处理设备,根据多线程处理,提高聚类数据处理的计算速度。
[0011]基于本申请实施例第二方面,本申请实施例第二方面的第一种实施方式中,所述第二处理单元具体用于,所述n个线程根据所述n个近邻点组计算得到n个簇;所述n个线程根据所述n个簇完成聚类处理。
[0012]基于本申请实施例第二方面的第一种实施方式,本申请实施例第二方面的第二种实施方式中,所述第二处理单元具体用于,当相邻簇之间是否相等时,所述n个线程计算完成聚类处理。
[0013]基于本申请实施例第二方面至本申请实施例第二方面的第二种实施方式中任一实施方式,本申请实施例第二方面的第三种实施方式中,所述预设参数包括:近邻距离和每个簇的最小数量。
[0014]本申请实施例第三方面提供了一种基于多线程的聚类数据处理系统,其特征在于,所述基于多线程的聚类数据处理系统包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于多线程的聚类数据处理系统执行如本申请第一方面至第一方面任意一种可能的实现方式中所述的基于多线程的聚类数据处理方法。
[0015]本申请实施例第四方面提供了一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述基于多线程的聚类数据处理方法。
[0016]本申请实施例第五方面提供了一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述基于多线程的聚类数据处理方法。
[0017]本申请提供了一种基于多线程的聚类数据处理方法和数据处理设备,所述基于多线程的聚类数据处理方法包括:配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述n组参数;所述n个线程分别处理所述n组参数,得到n个近邻点组;所述n个线程分别处理所述n个近邻点组完成聚类处理。基于多线程的聚类数据处理方法和数据处理设备,根据多线程处理,提高聚类数据处理的计算速度。
附图说明
[0018]图1为本申请实施例中一种基于多线程的聚类数据处理方法的流程示意图;
[0019]图2为本申请实施例中一种基于多线程的聚类数据处理方法的示意图;
[0020]图3为本申请实施例中一种数据处理设备的功能模块图;
[0021]图4为本申请实施例中一种基于多线程的聚类数据处理设备的结构示意图。
具体实施方式
[0022]本申请实施例提供了一种基于多线程的聚类数据处理方法以及相关设备,旨在根
据多线程处理,提高聚类数据处理的计算速度。
[0023]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a、b和c可以是单个,也可以是多个。值得注意的是,“至少一项(个)”还可以解释成“一项(个)或多项(个)”。
[0024]需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多线程的聚类数据处理方法,其特征在于,所述基于多线程的聚类数据处理方法包括:配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述n组参数;所述n个线程分别处理所述n组参数,得到n个近邻点组;所述n个线程分别处理所述n个近邻点组完成聚类处理。2.根据权利要求1所述的基于多线程的聚类数据处理方法,其特征在于,所述n个线程分别处理所述n个近邻点组完成聚类处理包括:所述n个线程根据所述n个近邻点组计算得到n个簇;所述n个线程根据所述n个簇完成聚类处理。3.根据权利要求2所述的基于多线程的聚类数据处理方法,其特征在于,所述所述n个线程根据所述n个簇完成聚类处理包括:当相邻簇之间是否相等时,所述n个线程计算完成聚类处理。4.根据权利要求1至3中任一项所述的基于多线程的聚类数据处理方法,其特征在于,所述预设参数包括:近邻距离和每个簇的最小数量。5.一种数据处理设备,其特征在于,包括:配置单元,用于配置预设参数,所述预设参数为n组参数,n为大于等于2是正整数,n个线程分别对应所述n组参数;第一处理单元,包括所述n个线程分别处理所述n组参数,得到n个近邻点组;第二处理单元,包括所述n个线程分别处理所述n个近邻点组完成聚类处理。6.根据权利要求5所...

【专利技术属性】
技术研发人员:吴昆临许秋子
申请(专利权)人:深圳市瑞立视多媒体科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1