数据点的图聚类方法、装置、存储介质和设备制造方法及图纸

技术编号:36878204 阅读:26 留言:0更新日期:2023-03-15 20:55
本发明专利技术实施例提供一种数据点的图聚类方法、装置、存储介质和设备,其中,所述方法包括:计算数据点的总数,并生成可达距离矩阵,根据可达距离矩阵分别生成密度变化率矩阵和信号强度变化率矩阵,对密度变化率矩阵和信号强度变化率矩阵进行筛选,对筛选后的密度变化率矩阵和信号强度变化率矩阵进行求交集运算,获得可达邻点矩阵,根据可达邻点矩阵和预设噪声识别门限获得图聚类结果。当待测数据集包含多种类型特征的数据点且需要从多个维度进行聚类时,通过本发明专利技术能自适应的实现数据点聚类,降低人工调参的复杂度及计算结果对参数的依赖度,提高聚类结果的稳定性和可靠性,且计算快、计算效率高。计算效率高。计算效率高。

【技术实现步骤摘要】
数据点的图聚类方法、装置、存储介质和设备


[0001]本专利技术涉及机器学习
,尤其涉及一种数据点的图聚类方法、装置、存储介质和设备。

技术介绍

[0002]聚类算法是机器学习领域常见的一种无监督算法,针对不同特征的数据集或者学习任务,多种类型的聚类算法被提出并在实践中不断完善。其中,考虑数据点密度分布特征的算法不仅在聚类任务中表现出色,其在数据去噪任务中也有着良好的效果。
[0003]当前聚类算法中,基于数据点密度的算法大多考虑数据点之间的距离或特定范围内的数据点数量来作为聚类依据,如DBSACN算法将特定半径邻域内数据点数量小于预设值的样本归为噪声点,HDBSACN算法将样本数据点间的距离作为归类标准。其他聚类算法如谱聚类算法虽然没有将密度作为直接变量,而是使用不同簇数据点之间的相似性矩阵反应噪声点信息。但是,此类算法严重依赖参数的选择,效果稳定性差;且当数据点有独特的空间分布特征时,现有聚类算法往往存在过度去噪或过度聚类的情况,导致聚类结果划分不准确。

技术实现思路

[0004]有鉴于此,本专利技术提供一种数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据点的图聚类方法,其特征在于,所述方法包括:计算点云集合中数据点的总数n,并生成n个点相互可达距离矩阵;根据所述可达距离矩阵分别生成密度变化率矩阵和信号强度变化率矩阵;对所述密度变化率矩阵按照预设变化率门限进行筛选,对所述信号强度变化率矩阵按照预设变化率门限进行筛选;对筛选后的密度变化率矩阵和信号强度变化率矩阵进行求交集运算,获得可达邻点矩阵;根据所述可达邻点矩阵和预设噪声识别门限获得图聚类结果。2.根据权利要求1所述的方法,其特征在于,根据所述可达距离矩阵生成密度变化率矩阵包括:依据预设最小可达距离百分位数k在所述可达距离矩阵中查询每行第k个最小距离,并在所有行每行第k个最小距离中提取最小值,将所述最小值作为邻点查询半径;根据所述邻点查询半径及所述可达距离矩阵生成密度矩阵;根据所述密度矩阵生成密度变化率矩阵。3.根据权利要求1所述的方法,其特征在于,根据所述可达距离矩阵生成信号强度变化率矩阵包括:根据所述可达距离矩阵中各数据点的坐标信息生成目标方位矩阵;根据数据点的信号强度在空间分布中的衰减规律生成信号强度矩阵;根据所述目标方位矩阵和所述信号强度矩阵生成信号强度变化率矩阵。4.根据权利要求1所述的方法,其特征在于,对所述密度变化率矩阵按照预设变化率门限进行可达邻点筛选,对所述信号强度变化率矩阵按照预设变化率门限进行筛选,包括:将所述密度变化率矩阵中的密度变化率小于预设变化率门限时的数值设为1;将所述密度变化率矩阵中的密度变化率大于预设变化率门限时的数值为0;将所述信号强度变化率矩阵中信号强度变化率小于预设变化率门限的数值设为1;将所述信号强度变化率矩阵中信号强度变化率大于预设变化率门限的数值设为0。5.根据权利要求1所述的方法,其特征在于,所述预设噪声识别门限...

【专利技术属性】
技术研发人员:李银宝
申请(专利权)人:北京川速微波科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1