当前位置: 首页 > 专利查询>中南大学专利>正文

散点图相似性度量方法、终端设备及存储介质技术

技术编号:36225420 阅读:16 留言:0更新日期:2023-01-04 12:24
本发明专利技术公开了一种散点图相似性度量方法、终端设备及存储介质,使用PointNet作为特征提取器,并将采样操作融入相似性度量方法中,借助PointNet在二维点云上进行对比学习训练,使用点云数据作为输入能使度量结果独立于散点图的可视化表示,让网络能够学习到散点数据本身的特征;采样操作能使不规则的点云数据更好地配合PointNet;不同的数据增强操作引导网络的学习方向,以度量散点图不同维度上的相似性。本发明专利技术不需要带标签的数据,解决了人工获得标签成本高,以及不同人主观判断的不同而使结果产生偏差的问题。结果产生偏差的问题。结果产生偏差的问题。

【技术实现步骤摘要】
散点图相似性度量方法、终端设备及存储介质


[0001]本专利技术涉及一种散点图相似性度量技术,特别是一种散点图相似性度量方法、终端设备及存储介质。

技术介绍

[0002]目前散点图相似性度量的基本思想是:对输入的散点图数据进行特征计算,通过特征之间的距离来度量散点图的相似性。根据输入数据的类型和特征计算的原理,现有的度量方法可以分为下面四类:(1)基于散点图图像的传统计算方法;(2)基于散点图点云数据的传统计算方法;(3)基于散点图图像的深度学习方法;(4)基于散点图点云数据的深度学习方法。
[0003]基于散点图图像数据的方法使用渲染后的散点图图片数据作为输入,但这类基于图片数据的方法的度量结果会受到可视化表示(如点的大小、形状、颜色、坐标轴的选择等)的影响,这会使散点图数据本身的一些特性被忽略;基于散点图点云数据的方法使用原始的散点数据作为输入,即数据中只包含每个点的坐标信息,这样最后的度量结果可以独立于可视化的表示;基于传统计算的方法通过一些手工设计的特征描述符来计算输入数据的特征,但只能度量那些可以手工计算的维度上相似性;基于深度学习的方法利用深度神经网络从输入数据中自动提取特征,这样在那些难以手工计算的维度上也可以进行相似性度量。
[0004]基于散点图图像的传统计算方法:Tatu等人[1]开发了许多图像处理方法来量化关联度和类别分离度,即散点图中(彩色)类别的分离程度。Lehmann等人[2]利用一种贪心的方法,让用户可以在大空间中交互地找到大量相关的图。Shao等人[3]出了一种基于基序的匹配和排序方案,以便于使用从现有散点图中提取的一组基本图像块来查询特定模式。
[0005]基于散点图点云数据的传统计算方法:Scagnostics(散点图诊断)描述了散点图点云中的某些属性的一系列度量,这个术语和想法是由John Tukey和Paul Tukey创造的,尽管他们并没有发表。后来Wilkinson等人[4]基于高维散点数据图论的最新进展,对 Scagnostics进行了详细的阐述并给出了具体的计算方法,其中定义了9个人造特征(如数据分布、密度、形状、单调性等)用来描述散点图。Sips等人[5]提出了两种质量测量方法,通过重心和空间分布熵来量化类一致性。Reshef等人[6]开发了最大信息系数(MIC) 评分,以检测变量对之间的线性和非线性关联。
[0006]基于散点图图像的深度学习方法:Ma等人[7]利用人类视觉感知信息来模拟主观相似性。其核心思想是利用人类对散点图相似性的判断作为训练数据,并利用最先进的深度神经网络从散点图图像中自动构建特征。卷积神经网络能够通过调整其内部参数从大规模数据中学习丰富的语义特征。
[0007]基于散点图点云数据的深度学习方法:[8]等人使用CNN提出了一种新的基于人类感知的视觉质量度量来评价散点图中的相关性,并对散点图的可视化维度的相关性进行评级。
[0008]以上深度学习的方法也存在着一些问题:(1)需要一个巨大的带标签的数据集来引导网络的学习方向,而人工生成这些标签的成本非常高;(2)每个人主观判断的差异会使结果产生偏差;(3)可拓展性差,只能根据标签信息提取特点维度的特征,当想要度量其他维度时需要重新打标签。

技术实现思路

[0009]本专利技术所要解决的技术问题是,针对现有技术不足,提供一种散点图相似性度量方法、终端设备及存储介质,有效解决现有技术有监督学习中获得标签成本高的问题。
[0010]为解决上述技术问题,本专利技术所采用的技术方案是:一种散点图相似性度量方法,包括以下步骤:
[0011]S1、获取多个散点图的原始点云数据集S;
[0012]S2、对所述原始点云数据集S中的每个散点图进行采样,获得采样后的数据集P;
[0013]S3、对所述数据集P中的每个散点图进行数据增强,获得增强数据集P';
[0014]S4、将所述数据集P和增强数据集P'分别作为PointNet网络的输入,提取数据集P和增强数据集P'的特征,得到第一特征集H和第二特征集H';
[0015]S5、计算第一特征集H和第二特征集H'的相似度,得到相似度矩阵V;
[0016]S6、利用所述相似度矩阵V计算PointNet网络的对比损失函数L;
[0017]S7、最小化所述对比损失函数L,优化所述PointNet网络的参数。
[0018]本专利技术基于PointNet和对比学习提出了一种散点图相似性度量模型,可以利用优化参数后的PointNet网络提取散点图的特征,进而计算特征之间的相似度。PointNet可以让网络使用散点图点云数据作为输入。本专利技术的无监督对比学习有效地解决了现有技术有监督学习中获得标签成本高的问题,确定的数据增强方法保证了最后结果的客观性,不同的数据增强方法的选择能够提取各种不同维度的特征。本专利技术将采样技术引入相似性度量方法中,在保证相似性度量结果准确性和稳定性的前提下,有效地降低了网络的复杂度。
[0019]为了进一步优化PointNet网络,提高相似性度量结果的准确性,本专利技术的方法还包括:
[0020]S8、重复步骤S4~S7,当达到预设的迭代次数或对比损失函数L收敛时,得到散点图的特征提取网络。
[0021]本专利技术中,利用所述散点图的特征提取网络提取散点图的特征,并计算特征之间的距离,获取散点图之间的相似性。
[0022]本专利技术上述步骤S1中,所述原始点云数据集S的格式为[n,m,2],其中n为原始点云数据集中散点图的数量,m表示每个散点图中点的个数,2表示每个散点图的坐标是二维的。
[0023]本专利技术上述步骤S2中,采样后的数据集P的格式为[n,t,2],t表示采样后每个散点图中点的个数。
[0024]步骤S5中,所述相似度计算公式为:
[0025][0026]其中,其中a和b都是k维特征向量,且a∈H,b∈H'。
[0027]步骤S6中,所述对比损失函数L的表达式为:
[0028][0029]其中,数据集P中一共有n个散点图,数据集P'为相应的n个增强后的散点图集。x表示P中的一个散点图。对于每个x,都有对应的x+∈P'为其在增强集P'中相应的增强后的散点图。则每个散点图x都有1个正例对(x,x+)。而x

∈P∪P',(x
‑ꢀ
≠x且x

≠x+),则每个散点图x都有2n

2个负例对(x,x

)。公式中函数g()表示散点图特征提取函数,即PointNet;函数sim()表示计算提取的特征之间的相似度。
[0030]一种终端设备,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本专利技术上述方法的步骤。
[0031]一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本专利技术上述方法的步骤。
[0032]与现有技术相比,本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种散点图相似性度量方法,其特征在于,包括以下步骤:S1、获取多个散点图的原始点云数据集S;S2、对所述原始点云数据集S中的每个散点图进行采样,获得采样后的数据集P;S3、对所述数据集P中的每个散点图进行数据增强,获得增强数据集P';S4、将所述数据集P和增强数据集P'分别作为PointNet网络的输入,提取数据集P和增强数据集P'的特征,得到第一特征集H和第二特征集H';S5、计算第一特征集H和第二特征集H'的相似度,得到相似度矩阵V;S6、利用所述相似度矩阵V计算PointNet网络的对比损失函数L;S7、最小化所述对比损失函数L,优化所述PointNet网络的参数。2.根据权利要求1所述的散点图相似性度量方法,其特征在于,还包括:S8、重复步骤S4~S7,当达到预设的迭代次数或对比损失函数L收敛时,得到散点图的特征提取网络。3.根据权利要求2所述的散点图相似性度量方法,其特征在于,利用所述散点图的特征提取网络提取散点图的特征,并计算特征之间的距离,获取散点图之间的相似性。4.根据权利要求1所述的散点图相似性度量方法,其特征在于,步骤S1中,所述原始点云数据集S的格式为[n,m,2],其中n为原始点云数据集中散点图的数量,m表示每个散点图中点的个数,2表示每个散点图的坐标是二维的。5.根据权利要求4所述的散点图相似性度量方法,其特征在于,步骤S2中,采样后的数...

【专利技术属性】
技术研发人员:奎晓燕唐航杜华坤张潮邹北骥廖胜辉
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1