【技术实现步骤摘要】
一种图数据的相似性度量方法、装置及介质
[0001]本专利技术涉及图数据处理
,更具体地,涉及一种图数据的相似性度量方法、装置及介质。
技术介绍
[0002]随着图数据在应用智能行业的兴起,近年来对图数据的研究在众多领域掀起了广泛的研究高潮。在此过程中,如何度量图数据的相似性、如何提交度量结果的认知程度等问题,成为了一系列研究工作的首要任务。针对图数据的相似性度量问题,在选取科学合理度量工具的基础上,如何充分利用数据的原始信息,对度量结果实现最大认知,是现有技术中需要解决的首要问题。
技术实现思路
[0003]提供了本专利技术以解决现有技术中存在的上述问题。因此,需要一种图数据的相似性度量方法、装置及介质,其能够针对图数据中普遍存在的一种数据类型,即无向无权图数据,利用熵作为基本的度量工具,实现任意两个图数据的相似性度量。
[0004]根据本专利技术的第一方案,提供了一种图数据的相似性度量方法,所述方法包括:获取两个图数据的节点关于属性信息的相似性;基于两个图数据的节点的属性信息指导,来确定具有 ...
【技术保护点】
【技术特征摘要】
1.一种图数据的相似性度量方法,其特征在于,所述方法包括:获取两个图数据的节点关于属性信息的相似性;基于两个图数据的节点的属性信息指导,来确定具有图数据关于属性信息相似性最大的节点对应;计算两个图数据关于边的角度相似性;计算两个图数据关于边的长度相似性;基于所述两个图数据关于边的角度相似性以及所述两个图数据关于边的长度相似性,来确定图数据的综合相似性。2.根据权利要求1所述的方法,其特征在于,所述获取两个图数据的节点关于属性信息的相似性之前,包括:对两个图数据的属性信息进行预处理,并使用降维后的二维属性信息定义图数据的二维坐标。3.根据权利要求1所述的方法,其特征在于,所述计算两个图数据关于边的角度相似性,包括:根据两个图数据节点的坐标,基于所述节点对应,分别计算出第一图数据的各个节点到对应的第二图数据的各个节点的边与x轴正半轴的角度,并按照与x轴正半轴的距离排序;角度归一化,形成概率集;计算各个节点对应的相对熵;将所述各个节点对应的相对熵求平均,得到所述第一图数据和所述第二图数据基于角度的相似性。4.根据权利要求1所述的方法,其特征在于,所述计算两个图数据关于边的长度相似性,包括:根据两个图数据节点的坐标,基于所述节点对应,分别计算出第一图数据的各个节点到对应的第二图数据的各个节点的边与x轴正半轴的长度,并按照与x轴正半轴的距离排序;长度归一化,形成概率集;计算各个节点对应的相对熵;将所述各个节点对应的相对熵求平均,得到所述第一图数据和所述第二图数据基于长度的相似性。5.根据权利要求1所述的方法,其特征在于,所述基于所述两个图数据关于边的角度相似性以及所述两个图数据关于边的长度相似性,来确定图数据的综合相似性,包括:基于所述两个图数据关于边的角度相似性以及所述两个图数据关于边的长度相似性,通过加权来确定图数据的综合相似性。6....
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。