基于最短路径和密度聚类的图分割方法技术

技术编号：11264617 阅读：83 留言：0更新日期：2015-04-08 10:13

本发明专利技术涉及一种基于最短路径和密度聚类的图分割方法，包括：1.将图G＝(V,E)上的任意两点间的距离定义为两点间的最短路径长度，由此获得一个定义了任意两点距离的距离空间；2.利用基于密度的聚类方法对上述步骤一得到的点集进行聚类，并将未能归类的噪声点归为一类；3.将步骤2得到的子集还原成原图分割后的子图。本发明专利技术能够确保分割后的子图具有连通性，且分割速度快，通用性佳。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种，包括：1.将图G＝(V,E)上的任意两点间的距离定义为两点间的最短路径长度，由此获得一个定义了任意两点距离的距离空间；2.利用基于密度的聚类方法对上述步骤一得到的点集进行聚类，并将未能归类的噪声点归为一类；3.将步骤2得到的子集还原成原图分割后的子图。本专利技术能够确保分割后的子图具有连通性，且分割速度快，通用性佳。【专利说明】
本专利技术涉及一种。
技术介绍
图论中的图是一种计算机科学中最常用的，适用范围很广的抽象数据结构。现实世界中的许多复杂关系都能够用图来表示，如蛋白质的分子结构，社交网络，电路布线等，与图相关的应用涉及了很多领域，传统的有最优运输路线的确定、疾病爆发路径的预测、科技文献的引用关系等；新兴的有社交网络分析、语义Web分析、生物信息网络分析等。图分割(Graph Partit1n)是指对给定图G= (V, E)的节点集合V进行划分。通常的目标是使得划分后，属于同一子图中的节点之间联系较为紧密，不同子图之间的联系较为松散，即子图内部的高耦合性，子图之间的低耦合性。这一技术可以运用于大规模图计算数据分割，社交网络中社区的发现等场景。近十几年来，随着互联网的普及和Web2.0技术的推动，网页数量增长迅猛，据CNNIC统计，2010年中国网页规模达到600亿，年增长率78.6%，而基于互联网的社交网络也后来居上，如全球最大的社交网络Facebook，已有约7亿用户，国内如QQ空间、人人网等，发展也异常迅猛。真实世界中实体规模的扩张，导致对应的图数据规模迅速增长，动辄有数十亿个顶点和上万...

【技术保护点】
一种基于最短路径和密度聚类的图分割方法，其特征在于，该方法包括如下步骤：a.设定图G＝(V,E)，V＝{vi}，每个节点vi的类别标记为0；b.判断V中所有节点的类别是否都不为0，如果V中有节点的类别为0，则随机选取一个类别为0的节点vj，并计算得到vj的邻域集合N(vj)；c.判断vj的邻域集合的密度|N(vj)|是否小于密度阈值minPt，如果vj的邻域集合的密度|N(vj)|不小于密度阈值minPt，则将vj的类别标记为k，并令集合X＝N(vj)，将vj从集合X中删除；d.判断集合X是否为空，当集合X不为空时，计算集合X中每个节点vm的邻域集合的密度|N(vm)|，当|N(vm)|不小于minPt时，将N(vm)中类别为0和‑1的节点加入到集合X中；e.对于V中的所有节点重复步骤b至步骤d，直至所有的节点都被标记为非0；f.将所有标记过的类别相同的节点归为一个子类，并将所有子类节点集合还原成子图。

【技术特征摘要】

【专利技术属性】
技术研发人员：李刚，宁立，张涌，
申请(专利权)人：中国科学院深圳先进技术研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人