【技术实现步骤摘要】
一种两类基于近似度分布的分层图抽样方法
本专利技术涉及图数据分析和应用
,尤其是一种两类基于近似度分布的分层图抽样方法。
技术介绍
随着,现实世界的众多应用与前所未有的方式和速度产生并积累着大量数据,图作为一种有效描述大数据的数据结构,扮演者越来越重要的角色。在社交网络分析、推荐网络分析等研究领域,许多计算问题都能转化为一个基于图的问题,如何准确地建模并高效地分析它们,逐渐成为数据分析领域的研究热点。在图模型中,自然界的实体被抽象为点,它们之间的关系被抽样成边,如何快速且高效地分析和挖掘图数据中蕴含的大量有价值的信息成为当前图数据分析领域的研究重点。不同学科从不同角度入手均进行了有价值地分析,计算机科学的飞速发展使得图分析与挖掘的研究工作取得了巨大的进展,优秀的研究成果层出不穷。近几年,由于大规模图分析应用领域的飞速发展,致使图数据规模急剧增长,抽样技术作为有效地数据规约方法被广泛应用,这都推动了计算机科学家对图抽样算法的研究。目前,图抽样算法大致分为三种类型:基于点选择策略的随机抽样算法、基于边选择策略的随机 ...
【技术保护点】
1.一种两类基于近似度分布的分层图抽样方法,其特征在于该分层图抽样方法具体包括以下步骤:/n步骤一:采用k-means聚类算法获取图中节点的近似度分布,并根据不同聚类簇内轮廓系数与聚类结果获得k-means算法中k的最优值,统计不同层内节点的个数,得出指定比例下某层抽取节点数目的阈值;/n步骤二:在图中采用基于边和基于随机游走的抽样策略,利用上述阈值筛选抽出的节点;/n步骤三:利用导出子图技术获取局部完整的抽样子图;/n步骤四:获取抽样子图中的特征参数,评价抽样结果的准确性。/n
【技术特征摘要】
1.一种两类基于近似度分布的分层图抽样方法,其特征在于该分层图抽样方法具体包括以下步骤:
步骤一:采用k-means聚类算法获取图中节点的近似度分布,并根据不同聚类簇内轮廓系数与聚类结果获得k-means算法中k的最优值,统计不同层内节点的个...
【专利技术属性】
技术研发人员:贺樑,朱君鹏,吴雯,
申请(专利权)人:华东师范大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。