【技术实现步骤摘要】
一种基于聚集图的语义结构查询方法
本专利技术涉及一种基于聚集图的语义结构查询方法,属于数据挖掘领域。
技术介绍
图数据的表达能力特别强,连续几年越来越受到工业界和学术界的共同关注。在社会计算的大数据时代对图查询进行研究,其意义更加突出。目前的图查询都是基于大图、非压缩数据的,对于聚集图的查询仍然是值得研究的方向。海量的图数据需要高效的查询技术。目前大多数研究都是针对于原图直接查询,由于原图可能是一个内存比较大的数据,查询时耗时大,所占内存也比较大。
技术实现思路
本专利技术要解决的技术问题是提供一种基于聚集图的语义结构查询方法,目的在于在社交网络中查询针对研究比较有意义的语义结构;在降低空间开销的同时,具有较高的查询效率。本专利技术采用的技术方案是:一种基于聚集图的语义结构查询方法,包括如下步骤:数据预处理步骤:将庞大的社交网络和想要查找的语义结构用图的形式来表示,其中用点表示社交网络中的一员,点与点之间的边来表示每个人之间是否存在关系;图聚集步骤:将得到的社交网络的原图和想要查询的语义结构星形图用BUS聚集算法聚集成两个新的聚集图;匹配查询步骤:用邻接矩阵来存储聚集 ...
【技术保护点】
1.一种基于聚集图的语义结构查询方法,其特征在于:包括如下步骤:数据预处理步骤:将庞大的社交网络和想要查找的语义结构用图的形式来表示,其中用点表示社交网络中的一员,点与点之间的边来表示每个人之间是否存在关系;图聚集步骤:将得到的社交网络的原图和想要查询的语义结构星形图用BUS聚集算法聚集成两个新的聚集图;匹配查询步骤:用邻接矩阵来存储聚集图的图信息,利用星形图的超点间强关联与超点内部弱关联来匹配查询。
【技术特征摘要】
1.一种基于聚集图的语义结构查询方法,其特征在于:包括如下步骤:数据预处理步骤:将庞大的社交网络和想要查找的语义结构用图的形式来表示,其中用点表示社交网络中的一员,点与点之间的边来表示每个人之间是否存在关系;图聚集步骤:将得到的社交网络的原图和想要查询的语义结构星形图用BUS聚集算法聚集成两个新的聚集图;匹配查询步骤:用邻接矩阵来存储聚集图的图信息,利用星形图的超点间强关联与超点内部弱关联来匹配查询。2.根据权利要求1所述的基于聚集图的语义结构查询方法,其特征在于:所述数据预处理步骤,具体包括如下步骤:步骤110:将庞大的社交网络中的每一员看作一个端点,若成员有关注的关系则视为两个端点之间有边存在,并构成一个原图;步骤120:将两个以上人员关注同一人员的人员关系图表达为星形图,星形图来表示想要查询的语义结构。3.根据权利要求2所述的基于聚集图的语义结构查询方法,其特征在于:所述图聚集步骤,具体包括如下步骤:步骤210:将原图和想要查询的星形图利用BUS聚集算法进行聚集分别得到对应的聚集图,发现星形结构聚集之后都为超点与超点之间概率为1,其中一个超点内部只有一个点,另一个超点内部有大于等于2个数的点,且该超点内部为弱关联。4.根据权利要求2所述的基于聚集图的语义结构查询方法,其特征在于:所述图聚集步骤中BUS聚集算法采用自底向上凝聚分组,具体为:步骤220:每次选取两个分组进行凝聚,直至结果图的误差率不满足误差阈值为止,其中:1)两超点间可能存在的边总数Γij;2)两超点间实际存在的边的总数Ei...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。