【技术实现步骤摘要】
海量图数据上的路径模式查询系统
本专利技术涉及海量图数据查询
,尤其是涉及一种海量图数据上的路径模式查询系统。
技术介绍
现代社会中,图的应用越来越广泛,数据的管理技术已被广泛应用于各个领域。其中互联网、社交网络、生物信息学等领域,对海量图数据的高效管理有着很高的需求。如何有效的管理和应用这些大图数据成为当前本领域技术人员所面临的极大挑战。当今随着信息技术的发展和社交网络的兴起,图数据管理技术已成为数据管理领域的研究热点之一。图数据集上的高效查询处理技术,尤其是海量规模图数据上的查询处理,成为解决社交网络分析等大数据时代典型应用的重要基础。许多高效的图查询算法都直接或间接地依赖于两个节点之间特定模式路径的高效计算,例如,GraphGrep子图查询处理算法需要检索所有的长度不大于L的路径;化合物分类算法需要统计带有特定标签的路径;社交网络分析算法中,需要找出边的颜色符合给定正则表达式的路径。这类问题统称为路径模式查询处理,或路径模式匹配,是图数据管理和挖掘中的一项基本操作。正则表达式在文本模式匹配领域有很广泛的应用,其强大的表达能力使之同样适用于定义图的路径模 ...
【技术保护点】
一种海量图数据上的路径模式查询系统,包括数据存储服务模块、数据更新服务模块、协调服务模块、查询管理服务模块和并行计算服务模块,其中,所述数据存储服务模块,用于将图数据存储在分布式集群上,并为其他模块提供数据读取功能;所述数据更新服务模块,将更新的日志合并到数据文件中;所述协调服务模块,用于在计算过程中,协调服务负责机器间状态的同步;所述查询管理服务模块,用于对内管理各个成员机器,并进行查询的预处理、查询任务的分发,查询结果的收集;所述并行计算服务模块,用于实际执行查询的服务。
【技术特征摘要】
2013.05.13 CN 201310175785.11.一种海量图数据上的路径模式查询系统,其特征在于,包括数据存储服务模块、数据更新服务模块、协调服务模块、查询管理服务模块和并行计算服务模块,其中,所述数据存储服务模块使用HDFS分布式文件系统完成图数据的存储,用于将图数据存储在分布式集群上,并为其他模块提供数据读取功能;所述数据更新服务模块基于MapReduce将更新的日志合并到数据文件中;所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。