一种有向网络快速查询算法制造技术

技术编号:15763233 阅读:139 留言:0更新日期:2017-07-06 00:29
本发明专利技术公开了一种有向网络快速查询算法,涉及数据结构处理技术领域,解决了现有有向网络响应速度慢的问题。该有向网络快速查询算法包括有向网节点基础数据结构定义模块、层次关系提取模块、最短路径并行编码模块和节点子群数据检索模块,层次关系提取模块包含循环处置单元、子群重叠处置单元、最短路径提取单元、层次树结构索引构建单元和层次关系索引构建单元。本发明专利技术的算法查询效率高,处理速度快,可支持10亿级实体及关系的精确检索和毫秒级响应,可广泛应用于有网络拓扑结构的数据层次关系抽取和检索需求的各类真实场景。适用于分布式并行计算的有向网节点层次结构查询算法,响应速度相比传统递归遍历方法有大幅提升。

A fast query algorithm for directed networks

The invention discloses a directed network fast inquiry algorithm, which relates to the technical field of data structure processing, and solves the problem of slow response speed of the existing directed network. The directed network query algorithm including the relationship module, to network node based data structure to define hierarchical extraction module, encoding module and data retrieval module node subgroup parallel shortest path, hierarchical extraction module contains a circular disposal unit, processing unit, overlapping subgroups of the shortest path extraction unit, a hierarchical tree structure index and the level of construction unit the relationship between index construction unit. The invention of the query algorithm with high efficiency, fast processing speed, can support 1 billion entities and relationship between accurate retrieval and millisecond response, can be widely used in all kinds of real scene data extraction hierarchical network topology structure and retrieval requirements. The directed network node hierarchical query algorithm is suitable for distributed parallel computing, and the response speed is greatly improved compared with the traditional recursive traversal method.

【技术实现步骤摘要】
一种有向网络快速查询算法
本专利技术涉及数据结构处理
,尤其涉及一种响应快速的有向网络快速查询算法。
技术介绍
真实世界中很多自然、社会系统都可以用复杂网络来描述,如生物信息网、链接跳转网,社交媒体转发网,科研协作网等。网络研究的基础是节点间具有相关关系,其关系可以是无向的,也可以是有向的。无向网中边只表示两节点相关,而有向网中的边所联系的两个节点在一个相关关系中存在发出者和接收者的区别。在已有的有向网的节点关系研究中,研究人员主要是从一系列具有相同属性的节点的集合角度发现网络中隐藏着的有用信息,即从子群识别的方向对网络结构进行研究。子群识别有助于更好的理解网络结构,尤其是以层次聚类分析为主要切入点的子群识别在对全局进行节点划分的同时也对子群内部节点间层次关系进行了还原,最终生成若干子群树结构或树图,对于研究子群结构、网络结构的进化和演变具有重要意义。因此,网络层次结构识别技术在信息检索、社会化分析、知识图谱、系统安全领域具有重要意义,其常见应用有(但不仅限于)知识库领域本体、知识元定位,限制用户的系统安全作用域,社交群体快速查找等。用于有向网节点层次关系识别的算法有G-N算法、Radicchi算法及快速凝聚算法,由于其主要以节点边的复杂计算为主,时间复杂度较高。以G-N算法为例,计算一个包含m个节点n条边的网络,运行一次的时间复杂程度为O(m2n),通常节点数量超过1000就可能出现响应速度过慢的情况,不适用于大规模网络的节点结构层次分析。另一方面,随着网络技术的快速发展,传统的网络服务架构己经由单一的网站逐渐向分布式发展。微服务就是指可以部署在单个或多个服务器上的单个小型但有业务功能的服务,每个服务都有自己的处理和轻量通讯机制。微服务架构风格是一类将单一应用程序作为由众多小型服务构成之套件加以开发的方式,其中各项服务都拥有自己的进程并利用轻量化机制实现通信。这些服务围绕业务功能建立而成,且凭借自动化部署机制实现独立部署。微服务的优势在于弱耦合,在开发阶段或部署阶段相对独立,能部署中低端配置的服务器上,实现起来复杂程度低且易于理解、修改和维护,方便即时扩展。
技术实现思路
本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种有向网络快速查询算法。为了实现上述目的,本专利技术采用了如下技术方案:一种有向网络快速查询算法,其包括如下四大模块:有向网节点基础数据结构定义模块,包含节点(Id,pid,name)单元;层次关系提取模块,包含循环处置单元、子群重叠处置单元、最短路径提取单元、层次树结构索引构建单元和层次关系索引构建单元;其中,最短路径提取单元的最短路径选取步骤是,给一个包含n个点,m条边的有向连通图,遍历所有节点并返回,对应特定一个节点,选择总长度最短的路径,若有多条长度最短的路径,则选择经过的顶点序列距离最小的那条路径,到达该点后按原路返回,然后往其他点走,直到所有点都走过;层次关系索引构建单元,包含节点增加子单元Add(Pid,节点子群)、节点删除子单元Del(Pid,节点子群)、节点修改子单元Modify(pid,节点子群)和节点创建子单元Create(节点子群);最短路径并行编码模块;节点子群数据检索模块,包括节点子群查询单元subset(Pid)、域查询单元search(Pid,name)、路径查询单元path(id)。应用该技术,使有向网络查询转换为二级索引查询,计算效率和速度大大提升。本专利技术的有益效果:本专利技术公开了一种适用于分布式并行计算的有向网节点层次结构重建及快速查询算法,属于数据处理技术,数据结构与算法创新领域。此算法查询效率高,处理速度快,可支持10亿级实体及关系的精确检索和毫秒级响应,可广泛应用于有网络拓扑结构的数据层次关系抽取和检索需求的各类真实场景。适用于分布式并行计算的有向网节点层次结构查询算法,用以支持大规模数据集(10亿级)节点层次结构的识别抽取及精确检索,响应速度相比传统递归遍历方法有大幅提升。附图说明图1为本专利技术的进行快速查询的流程图。图2为本专利技术有向网络查询转换为二级索引查询的原理图。具体实施方式:下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。本专利技术提供了一种有向网络快速查询算法,其包括如下四大模块:有向网节点基础数据结构定义模块,包含节点(Id,pid,name)单元;层次关系提取模块,包含循环处置单元、子群重叠处置单元、最短路径提取单元、层次树结构索引构建单元和层次关系索引构建单元;其中,最短路径提取单元的最短路径选取步骤是,如图2所示,给一个包含n个点,m条边的有向连通图,遍历所有节点并返回,对应特定一个节点,选择总长度最短的路径,若有多条长度最短的路径,则选择经过的顶点序列距离最小的那条路径,到达该点后按原路返回,然后往其他点走,直到所有点都走过;层次关系索引构建单元,包含节点增加子单元Add(Pid,节点子群)、节点删除子单元Del(Pid,节点子群)、节点修改子单元Modify(pid,节点子群)和节点创建子单元Create(节点子群);最短路径并行编码模块;节点子群数据检索模块,包括节点子群查询单元subset(Pid)、域查询单元search(Pid,name)、路径查询单元path(id)。如图1所示,为本专利技术进行快速查询的流程图。具体实施时,可进行大规模知识图谱的快速查找,基于知识图谱构建技术,用户画像分析生成500万用户的近亿节点-关系的特征画像知识图谱,能自适应生成最短路径树结构数据集。在基于用户标签协同过滤的导医推荐任务中,基于该算法的自适应子群查找和快速检索优化特性,大大提高了实时性和检索效率。本专利技术公开了一种有向网络快速查询算法,适用于分布式并行计算的有向网节点层次结构重建,属于数据处理技术,数据结构与算法创新领域。此算法查询效率高,处理速度快,可支持10亿级实体及关系的精确检索和毫秒级响应,可广泛应用于有网络拓扑结构的数据层次关系抽取和检索需求的各类真实场景。适用于分布式并行计算的有向网节点层次结构查询算法,用以支持大规模数据集(10亿级)节点层次结构的识别抽取及精确检索,响应速度相比传统递归遍历方法有大幅提升。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,根据本专利技术的技术方案及其专利技术构思加以等同替换或改变,都应涵盖在本专利技术的保护范围之内。本文档来自技高网
...
一种有向网络快速查询算法

【技术保护点】
一种有向网络快速查询算法,其特征在于,包括如下四大模块:有向网节点基础数据结构定义模块,包含节点(Id,pid,name)单元;层次关系提取模块,包含循环处置单元、子群重叠处置单元、最短路径提取单元、层次树结构索引构建单元和层次关系索引构建单元;其中,最短路径提取单元的最短路径选取步骤是,给一个包含n个点,m条边的有向连通图,遍历所有节点并返回,对应特定一个节点,选择总长度最短的路径,若有多条长度最短的路径,则选择经过的顶点序列距离最小的那条路径,到达该点后按原路返回,然后往其他点走,直到所有点都走过;层次关系索引构建单元,包含节点增加子单元Add(Pid,节点子群)、节点删除子单元Del(Pid,节点子群)、节点修改子单元Modify(pid,节点子群)和节点创建子单元Create(节点子群);最短路径并行编码模块;节点子群数据检索模块,包括节点子群查询单元subset(Pid)、域查询单元search(Pid,name)、路径查询单元path(id)。

【技术特征摘要】
1.一种有向网络快速查询算法,其特征在于,包括如下四大模块:有向网节点基础数据结构定义模块,包含节点(Id,pid,name)单元;层次关系提取模块,包含循环处置单元、子群重叠处置单元、最短路径提取单元、层次树结构索引构建单元和层次关系索引构建单元;其中,最短路径提取单元的最短路径选取步骤是,给一个包含n个点,m条边的有向连通图,遍历所有节点并返回,对应特定一个节点,选择总长度最短的路径,若有多条长度最短的路径,则选择经过的顶点序列...

【专利技术属性】
技术研发人员:翁衡林瑞生练文华
申请(专利权)人:广东省中医院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1