图结构大数据局部扩散更新算法制造技术

技术编号：13286247 阅读：43 留言：0更新日期：2016-07-09 02:22

本发明专利技术公开一种图结构大数据局部扩散更新算法，通过将图结构大数据分解描述为图结构大数据实体和实体间联系；采用分布式数据库HBase表存储大数据实体标识和实体间联系；借助队列缓冲相邻实体，通过更新深度控制更新循环，以欲更新开始实体为中心更新相邻实体属性。本发明专利技术与基于深度优先搜索和广度优先搜索的局部更新算法相比，有更快速度快，占用空间小，支持有向图和无向图大数据的局部数据更新，容易增加和删除维护实体间联系。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据处理方法，尤其涉及一种图结构大数据局部扩散更新算法。
技术介绍
在本专利中，图结构指数据结构中的图，具有多个前驱节点(父节点)和多个后继节点(子节点)，或者节点的联系是任意。节点由数据域构成，存储节点数据、前驱节点和后继节点指针(地址)。在基于图结构应用(如信息推送、广告投放、市场营销等领域)中，需要经常更新节点数据，数据更新在图结构数据非常重要。更新节点数据，就需要遍历图到欲更新节点。遍历到欲更新节点是数据局部更新的关键技术，遍历图的方法有深度优先搜索方法和广度优先搜索方法。相应地，图的局部更新可以采用基于深度优先搜索方法和广度优先搜索方法。深度优先搜索方法技术要点：从图中某个顶点出发，访问该顶点，依次从该顶点的未被访问的相邻顶点出发深度优先遍历图，直到图中所有和该顶点相通的顶点都被访问到；若图中尚有顶点未被访问，则选取图中一个未曾被访问顶点作为起点，重复上述过程，直至图中所有顶点都被访问为止。广度优先搜索方法技术要点：从图中某个顶点出发，访问该顶点，依次从该顶点的未被访问的相邻顶点出发广度优先遍历图，直到图中所有和该顶点相通的顶点都被访问到；若图中尚有顶点未被访问，则选取图中一个未曾被访问顶点作为起点，重复上述过程，直至图中所有顶点都被访问为止。数据局部更新采用广度优先搜索方法或深度优先搜索方法达到欲更新节点(图中的顶点)，不管是广度优先搜索方法还是深度优...

【技术保护点】
图结构大数据局部扩散更新算法，其特征在于：包括以下步骤：步骤1.分解图结构大数据:将图结构大数据分解描述为大数据实体和实体间联系；步骤2.存储数据：通过应用分布式数据库HBase表存储大数据实体和实体间联系；步骤3.初始化参数:包括欲更新开始实体标识、欲更新数据及在更新列族中的列成员、更新深度和队列；当前更新深度为0，队列为空；步骤4.根据欲更新开始实体标识，搜索欲更新开始实体，将欲更新开始实体插入队列中；当当前更新深度大于步骤3初始化的更新深度且队列为空时结束更新；步骤5.更新队首实体对应的HBase表中更新列族中的列成员；当队首实体未访问过的相邻实体深度大于更新深度时，转到步骤7；步骤6.向队列中添加队首实体的未访问过的相邻实体；步骤7.记录队首实体已被访问和队首实体的当前更新深度，删除队首实体元素；如果同一层相邻实体没有更新完成有以下两种处理方法，两种处理方法。任选其一：第一种，判断当前更新深度大于步骤3初始化的更新深度且队列为空是否成立，成立结束更新，否则转到步骤5；第二种是转到步骤5；步骤8.当前更新深度加1；当当前更新深度大于步骤3初始化的更新深度且队列为空时结束更新，否则转到骤5。...

【技术特征摘要】
1.图结构大数据局部扩散更新算法，其特征在于：包括以下步骤：
步骤1.分解图结构大数据:将图结构大数据分解描述为大数据实体和实
体间联系；
步骤2.存储数据：通过应用分布式数据库HBase表存储大数据实体和实
体间联系；
步骤3.初始化参数:包括欲更新开始实体标识、欲更新数据及在更新列
族中的列成员、更新深度和队列；当前更新深度为0，队列为空；
步骤4.根据欲更新开始实体标识，搜索欲更新开始实体，将欲更新开始
实体插入队列中；
当当前更新深度大于步骤3初始化的更新深度且队列为空时结束更新；
步骤5.更新队首实体对应的HBase表中更新列族中的列成员；
当队首实体未访问过的相邻实体深度大于更新深度时，转到步骤7；
步骤6.向队列中添加队首实体的未访问过的相邻实体；
步骤7.记录队首实体已被访问和队首实体的当前更新深度，删除队首实
体元素；
如果同一层相邻实体没有更新完成有以下两种处理方法，两种处理方法。
任选其一：
第一种，判断当前更新深度大于步骤3初始化的更新深度且队列为空是
否成立，成立结束更新，否则转到步骤5；
第二种是转到步骤5；
步骤8.当前更新深度加1；

【专利技术属性】
技术研发人员：胡自权，
申请(专利权)人：四川医科大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人