【技术实现步骤摘要】
数据处理装置的控制方法与装置
[0001]本申请涉及数据处理领域,并且更具体地,涉及一种数据处理装置的控制方法与装置。
技术介绍
[0002]图挖掘算法是一种代表性的图处理算法与数据挖掘算法,用于在完整的图数据结构中查找特定子图模式并统计该子图模式的出现频次。图挖掘算法应用广泛,常见的应用案例包括社交媒体中社区网络分析、生物信息学中蛋白质分析、计算化学领域中的药物发现等。
[0003]可以利用一个点的邻居集合表示关系图中该点与其他点之间是否存在关系。该点的邻居集合包括多个数,每个数的值为与该点具有关系的点的序号。在进行图挖掘的过程中,可以利用数据处理装置对关系图中两个点的邻居集合进行比较,确定其中相等的序号。该相等的序号即为关系图中与两个点都具有关系的点的序号。
[0004]数据处理装置的处理能力有限。一般情况下,数据处理装置可以对包括数的数量均不超过预设值的两个列索引进行比较。在两个列索引中的某个列索引中数的数量超过预设值的情况下,需要对该某个列索引中的数进行分组以得到多个数组。之后,可以利用数据处理装置对该多个数组分别与该两个列索引中的另一个列索引进行比较。
[0005]对该多个数组分别与该两个列索引中的另一个列索引进行比较,运算量较大,所需的处理时间较长。
技术实现思路
[0006]本申请提供一种数据处理装置的控制方法和装置,能够降低运算量,缩短数据处理时间。
[0007]第一方面,提供一种数据处理装置的控制方法,其特征在于,所述方法包括:获取第一目标数据组和第二 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理装置的控制方法,其特征在于,所述方法包括:获取第一目标数据组和第二目标数据组,所述第一目标数据组为第一数据集合的多个第一数据组中的第一个数据组,所述第二目标数据组为第二数据集合的至少一个第二数据组中的第一个数据组,所述第一数据集合和所述第二数据集合的每个数据集合中的每个数据组包括至少一个数据,每个数据包括关键值,每个数据集合中的所述数据组是按照第一顺序或第二顺序排列的,在按照所述第一顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均小于位于所述任一个数据组之后的数据组中每个关键值,在按照所述第二顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均大于位于所述任一个数据组之后的数据组中每个关键值;进行多次迭代,每次迭代包括:将所述第一目标数据组和所述第二目标数据组输入所述数据处理装置,所述数据处理装置用于确定所述第一目标数据组和所述第二目标数据中相等的所述关键值;在每个数据集合中的所述数据组按照所述第一顺序排列,且第一关键值小于或等于第二关键值的情况下,或者,在每个数据集合中的所述数据组按照所述第二顺序排列,且第三关键值大于或等于第四关键值的情况下,获取所述第一数据集合中位于所述第一目标数据组之后的第一数据组作为所述第一目标数据组,所述第一关键值为所述第一目标数据组中最大的关键值,所述第二关键值为所述第二目标数据组中最大的关键值,所述第三关键值为所述第一目标数据组中最小的关键值,所述第四关键值为所述第二目标数据组中最小的关键值。2.根据权利要求1所述的方法,其特征在于,至少一个第二数据组的数量为多个,在每个数据集合中的所述数据组按照所述第一顺序排列,且所述第一关键值大于或等于所述第二关键值的情况下,或者,在每个数据集合中的所述数据组按照所述第二顺序排列,且所述第三关键值小于或等于所述第四关键值的情况下,获取所述第二数据集合中位于所述第二目标数据组之后的第二数据组作为第二目标数据组。3.根据权利要求1或2所述的方法,其特征在于,所述数据处理装置包括处理矩阵,所述处理矩阵包括v
×
v个处理单元,v为正整数,第一目标数据组和第二目标数据组中每个目标数据组中至少一个数据的数量小于或等于v,所述第一目标数据组中的第i个第一数据是在所述迭代的第j个输入周期输入位于第一边缘的v个所述处理单元中沿第二方向的第j个所述处理单元的,所述第二目标数据中的第p个第二数据是在所述迭代的第q个输入周期输入位于第二边缘的v个所述处理单元中沿第一方向的第q个所述处理单元的,所述第一边缘与所述第二边缘相邻,每个目标数据组中不同的所述数据输入的所述处理单元不同,所述第一方向为从所述第二边缘指向所述处理矩阵内部且垂直所述第二边缘的方向,所述第二方向为从所述第一边缘指向所述处理矩阵内部且垂直所述第一边缘的方向,i、j、p、q均为正整数;所述处理矩阵中的每个处理单元用于,确定在同一个所述输入周期输入所述处理单元的第一数据中的所述关键值与第二数据中的所述关键值是否相等;在v大于1的情况下,所述处理矩阵中的每个处理单元还用于,在接收所述第一数据和所述第二数据的下一个输入周期,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,将所述第二数据传输至沿所述第二方向的下一个所述处理单元。
4.根据权利要求3所述的方法,其特征在于,每个数据集合中不同的数据中的所述关键值不同,所述处理矩阵中的每个处理单元用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值不相等的情况下,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,并将所述第二数据传输至沿所述第二方向的下一个所述处理单元。5.根据权利要求3或4所述的方法,其特征在于,所述数据处理装置还包括过滤矩阵,所述过滤矩阵包括v个过滤单元,所述v个过滤单元分别位于所述处理矩阵沿所述第一方向的v行中每一行沿所述第二方向的最后一个处理单元之后,所述处理矩阵中的每个处理单元还用于:在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,在接收所述第一数据和所述第二数据的下一个所述输入周期,将所述处理单元的处理结果沿所述第二方向传输至下一个单元,所述单元为所述处理单元或所述过滤单元,所述处理结果包括相等的所述关键值;或者,在接收所述处理结果的下一个所述输入周期,将所述处理结果沿所述第二方向传输至下一个单元;所述方法还包括:在所述第一关键值大于或等于所述第二关键值的情况下,控制沿所述第一方向的所述v个过滤单元按照所述输入周期依次输出所述第二目标数据组对应的所述处理结果。6.根据权利要求5所述的方法,其特征在于,所述数据处理装置还包括压缩三角矩阵,所述压缩三角矩阵包括沿所述第一方向的v行压缩单元,沿所述第一方向所述压缩单元的数量逐行增加,所述多个压缩单元中的每个压缩单元用于:接收沿所述第二方向所述压缩单元之前的所述过滤单元输出的所述处理结果,或者,接收沿所述第一方向上一行的所述压缩单元输出的所述处理结果;在接收所述处理结果的下一个所述输入周期,向沿所述第一方向下一行的所述压缩单元传输所述处理结果。7.根据权利要求3
‑
6中任一项所述的方法,其特征在于,不同的所述关键值对应于关系图中不同的点集,所述第一数据用于表示关系图中第一目标点与所述第一数据中的所述关键值对应的所述点集中的至少一个点之间是否具有关系,所述第二数据用于表示关系图中第二目标点与所述第二数据中的所述关键值对应的所述点集中的至少一个点之间是否具有关系,每个处理矩阵还用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,输出处理结果,所述处理结果用于指示所述关系图中的查询点,所述查询点与所述两个目标点的之间的关系情况符合预设情况。8.根据权利要求3
‑
7中任一项所述的方法,其特征在于,所述第一数据还包括所述关键值对应的所述第一目标点的第一关系值组,所述第二数据还包括所述关键值对应的所述第二目标点的第二关系值组,所述处理矩阵中的每个处理单元还用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,对所述第一关系值组和所述第二关系值组的各个位分别进行预设运算,相等的所述关键值对应的所述第一关系值组和第二关系值组中相同的位
对应于所述相等的关键值对应的所述点集中相同的所述点,每个位的所述预设运算的结果用于指示所述位对应的所述点与所述两个目标点之间的关系情况是否符合所述预设情况。9.根据权利要求1
‑
8中任一项所述的方法,其特征在于,在每个数据集合中的所述数据组按照所述第一顺序排列的情况下,每个第一数据组中的所述关键值从小到大排列;在每个数据集合中的所述数据组按照所述第二顺序排列的情况下,每个第一数据组中的所述关键值从大到小排列。10.一种数据处理装置的控制装置,其特征在于,包括:获取模块和处理模块,所述获取模块用于,获取第一目标数据组和第二目标数据组,所述第一目标数据组为第一数据集合的多个第一数据组中的第一个数据组,所述第二目标数据组为第二数据集合的至少一个第二数据组中的第一个数据组,所述第一数据集合和所述第二数据集合的每个数据集合中的每个数据组包括至少一个数据,每个数据包括关键值,每个数据集合中的所述数据组是按照第一顺序或第二顺序排列的,在按照所...
【专利技术属性】
技术研发人员:戴国浩,朱振华,汪玉,肖世海,傅天予,张学仓,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。