当前位置: 首页 > 专利查询>清华大学专利>正文

数据处理装置的控制方法与装置制造方法及图纸

技术编号:39300014 阅读:11 留言:0更新日期:2023-11-12 15:51
本申请公开了一种数据处理装置的控制方法和装置,能够降低处理时间。该方法包括:获取两个目标数据组,该两个目标数据组分别为两个数据集合中第一个数据组,其中第一数据集合中第一数据组为多个,数据集合中任一个数据组的关键值均小于位于该任一个数据组之后的数据组中各个所述关键值,在第一目标数据组最大关键值小于或等于第二目标数据组最大关键值的情况下,将位于第一目标数据组的下一个第一数据组作为第一目标数据组。从而,能够降低运算量,提高运算效率。提高运算效率。提高运算效率。

【技术实现步骤摘要】
数据处理装置的控制方法与装置


[0001]本申请涉及数据处理领域,并且更具体地,涉及一种数据处理装置的控制方法与装置。

技术介绍

[0002]图挖掘算法是一种代表性的图处理算法与数据挖掘算法,用于在完整的图数据结构中查找特定子图模式并统计该子图模式的出现频次。图挖掘算法应用广泛,常见的应用案例包括社交媒体中社区网络分析、生物信息学中蛋白质分析、计算化学领域中的药物发现等。
[0003]可以利用一个点的邻居集合表示关系图中该点与其他点之间是否存在关系。该点的邻居集合包括多个数,每个数的值为与该点具有关系的点的序号。在进行图挖掘的过程中,可以利用数据处理装置对关系图中两个点的邻居集合进行比较,确定其中相等的序号。该相等的序号即为关系图中与两个点都具有关系的点的序号。
[0004]数据处理装置的处理能力有限。一般情况下,数据处理装置可以对包括数的数量均不超过预设值的两个列索引进行比较。在两个列索引中的某个列索引中数的数量超过预设值的情况下,需要对该某个列索引中的数进行分组以得到多个数组。之后,可以利用数据处理装置对该多个数组分别与该两个列索引中的另一个列索引进行比较。
[0005]对该多个数组分别与该两个列索引中的另一个列索引进行比较,运算量较大,所需的处理时间较长。

技术实现思路

[0006]本申请提供一种数据处理装置的控制方法和装置,能够降低运算量,缩短数据处理时间。
[0007]第一方面,提供一种数据处理装置的控制方法,其特征在于,所述方法包括:获取第一目标数据组和第二目标数据组,所述第一目标数据组为第一数据集合的多个第一数据组中的第一个数据组,所述第二目标数据组为第二数据集合的至少一个第二数据组中的第一个数据组,所述第一数据集合和所述第二数据集合的每个数据集合中的每个数据组包括至少一个数据,每个数据包括关键值,每个数据集合中的所述数据组是按照第一顺序或第二顺序排列的,在按照所述第一顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均小于位于所述任一个数据组之后的数据组中每个关键值,在按照所述第二顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均大于位于所述任一个数据组之后的数据组中每个关键值;进行多次迭代,每次迭代包括:将所述第一目标数据组和所述第二目标数据组输入所述数据处理装置,所述数据处理装置用于确定所述第一目标数据组和所述第二目标数据中相等的所述关键值;在每个数据集合中的所述数据组按照所述第一顺序排列,且第一关键值小于或等于第二关键值的情况下,获取所述第一数据集合中位于所述第一目标数据组之后的第一数据组作为所述第一目标数据组,所述第一关键
值为所述第一目标数据组中最大的关键值,所述第二关键值为所述第二目标数据组中最大的关键值;在每个数据集合中的所述数据组按照所述第二顺序排列,且第三关键值大于或等于第四关键值的情况下,获取所述第一数据集合中位于所述第一目标数据组之后的第一数据组作为所述第一目标数据组,所述第三关键值为所述第一目标数据组中最小的关键值,所述第四关键值为所述第二目标数据组中最小的关键值。
[0008]对于两个数据集合,每个数据集合中各个数据组是按照关键值的大小顺序排列的,在利用数据处理装置进行数据处理时,在其中第一数据集合中第一数据组的数量为多个的情况下,通过迭代,对于各个关键值均超过第二目标数据组中关键值范围的第一数据组,可以不再输入数据处理装置,即不再与第二目标数据组进行比较,降低与第二目标数据组进行比较的第一数据组的数量,从而降低运算量。
[0009]在多个第一数据组中关键值从小到大排列的情况下,第二目标数据组中关键值范围可以属于小于或等于第二目标数据组中最大的关键值。也就是说,在第一目标数据组中关键值的最大值大于或等于第二目标数据组中关键值的最大的情况下,可以不再将后续的第一数据组作为第一目标数据组与该第二目标数据组进行比较。
[0010]在多个第一数据组中关键值从大到小排列的情况下,第二目标数据组中关键值范围可以属于大于或等于第二目标数据组中最小的关键值。也就是说,在第一目标数据组中关键值的最小值小于或等于第二目标数据组中关键值的最大的情况下,可以不再将后续的第一数据组作为第一目标数据组与该第二目标数据组进行比较。
[0011]结合第一方面,在一些可能的实现方式中,至少一个第二数据组的数量为多个,在每个数据集合中的所述数据组按照所述第一顺序排列,且所述第一关键值大于或等于所述第二关键值的情况下,获取所述第二数据集合中位于所述第二目标数据组之后的第二数据组作为第二目标数据组;在每个数据集合中的所述数据组按照所述第二顺序排列,且所述第三关键值小于或等于所述第四关键值的情况下,获取所述第二数据集合中位于所述第二目标数据组之后的第二数据组作为第二目标数据组。
[0012]使得与某一个数据集合中某个数据组进行比较的另一个数据集合中的数据组包括大小在大于或等于该某个数组组中关键值最小值且小于或等于于该某个数据组中关键值最大值的范围内的关键值,并且使得该某个数组组与该另一个数据集合中仅包括该范围之外的关键值的数据组进行比较的可能性降低,提高运算效率,降低运算量。
[0013]结合第一方面,在一些可能的实现方式中,所述数据处理装置包括处理矩阵,所述处理矩阵包括v
×
v个处理单元,v为正整数,第一目标数据组和第二目标数据组中每个目标数据组中至少一个数据的数量小于或等于v。所述第一目标数据组中的第i个第一数据是在所述迭代的第j个输入周期输入位于第一边缘的v个所述处理单元中沿第二方向的第j个所述处理单元的,所述第二目标数据中的第p个第二数据是在所述迭代的第q个输入周期输入位于第二边缘的v个所述处理单元中沿第一方向的第q个所述处理单元的,所述第一边缘与所述第二边缘相邻,每个目标数据组中不同的所述数据输入的所述处理单元不同,所述第一方向为从所述第二边缘指向所述处理矩阵内部且垂直所述第二边缘的方向,所述第二方向为从所述第一边缘指向所述处理矩阵内部且垂直所述第一边缘的方向;所述处理矩阵中的每个处理单元用于,确定在同一个所述输入周期输入所述处理单元的第一数据中的所述关键值与第二数据中的所述关键值是否相等;在v大于1的情况下,所述处理矩阵中的每个
处理单元还用于,在接收所述第一数据和所述第二数据的下一个输入周期,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,将所述第二数据传输至沿所述第二方向的下一个所述处理单元。
[0014]利用处理矩阵对第一目标数据组和第二目标数据组进行处理,可以提高处理效率。
[0015]结合第一方面,在一些可能的实现方式中,每个数据集合中不同的数据中的所述关键值不同,所述处理矩阵中的每个处理单元用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值不相等的情况下,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,并将所述第二数据传输至沿所述第二方向的下一个所述处理单元。
[0016]在各个数据集合中不同的数据中的所述关键值不同的情况下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理装置的控制方法,其特征在于,所述方法包括:获取第一目标数据组和第二目标数据组,所述第一目标数据组为第一数据集合的多个第一数据组中的第一个数据组,所述第二目标数据组为第二数据集合的至少一个第二数据组中的第一个数据组,所述第一数据集合和所述第二数据集合的每个数据集合中的每个数据组包括至少一个数据,每个数据包括关键值,每个数据集合中的所述数据组是按照第一顺序或第二顺序排列的,在按照所述第一顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均小于位于所述任一个数据组之后的数据组中每个关键值,在按照所述第二顺序排列的情况下每个数据集合中任一个所述数据组中的每个关键值均大于位于所述任一个数据组之后的数据组中每个关键值;进行多次迭代,每次迭代包括:将所述第一目标数据组和所述第二目标数据组输入所述数据处理装置,所述数据处理装置用于确定所述第一目标数据组和所述第二目标数据中相等的所述关键值;在每个数据集合中的所述数据组按照所述第一顺序排列,且第一关键值小于或等于第二关键值的情况下,或者,在每个数据集合中的所述数据组按照所述第二顺序排列,且第三关键值大于或等于第四关键值的情况下,获取所述第一数据集合中位于所述第一目标数据组之后的第一数据组作为所述第一目标数据组,所述第一关键值为所述第一目标数据组中最大的关键值,所述第二关键值为所述第二目标数据组中最大的关键值,所述第三关键值为所述第一目标数据组中最小的关键值,所述第四关键值为所述第二目标数据组中最小的关键值。2.根据权利要求1所述的方法,其特征在于,至少一个第二数据组的数量为多个,在每个数据集合中的所述数据组按照所述第一顺序排列,且所述第一关键值大于或等于所述第二关键值的情况下,或者,在每个数据集合中的所述数据组按照所述第二顺序排列,且所述第三关键值小于或等于所述第四关键值的情况下,获取所述第二数据集合中位于所述第二目标数据组之后的第二数据组作为第二目标数据组。3.根据权利要求1或2所述的方法,其特征在于,所述数据处理装置包括处理矩阵,所述处理矩阵包括v
×
v个处理单元,v为正整数,第一目标数据组和第二目标数据组中每个目标数据组中至少一个数据的数量小于或等于v,所述第一目标数据组中的第i个第一数据是在所述迭代的第j个输入周期输入位于第一边缘的v个所述处理单元中沿第二方向的第j个所述处理单元的,所述第二目标数据中的第p个第二数据是在所述迭代的第q个输入周期输入位于第二边缘的v个所述处理单元中沿第一方向的第q个所述处理单元的,所述第一边缘与所述第二边缘相邻,每个目标数据组中不同的所述数据输入的所述处理单元不同,所述第一方向为从所述第二边缘指向所述处理矩阵内部且垂直所述第二边缘的方向,所述第二方向为从所述第一边缘指向所述处理矩阵内部且垂直所述第一边缘的方向,i、j、p、q均为正整数;所述处理矩阵中的每个处理单元用于,确定在同一个所述输入周期输入所述处理单元的第一数据中的所述关键值与第二数据中的所述关键值是否相等;在v大于1的情况下,所述处理矩阵中的每个处理单元还用于,在接收所述第一数据和所述第二数据的下一个输入周期,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,将所述第二数据传输至沿所述第二方向的下一个所述处理单元。
4.根据权利要求3所述的方法,其特征在于,每个数据集合中不同的数据中的所述关键值不同,所述处理矩阵中的每个处理单元用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值不相等的情况下,将所述第一数据传输至沿所述第一方向的下一个所述处理单元,并将所述第二数据传输至沿所述第二方向的下一个所述处理单元。5.根据权利要求3或4所述的方法,其特征在于,所述数据处理装置还包括过滤矩阵,所述过滤矩阵包括v个过滤单元,所述v个过滤单元分别位于所述处理矩阵沿所述第一方向的v行中每一行沿所述第二方向的最后一个处理单元之后,所述处理矩阵中的每个处理单元还用于:在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,在接收所述第一数据和所述第二数据的下一个所述输入周期,将所述处理单元的处理结果沿所述第二方向传输至下一个单元,所述单元为所述处理单元或所述过滤单元,所述处理结果包括相等的所述关键值;或者,在接收所述处理结果的下一个所述输入周期,将所述处理结果沿所述第二方向传输至下一个单元;所述方法还包括:在所述第一关键值大于或等于所述第二关键值的情况下,控制沿所述第一方向的所述v个过滤单元按照所述输入周期依次输出所述第二目标数据组对应的所述处理结果。6.根据权利要求5所述的方法,其特征在于,所述数据处理装置还包括压缩三角矩阵,所述压缩三角矩阵包括沿所述第一方向的v行压缩单元,沿所述第一方向所述压缩单元的数量逐行增加,所述多个压缩单元中的每个压缩单元用于:接收沿所述第二方向所述压缩单元之前的所述过滤单元输出的所述处理结果,或者,接收沿所述第一方向上一行的所述压缩单元输出的所述处理结果;在接收所述处理结果的下一个所述输入周期,向沿所述第一方向下一行的所述压缩单元传输所述处理结果。7.根据权利要求3

6中任一项所述的方法,其特征在于,不同的所述关键值对应于关系图中不同的点集,所述第一数据用于表示关系图中第一目标点与所述第一数据中的所述关键值对应的所述点集中的至少一个点之间是否具有关系,所述第二数据用于表示关系图中第二目标点与所述第二数据中的所述关键值对应的所述点集中的至少一个点之间是否具有关系,每个处理矩阵还用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,输出处理结果,所述处理结果用于指示所述关系图中的查询点,所述查询点与所述两个目标点的之间的关系情况符合预设情况。8.根据权利要求3

7中任一项所述的方法,其特征在于,所述第一数据还包括所述关键值对应的所述第一目标点的第一关系值组,所述第二数据还包括所述关键值对应的所述第二目标点的第二关系值组,所述处理矩阵中的每个处理单元还用于,在所述第一数据中的所述关键值与所述第二数据中的所述关键值相等的情况下,对所述第一关系值组和所述第二关系值组的各个位分别进行预设运算,相等的所述关键值对应的所述第一关系值组和第二关系值组中相同的位
对应于所述相等的关键值对应的所述点集中相同的所述点,每个位的所述预设运算的结果用于指示所述位对应的所述点与所述两个目标点之间的关系情况是否符合所述预设情况。9.根据权利要求1

8中任一项所述的方法,其特征在于,在每个数据集合中的所述数据组按照所述第一顺序排列的情况下,每个第一数据组中的所述关键值从小到大排列;在每个数据集合中的所述数据组按照所述第二顺序排列的情况下,每个第一数据组中的所述关键值从大到小排列。10.一种数据处理装置的控制装置,其特征在于,包括:获取模块和处理模块,所述获取模块用于,获取第一目标数据组和第二目标数据组,所述第一目标数据组为第一数据集合的多个第一数据组中的第一个数据组,所述第二目标数据组为第二数据集合的至少一个第二数据组中的第一个数据组,所述第一数据集合和所述第二数据集合的每个数据集合中的每个数据组包括至少一个数据,每个数据包括关键值,每个数据集合中的所述数据组是按照第一顺序或第二顺序排列的,在按照所...

【专利技术属性】
技术研发人员:戴国浩朱振华汪玉肖世海傅天予张学仓
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1