有交集集合的合并方法及装置制造方法及图纸

技术编号:19745227 阅读:25 留言:0更新日期:2018-12-12 04:44
本发明专利技术公开了一种有交集集合的合并方法及装置,可以获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。本发明专利技术实现了有交集的集合的自动化合并,提高了数据处理效率。

【技术实现步骤摘要】
有交集集合的合并方法及装置
本专利技术涉及数据处理
,尤其涉及一种有交集集合的合并方法及装置。
技术介绍
在数据处理领域,如数据库领域,常需要求集合的交集或并集。当需要进行信息合并时,还需要对有交集的集合进行合并。例如:在进行信息查重处理前,首先对有交集的集合进行合并,然后进行信息查重。现有的集合合并方式只能由人工对集合进行合并,效率较低。如何对有交集的集合进行自动化合并仍旧是本领域一个亟待解决的技术难题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种有交集集合的合并方法及装置,方案如下:一种有交集集合的合并方法,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。可选的,所述处理标识为已并标识或未并标识;所述确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识,包括:确定每个元素对应的集合的数量,当元素对应至少两个集合时,将该元素对应的各集合进行合并,得到并集,将该并集作为该元素对应的集合,为该元素设置已并标识,将该元素对应的集合标识修改为所述至少两个集合中集合标识最小的集合标识;当元素对应一个集合时,为该元素设置未并标识。可选的,所述建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系,包括:建立元素、集合、集合标识、处理标识之间的对应关系,对处理标识为未并标识的每个对应关系,判断该对应关系中的集合中的第一个元素是否与该对应关系中的元素不同,如果是,则将该对应关系中的集合修改为空集;将所述元素、集合、集合标识、处理标识之间的对应关系中的元素去除,得到集合、集合标识、处理标识之间的对应关系。可选的,所述对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并,包括:对每个集合标识:判断该集合标识对应的所有处理标识中是否有至少一个已并标识,如果是,则将该集合标识对应的各集合进行合并;所述方法还包括:在所判断的集合标识对应的所有处理标识中不存在已并标识时,将该集合标识对应的集合中元素数量未发生变化的集合确定为输出结果之一,将该集合标识对应的集合中元素数量发生变化的集合删除。可选的,所述根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合,包括:判断各集合标识对应的集合进行合并后得到的全部集合的数量是否不大于1,如果是,将所述集合标识对应的各集合进行合并后得到的集合确定为输出结果之一;否则,将所述集合标识对应的各集合进行合并后得到的全部集合确定为待处理集合,返回执行所述获得待处理的多个集合,并根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系的步骤。可选的,所述对应关系通过数据对体现,所述根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系,包括:为待处理的各个集合分别设置唯一的集合标识,生成包含集合标识和集合的第一数据对;展开所述数据对中集合的元素,生成包含元素和所述第一数据对的第二数据对。可选的,所述确定每个元素对应的集合的数量,包括:对每个元素:确定该元素在所有的第二数据对中对应的集合标识的数量,将该数量确定为该元素对应的集合的数量。可选的,在所述确定每个元素对应的集合的数量后,所述方法还包括:当元素对应一个集合时,将对应关系中该元素对应的集合设置为空集。一种有交集集合的合并装置,包括:集合获得单元、数量确定单元、关系建立单元、集合合并单元和输出确定单元,所述集合获得单元,用于获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;所述数量确定单元,用于确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;所述关系建立单元,用于建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;所述集合合并单元,用于对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;所述输出确定单元,用于根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。可选的,所述处理标识为已并标识或未并标识;所述数量确定单元具体设置为:确定每个元素对应的集合的数量,当元素对应至少两个集合时,将该元素对应的各集合进行合并,得到并集,将该并集作为该元素对应的集合,为该元素设置已并标识,将该元素对应的集合标识修改为所述至少两个集合中集合标识最小的集合标识;当元素对应一个集合时,为该元素设置未并标识。本专利技术实施例提供的一种有交集集合的合并方法及装置,可以获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。本专利技术实现了有交集的集合的自动化合并,可以对海量的集合进行合并处理,大大节省了时间,提高了数据处理效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种有交集集合的合并方法的流程示意图;图2示出了本专利技术实施例提供的另一种有交集集合的合并方法的流程示意图;图3示出了本专利技术实施例提供的一种有交集集合的合并装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术实施例提供了一种有交集集合的合并方法,可以包括:S001、获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、本文档来自技高网...

【技术保护点】
1.一种有交集集合的合并方法,其特征在于,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。

【技术特征摘要】
1.一种有交集集合的合并方法,其特征在于,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素、集合、集合标识之间的对应关系;确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识;建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系;对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并;根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合。2.根据权利要求1所述的方法,其特征在于,所述处理标识为已并标识或未并标识;所述确定每个元素对应的集合的数量,根据所述数量对至少一个元素对应的集合进行合并处理,并为各元素设置处理标识,包括:确定每个元素对应的集合的数量,当元素对应至少两个集合时,将该元素对应的各集合进行合并,得到并集,将该并集作为该元素对应的集合,为该元素设置已并标识,将该元素对应的集合标识修改为所述至少两个集合中集合标识最小的集合标识;当元素对应一个集合时,为该元素设置未并标识。3.根据权利要求2所述的方法,其特征在于,所述建立元素、集合、集合标识、处理标识之间的对应关系,根据该对应关系得到集合、集合标识、处理标识之间的对应关系,包括:建立元素、集合、集合标识、处理标识之间的对应关系,对处理标识为未并标识的每个对应关系,判断该对应关系中的集合中的第一个元素是否与该对应关系中的元素不同,如果是,则将该对应关系中的集合修改为空集;将所述元素、集合、集合标识、处理标识之间的对应关系中的元素去除,得到集合、集合标识、处理标识之间的对应关系。4.根据权利要求2所述的方法,其特征在于,所述对每个集合标识,判断该集合标识对应的处理标识是否符合预设的标识条件,如果是,则将该集合标识对应的各集合进行合并,包括:对每个集合标识:判断该集合标识对应的所有处理标识中是否有至少一个已并标识,如果是,则将该集合标识对应的各集合进行合并;所述方法还包括:在所判断的集合标识对应的所有处理标识中不存在已并标识时,将该集合标识对应的集合中元素数量未发生变化的集合确定为输出结果之一,将该集合标识对应的集合中元素数量发生变化的集合删除。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据各集合标识对应的集合进行合并后得到的全部集合的数量确定作为输出结果的集合,包括...

【专利技术属性】
技术研发人员:彭远波
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1