有交集集合的合并方法及装置制造方法及图纸

技术编号:21628495 阅读:20 留言:0更新日期:2019-07-17 10:57
本发明专利技术公开了一种有交集集合的合并方法及装置,可以获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;根据元素与集合标识的对应关系获得至少一个元素组;从每个元素组中均选取一个元素作为待处理元素,对每个待处理元素:将该待处理元素对应的集合标识对应的集合进行合并,获得并集;建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。本发明专利技术可以快速的对大量的集合进行处理,将其中有交集的集合进行合并,从而确定有交集的集合中各集合元素间的关系。

Merging Method and Device with Intersection Set

【技术实现步骤摘要】
有交集集合的合并方法及装置
本专利技术涉及数据处理
,尤其涉及一种有交集集合的合并方法及装置。
技术介绍
在数据处理领域,如数据库领域,常需要求集合的交集或并集。当需要进行信息合并时,还需要对有交集的集合进行合并。例如:对数个由多种专利信息组成的集合中有交集的集合进行合并,以发现各专利信息之间的关系。例如:集合有四个,集合A为(申请人A公司,专利技术人张三,专利技术分类1);集合B为(申请人B公司,专利技术人张三,专利技术分类2);集合C为(申请人B公司,专利技术人李四,专利技术分类2);集合D为(申请人C公司,专利技术人王五,专利技术分类4)。集合A中的专利信息从专利文件A中提取获得;集合B中的专利信息从专利文件B中提取获得;集合C中的专利信息从专利文件C中提取获得;集合D中的专利信息从专利文件D中提取获得。由于集合A、集合B、集合C彼此之间具有交集,因此可以将它们合并为(申请人A公司,申请人B公司,专利技术人张三,专利技术人李四,专利技术分类1,专利技术分类2)。而集合D与其他三个集合之间没有交集,因此无需与其他集合合并。通过合并后的集合,就可以确定集合A、集合B、集合C的各个元素之间具有关系。当然,对有交集的集合进行合并还有其他用处。但如何对有交集的集合进行合并仍旧是本领域一个亟待解决的技术难题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种有交集集合的合并方法及装置,方案如下:一种有交集集合的合并方法,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个;从每个元素组中均选取一个元素作为待处理元素,对每个所述待处理元素对应的集合标识对应的集合进行合并,获得多个并集;建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。可选的,所述根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个,包括:在所述元素对应有至少两个集合标识时,将该元素对应的各集合标识设置为一个集合标识组,并为所述集合标识组设置组标识;建立所述元素与所述组标识的对应关系,将对应的组标识相同的各元素确定为一个元素组。可选的,所述建立各并集与集合标识的对应关系,包括:对每一个并集:从合并为该并集的各集合的集合标识中选取最小的集合标识,建立该并集与该最小的集合标识的对应关系。可循的,在所述获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系之后,所述方法还包括:获得各元素对应的集合标识的数量,将包含的各元素对应的集合标识的数量均为1的集合确定为输出结果之一。可选的,所述根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合,包括:判断此次合并后的结果中的集合数量是否大于1,如果是,则将此次合并后的结果中的集合确定为待处理集合,返回所述获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系的步骤;否则,将此次合并后得到的集合确定为输出结果之一,将各输出结果输出。一种有交集集合的合并装置,所述装置包括:集合获得单元、元素组获得单元、集合合并单元、并集合并单元和集合输出单元,所述集合获得单元,用于获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;所述元素组获得单元,用于根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个;所述集合合并单元,用于从每个元素组中均选取一个元素作为待处理元素,对每个所述待处理元素对应的集合标识对应的集合进行合并,获得多个并集;所述并集合并单元,用于建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;所述集合输出单元,用于根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。可选的,所述装置还包括:数量获得单元,所述数量获得单元,用于在所述集合获得单元获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系之后,获得各元素对应的集合标识的数量,将包含的各元素对应的集合标识的数量均为1的集合确定为输出结果之一。可选的,所述集合输出单元具体用于:判断此次合并后的结果中的集合数量是否大于1,如果是,则将此次合并后的结果中的集合确定为待处理集合,返回所述获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系的步骤;否则,将此次合并后得到的集合确定为输出结果之一,将各输出结果输出。一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行上述任一种有交集集合的合并方法。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任一种有交集集合的合并方法。借由上述技术方案,本专利技术提供一种有交集集合的合并方法及装置,可以获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;根据元素与集合标识的对应关系获得至少一个元素组;从每个元素组中均选取一个元素作为待处理元素,对每个待处理元素:将该待处理元素对应的集合标识对应的集合进行合并,获得并集;建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。本专利技术可以快速的对大量的集合进行处理,将其中有交集的集合进行合并,从而确定有交集的集合中各集合元素间的关系。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种有交集集合的合并方法的流程图;图2示出了本专利技术实施例提供的另一种有交集集合的合并方法的流程图;图3示出了本专利技术实施例提供的一种有交集集合的合并装置的结构示意图;图4示出了本专利技术实施例提供的另一种有交集集合的合并装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术实施例提供的一种有交集集合的合并方法,可以包括:S100、获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;在本专利技术其他实施例中,在获得到处理的多个本文档来自技高网...

【技术保护点】
1.一种有交集集合的合并方法,其特征在于,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个;从每个元素组中均选取一个元素作为待处理元素,对每个所述待处理元素对应的集合标识对应的集合进行合并,获得多个并集;建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。

【技术特征摘要】
1.一种有交集集合的合并方法,其特征在于,包括:获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系;根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个;从每个元素组中均选取一个元素作为待处理元素,对每个所述待处理元素对应的集合标识对应的集合进行合并,获得多个并集;建立各并集与集合标识的对应关系,将对应的集合标识相同的并集进行合并;根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合。2.根据权利要求1所述的方法,其特征在于:所述根据所述元素与集合标识的对应关系获得至少一个元素组,其中,同一元素组中的各元素对应的集合标识均相同且各元素对应的集合标识至少为两个,包括:在所述元素对应有至少两个集合标识时,将该元素对应的各集合标识设置为一个集合标识组,并为所述集合标识组设置组标识;建立所述元素与所述组标识的对应关系,将对应的组标识相同的各元素确定为一个元素组。3.根据权利要求2所述的方法,其特征在于:所述建立各并集与集合标识的对应关系,包括:对每一个并集:从合并为该并集的各集合的集合标识中选取最小的集合标识,建立该并集与该最小的集合标识的对应关系。4.根据权利要求1所述的方法,其特征在于:在所述获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系之后,所述方法还包括:获得各元素对应的集合标识的数量,将包含的各元素对应的集合标识的数量均为1的集合确定为输出结果之一。5.根据权利要求1至4中任一项所述的方法,其特征在于:所述根据对应的集合标识相同的并集进行合并后得到的全部集合的数量确定作为输出结果的集合,包括:判断此次合并后的结果中的集合数量是否大于1,如果是,则将此次合并后的结果中的集合确定为待处理集合,返回所述获得待处理的多个集合,根据元素与集合的归属关系确定元素与集合标识的对应关系的步骤;否则,将此...

【专利技术属性】
技术研发人员:彭远波
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1