一种快速查找关联数据的方法技术

技术编号：14048265 阅读：50 留言：0更新日期：2016-11-23 23:51

本发明专利技术提供一种快速查找关联数据的方法，包括如下步骤：对待处理数据进行集合划分；将集合数据存入二维表中，并设置分组编号字段；对二维表分别按集合字段和元素字段进行排序，得到不同的表A和表B，同时引入索引字段和反向索引字段；通过反向索引在表A和表B中反复查找，直至查找到所有相关联的集合的所有记录，并将所有关联集合的记录所对应的分组编号置为一相同数值；根据相同的分组编号快速查询到所有关联的集合，从而得到所有相关的记录，得到所有关联数据群。本发明专利技术提高数据分类以及数据关联查询的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据查找领域，尤其涉及一种快速查找关联数据的方法。
技术介绍
在大数据挖掘中，对于一些有关联的数据需要进行整合，例如电信套餐资费上需要以用户或套餐信息进行存储与关联，根据需要获取相关联的所有信息，再比如在设置一些推荐功能(菜单推荐、音乐推荐等)时，同样需要获取大量的相关信息进行处理。目前，对于相关数据的收集与处理，一般通过集合进行分类后在关联，而集合之间的合并与关联的效率直接影响着数据处理的效率。当数据通过集合进行分类表示时，通常采用大写字母表示集合，小写字母表示集合的元素，并将集合A中不同元素的数目称为集合A的基数，记作card(A)，当存在多个集合A0，A1，A2，……，An，每个集合中包含有不同数量的有限多个元素，那么在计算各个集合的关联度时，需要对所有有交集的集合进行合并，要求合并完成后的最终的新的集合之间无交集，并获取此时最大元素个数的集合Ax，计算其元素的个数card(Ax)。在现有技术中，合并存在关联的集合时的处理方式是这样的：如图1所示，把集合从左到右排列分别为A0，A1，A2，……，An-1，An，从最左边的第一个集合A0开始...
一种快速查找关联数据的方法

【技术保护点】
一种快速查找关联数据的方法，其特征在于：包括如下步骤：步骤10、获取待处理数据进行分类，将同一类别的数据划分在一个集合下，作为该集合的元素，每一集合包含数量不等的元素；步骤20、对每一集合的每一元素创建一条记录插入二维表中，每一记录包含元素字段、集合字段以及分组编号字段；步骤30、将所述二维表按集合字段进行排列得到表A，按元素字段进行排列得到表B，所述表A和表B均包含元素字段、集合字段、索引字段、反向索引字段以及分组编号字段；步骤40、依次获取表A中的一分组编号为空的记录作为源记录，设置本轮次的分组编号值，通过反向索引在表A和表B中反复查找，得到与所述源记录所在的源集合的所有关联集合，并将所述...

【技术特征摘要】
1.一种快速查找关联数据的方法，其特征在于：包括如下步骤：步骤10、获取待处理数据进行分类，将同一类别的数据划分在一个集合下，作为该集合的元素，每一集合包含数量不等的元素；步骤20、对每一集合的每一元素创建一条记录插入二维表中，每一记录包含元素字段、集合字段以及分组编号字段；步骤30、将所述二维表按集合字段进行排列得到表A，按元素字段进行排列得到表B，所述表A和表B均包含元素字段、集合字段、索引字段、反向索引字段以及分组编号字段；步骤40、依次获取表A中的一分组编号为空的记录作为源记录，设置本轮次的分组编号值，通过反向索引在表A和表B中反复查找，得到与所述源记录所在的源集合的所有关联集合，并将所述源集合的记录以及所述源集合的所有关联集合的记录所对应的分组编号置为本轮次的分组编号值；步骤50、根据相同的分组编号快速查询到所有关联的集合，从而得到所有相关的记录，得到所有关联数据群；其中，所述表A和表B互为对应列表，所述索引字段按对应记录所在列表的位置进行编号，所述反向索引字段按照对应记录在对应列表中的位置进行编号。2.根据权利要求1所述的一种快速查找关联数据的方法，其特征在于：所述分组编号初始值为空。3.根据权利要求2所述的一种快速查找关联数据的方法，其特征在于：所述步骤40进一步包括：步骤41、创建一新的二维表relaA，用于存储表A中的待遍历记录；步骤42、依次获取表...

【专利技术属性】
技术研发人员：陈心咏，
申请(专利权)人：福建富士通信息软件有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人