一种数据处理方法及存储介质技术

技术编号：33777201 阅读：56 留言：0更新日期：2022-06-12 14:30

本发明专利技术提出了一种数据处理方法及存储介质，在数据处理系统中创建关系数据表、替换表和缓存表，在关系数据表中创建多个区域；对关系数据表执行节点拓扑模型算法，生成去冗余数据；将去冗余数据添加到所述缓存表中；检查所有节点，当节点拓扑模型算法不再生成任何新的去冗余数据时，将缓存表中去冗余数据复制到替换表中；为替换表构建一个或多个索引语义数据；将替换表中的索引语义数据交换到关系数据表中的多个区域中；丢弃替换表和缓存表，达到了减少计算次数的目的，最终实现大数据高效并行化计算；有效地解决了数据的计算瓶颈问题，有效地提升了大数据的准确度、效率和数量。效率和数量。效率和数量。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及存储介质

[0001]本专利技术属于数据处理
，尤其涉及一种数据处理方法及存储介质。

技术介绍

[0002]近几年来，大数据在全球迅猛发展，引起了学术界、业界和各国政府的高度关注。大数据将带来重大的发展机遇与技术挑战。一方面，通过有效地管理大数据并分析提取其价值，能够为行业提供高附加值的应用和服务，实现巨大的经济和社会价值。另一方面，大数据在带来发展机遇的同时也带了巨大的技术挑战。传统的计算技术在处理大数据时将面临诸多的技术困难，因此，需要研究和寻找新的有效技术方法，以完成大数据的分析处理和价值发现。
[0003]大数据处理是一个包含和综合大数据存储、计算、分析等多个层面的完整技术栈。大数据技术需要多学科综合研究，涉及到数据的获取与管理、数据的存储与处理、数据的分析与理解以及结合领域的大数据应用等。大规模数据资源蕴涵着巨大的社会价值和商业价值，有效地管理这些数据、挖掘数据的深度价值，对国家治理、社会管理、企业决策和个人生活将带来巨大的作用和影响。因此，大数据研究和应用己经成为全球科技创新和和经济发展的重要推动力量。
[0004]然而，大规模数据资源给人们带来新的发展机遇的同时，也带来很多新的技术挑战。格式多样、形态复杂、规模庞大的行业大数据给传统的计算技术带来了很多技术困难。传统的数据库等信息处理技术己经难以有效应对大规模数据的处理。为此，人们亟需寻找有效的大数据处理技术方法和手段，以有效处理和分析应用行业大数据。

技术实现思路

[0005]为了解决上述技术问题...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括以下步骤：步骤1，在数据处理系统中创建关系数据表、替换表和缓存表，在关系数据表中创建多个区域；步骤2，对所述关系数据表执行节点拓扑模型构建，生成去冗余数据；步骤3，将通过执行步骤2生成的去冗余数据添加到缓存表中；步骤4，检查所有节点，当不再生成任何新的去冗余数据时，执行步骤5；步骤5，将所述缓存表中去冗余数据复制到替换表中；步骤6，为所述替换表构建一个或多个索引语义数据；步骤7，将所述替换表中的索引语义数据交换到所述关系数据表中的多个区域中；步骤8，丢弃所述替换表和缓存表。2.根据权利要求1所述的数据处理方法，其特征在于，所述步骤1具体包括：将数据表示成布尔矩阵,通过布尔矩阵分解算法将所述布尔矩阵进行分解，引入最短距离来评估矩阵分解的结果,最后通过分解后的子矩阵得出数据之间的支持度来构造关系数据表。3.根据权利要求2所述的数据处理方法，其特征在于，用d＝{d1,d2,
…
,dm}表示所述关系数据表中所有属性表的序号集合,T＝(tid,X)表示一个事务,其中tid表示数据属性表主体,X表示该数据属性表主体在所述关系数据表中出现的属性集合,X是d的子集,用D表示包含事务集合，属性子集Y为X的子集，N为D中包含的事务个数，属性子集Y的支持度为sup(Y)/N，其中N为D中的事务个数，sup(Y)定义如下：若支持度大于最小支持度阈值，则属性子集Y中属性间是强关联的。4.根据权利要求3所述的数据处理方法，其特征在于，所述步骤2的节点拓扑模型构建的具体步骤如下：步骤2.1,将事务集合D中的所有的事务T都作为一个节点；步骤2.2,遍历所有属性子集Y，将支持度大于分割阈...

【专利技术属性】
技术研发人员：康昌春，
申请(专利权)人：康昌春，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人