数据处理方法及装置制造方法及图纸

技术编号:33034209 阅读:11 留言:0更新日期:2022-04-15 09:11
本申请公开了一种数据处理方法及装置。涉及金融科技领域,该方法包括:通过增长算法对目标数据进行处理,得到目标数据对应的频繁模式树,其中,频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对频繁模式树进行合并处理,得到合并后的频繁模式树;对合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。通过本申请,解决了相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题。存在效率低准确性低的问题。存在效率低准确性低的问题。

【技术实现步骤摘要】
数据处理方法及装置


[0001]本申请涉及金融科技领域,具体而言,涉及一种数据处理方法及装置。

技术介绍

[0002]信息技术高度发达,在大数据的时代背景下,企业获取数据的效率日益提高,数据的规模和种类庞大,在庞大的数据量背后,蕴含了大量有利于企业经营的有效信息。对这些数据进行整理、分析后,能够保证企业在具有有效数据支持下获得更高的经济效益和有效的管理决策。数据挖掘已成为了大数据时代下零售业销售分析的关键。
[0003]目前的销售行业模式逐渐趋向于多样化,与传统的销售线下店不同,无人商店便是一种新兴的销售线下店模式。
[0004]无人商店因为没有店员存在,导致物品缺货时无法快速补货,并且因空间有限,无法存储大量货物,故需要根据数据对销量进行预测以及对库存进行调整。通过数据挖掘及分析,可以从海量原始数据中提取出尽可能多、尽可能准确的相关信息,为无人商店销售业务提供有力的数据支撑。导致无人销售数据,需要进行分析和分类,存在效率低准确性低。
[0005]针对相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本申请的主要目的在于提供一种数据处理方法及装置,以解决相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题。
[0007]为了实现上述目的,根据本申请的一个方面,提供了一种数据处理方法,包括:通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树,其中,所述频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树;对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,所述迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。
[0008]可选的,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树包括:扫描用于存储所述目标数据的数据库,获取多个不同事务的数据项的项集,以及每个数据项的频数;按照所述频数降序生成频繁项目列表;再次扫描所述数据库,提取各个事务的数据项;根据所述频繁项目列表的先后顺序,将各个事务的数据项逐项插入,生成所述频繁模式树。
[0009]可选的,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树之前,所述方法还包括:对所述数据库中的所述目标数据进行清洗;对清洗后的目标数据进行审查与校验,其中,所述审查与校验包括下列至少之一:填补空缺信息,删除重复信息,纠正错误信息,调整数据结构;对校验后的目标数据进行有效性分析,将无效的数据删除。
[0010]可选的,根据所述频繁项目列表的先后顺序,将数据项逐项插入,生成所述频繁模
式树包括:创建初始频繁模式树,所述初始频繁模式树的根节点;根据所述频繁项目列表的先后顺序,将每个事务的数据项逐项创建节点进行连接,并记录所述数据项的频数;为不同的事务创建不同的分枝,在创建分支的事务与已有分枝的数据项相同的情况下,将相同的数据项合并,生成所述频繁模式树。
[0011]可选的,根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树包括:从所述频繁模式树的根节点开始遍历所述频繁模式树的每一个数据项,确定所述每个数据项的频繁模式树路径;在所述频繁模式树路径为非单链的情况下,根据所述项合并策略对所述频繁模式树路径进行合并,得到所述合并后的频繁模式树;对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树包括:在合并后的频繁模式树路径为非单链的情况下,根据所述频繁模式树路径的节点重新生成频繁模式树,根据所述项合并策略进行迭代,得到迭代后的频繁模式树,其中,所述迭代后的频繁模式树的所述数据项的频繁模式树路径为单链。
[0012]可选的,对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树之后,所述方法还包括:根据需求将单链的所述频繁模式树路径上的一个或多个节点与所述数据项合并,生成频繁项集;设置算法最小支持度和最小置信度,通过所述增长算法对所述频繁项集进行迭代,直至满足所述最小支持度和最小置信度的要求,停止迭代,输出运行结果;根据所述运行结果确定频繁项集中的数据项之间的关联关系。
[0013]可选的,根据所述运行结果确定频繁项集中的数据项之间的关联关系之后,所述方法还包括:获取预设的销售策略;按照所述销售策略和所述关联关系,确定不同数据项对应的虚拟物品的摆放策略。
[0014]为了实现上述目的,根据本申请的另一方面,提供了一种数据处理装置,包括:处理模块,用于通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树,其中,所述频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;合并模块,用于根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树;迭代模块,用于对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,所述迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。
[0015]通过本申请,采用以下步骤:通过增长算法对目标数据进行处理,得到目标数据对应的频繁模式树,其中,频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对频繁模式树进行合并处理,得到合并后的频繁模式树;对合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品,迭代后的频繁树,记载了多种虚拟物品之间的关联关系,该关联关系就可以对关联的虚拟物品进行准确地分析和分类,从而解决了相关技术中无人销售数据,需要进行分析和分类,存在效率低准确性低的问题。进而达到了提高虚拟物品的数据分析的效率和准确性的效果。根据该关联关系还可以根据销售策略,对虚拟物品对应的商品进行准确的布设,以实现提高商品分析分类的准确性。
附图说明
[0016]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1是根据本申请实施例提供的数据处理方法的流程图;
[0018]图2是根据本申请实施方式的数据处理方法的流程图;
[0019]图3是根据本申请实施方式的创建频繁模式树FP

Tree的流程图;
[0020]图4是根据本申请实施方式的插入前两条数据的FP

Tree的示意图;
[0021]图5是根据本申请实施方式的插入前三条数据的FP

Tree的示意图;
[0022]图6是根据本申请实施方式的创建完成的FP

Tree的示意图;
[0023]图7是根据本申请实施方式的剪枝后的FP

Tree的示意图;
[0024]图8是根据本申请实施方式的FP

Tree的挖掘方法的流程图;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树,其中,所述频繁模式树包括多个代表数据项的节点,以及具有关联关系的数据项的节点之间连线;根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树;对所述合并后的频繁模式树进行迭代处理,得到迭代后的频繁模式树,其中,所述迭代后的频繁模式树中所包括的每个数据项对应一种虚拟物品。2.根据权利要求1所述的方法,其特征在于,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树包括:扫描用于存储所述目标数据的数据库,获取多个不同事务的数据项的项集,以及每个数据项的频数;按照所述频数降序生成频繁项目列表;再次扫描所述数据库,提取各个事务的数据项;根据所述频繁项目列表的先后顺序,将各个事务的数据项逐项插入,生成所述频繁模式树。3.根据权利要求2所述的方法,其特征在于,通过增长算法对目标数据进行处理,得到所述目标数据对应的频繁模式树之前,所述方法还包括:对所述数据库中的所述目标数据进行清洗;对清洗后的目标数据进行审查与校验,其中,所述审查与校验包括下列至少之一:填补空缺信息,删除重复信息,纠正错误信息,调整数据结构;对校验后的目标数据进行有效性分析,将无效的数据删除。4.根据权利要求2所述的方法,其特征在于,根据所述频繁项目列表的先后顺序,将数据项逐项插入,生成所述频繁模式树包括:创建初始频繁模式树,所述初始频繁模式树的根节点;根据所述频繁项目列表的先后顺序,将每个事务的数据项逐项创建节点进行连接,并记录所述数据项的频数;为不同的事务创建不同的分枝,在创建分支的事务与已有分枝的数据项相同的情况下,将相同的数据项合并,生成所述频繁模式树。5.根据权利要求4所述的方法,其特征在于,根据项合并策略对所述频繁模式树进行合并处理,得到合并后的频繁模式树包括:从所述频繁模式树的根节点开始遍历所述频繁模式树的每一个数据项,确定所述每个数据项的频繁模式树路径;在所述频繁模式树路径为非单链的情况下,根据所述项合并策略对...

【专利技术属性】
技术研发人员:裴冉李福海狄程杨喆炜
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1