【技术实现步骤摘要】
本申请涉及大数据,特别是涉及一种数据构建方法、装置、计算机设备和存储介质。
技术介绍
1、频繁项集是数据挖掘中的一个概念,具体是指在一个数据集频繁出现的项集。fp-grouth算法是一种挖掘频繁项集的算法,主要用于将代表频繁项集的数据库压缩到一个频繁模式树(fp-tree树形结构数据,以下简称fp树),该树仍保留项集的关联信息。
2、在商品营销领域中,通过对顾客的“购物篮”进行频繁项集的挖掘,发现顾客放入他们“购物篮”中的商品之间的关联,并分析顾客的购物习惯,可以帮助零售商了解哪些商品频繁地被顾客同时购买,从而帮助他们制定更好的营销策略。
3、目前,关于频繁项集的挖掘,主要是通过fp-grouth算法挖掘出数据集中的频繁项集,然而,当数据集的数据量很大时,通过fp-grouth算法挖掘频繁项集会存在数据处理效率低下的问题。
技术实现思路
1、本申请提供一种数据构建方法、装置、计算机设备和计算机可读存储介质。
2、第一方面,本申请提供了一种数据构建方法。所
本文档来自技高网...【技术保护点】
1.一种数据构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述大型频繁模式子树拆分为多个频繁模式子树包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求2所述的方法,其特征在于,将拆分后的多个频繁模式子树分配至多个第二工作线程之前,所述方法还包括:
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述分批读取所述事务数据集中的事务之前,所述方法还包括:
7.根据
...【技术特征摘要】
1.一种数据构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述大型频繁模式子树拆分为多个频繁模式子树包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求2所述的方法,其特征在于,将拆分后的多个频繁模式子树分配至多个第二工作线程之前,所述方法还包括:
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述分批读取...
【专利技术属性】
技术研发人员:黄波,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。