一种基于非易失性存储器的频繁模式挖掘方法技术

技术编号：15690989 阅读：387 留言：0更新日期：2017-06-24 03:49

本发明专利技术提供了一种基于非易失性存储器的频繁模式挖掘方法，它包括以下步骤：步骤1、利用多核系统对频繁模式树进行并行构建：先将数据库中的多条数据项大致均匀地分配到每个核中，利用CN106250549A记载的方法，在每一个核上构建一棵本地频繁模式树；步骤2、对步骤1所构建的频繁模式树进行合并：将本地频繁模式树的信息搜集起来，合并成一棵大的全局频繁模式树。由于本发明专利技术采用并行构建频繁模式树，大幅度缩短了构建的时间，提高了构建频繁模式树的效率，解决了挖掘大数据集时构建树的速度慢的问题。

A frequent pattern mining method based on nonvolatile memory

The invention provides a non volatile memory to frequent pattern mining method based on it, which comprises the following steps: 1, the use of multi-core system on parallel frequent pattern tree construction: the first of the plurality of data items are roughly evenly distributed to each core database, using the method of CN106250549A records, a the local frequent pattern tree construction in each nucleus; step 2, step 1 of frequent pattern tree constructed by merging: local frequent pattern tree information together, merge into a large global frequent pattern tree. Because the invention adopts the parallel construction of frequent pattern trees, the construction time is greatly shortened, the efficiency of constructing frequent pattern trees is improved, and the problem of slow construction of large data sets is solved.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于非易失性存储器的频繁模式挖掘方法
本专利技术属于存储器
，具体涉及一种用于NVM的频繁模式挖掘方法。
技术介绍
中国专利文献CN106250549A于2016年12月21日公开了一种基于内存的频繁模式挖掘方法，它包括以下步骤：步骤1，构建频繁模式初始树，创建频繁模式树的根结点T，以“null”标记；再次扫描数据库，将读取的每条事务中的频繁项选出并按L中的次序排序；排序后以null为根结点构建一条频繁模式树的路径，只对路径上位于最末的结点的计数加1，路径上的其他结点的计数保持不变；依次扫描完整个数据库中所有事务后获得频繁模式初始树；步骤2，用深度优先搜索算法对频繁模式初始树依次进行遍历，遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。该专利能减少对NVM的写操作，能快速的构建频繁模式树；且能减少对靠近根结点的结点计数域大量密集的写操作，延长了NVM寿命。但是，当待挖掘的数据集非常大，用该专利的方法构建树的效率很低，有必要探索一种快速构建频繁模式树的方法。
技术实现思路
针对现有技术中存在的技术问题，本专利技术所要解决的技术问题就是提供一种基于非易...
一种基于非易失性存储器的频繁模式挖掘方法

【技术保护点】
一种基于非易失性存储器的频繁模式挖掘方法，其特征是，包括以下步骤：步骤1、利用多核系统对频繁模式树进行并行构建先将数据库中的多条交易记录大致均匀地分配到每个核中，利用CN106250549A记载的方法，在每一个核上构建一棵本地频繁模式树；步骤2、对步骤1所构建的频繁模式树进行合并将本地频繁模式树的信息搜集起来，合并成一棵大的全局频繁模式树。

【技术特征摘要】
1.一种基于非易失性存储器的频繁模式挖掘方法，其特征是，包括以下步骤：步骤1、利用多核系统对频繁模式树进行并行构建先将数据库中的多条交易记录大致均匀地分配到每个核中，利用CN106250549A记载的方法，在每一个核上构建一棵本地频繁模式树；步骤2、对步骤1所构建的频繁模式树进行合并将本地频繁模式树的信息搜集起来，合并成一棵大的全局频繁模式树。2.根据权利要求1所述的基于非易失性存储器的频繁模式挖掘方法，其特征是：在所述步骤1中，构建本地频繁模式树时，采用左孩子右兄弟链表结构；在所述步骤2中，包括以下步骤：步骤（1）、从根结点出发，将树1的根结点的最末孩子结点的...

【专利技术属性】
技术研发人员：刘铎，林怡，黄铂钧，朱潇，李阳，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人