The invention discloses a method and process of sequential pattern mining based on CPU+MIC method, parallel sequential pattern mining by CPU and MIC, CPU is responsible for sequence data, then the sequence of data into blocks, optimization of load balancing, transfer the data to the MIC card, CPU+MIC co computing and task scheduling and parameter initialization MIC; multi-core coprocessor for multi-threaded parallel use of sequential pattern mining algorithm to find frequent items found each parallel region graph data set. The invention improves the parallel mining efficiency, according to the characteristics of data stream, MIC collaborative computing model based on the MIC collaborative computing parallel computing architecture, parallel computing method of mining frequent itemsets found the sequence pattern based on the sequence of the data, so the processing speed is improved greatly.
【技术实现步骤摘要】
一种基于CPU+MIC的序列模式挖掘方法及流程
本专利技术涉及数据挖掘,尤其涉及MIC众核协处理器端以及CPU+MIC协同计算模式。
技术介绍
序列模式挖掘可以应用在包括顾客购买行为的分析、网络访问模式分析、科学实验的分析、疾病治疗的早期诊断、自然灾害的预测、DNA序列的破译等方面。项目集或称项集:是各种项目组成的集合。设I={i1,i2,…,im}是一个项目集合,事务数据库D={t1,t2,…tn}是由一系列具有惟一标识TID的事务组成,每个事务ti(i=1,2,…,n)都对应I上的一个子集。设I1⊆I,项目集I1在D上的支持度(support)是包含I1的事务在D中,即support(I1)=||{t∈D|I1⊆t}||/||D||。序列:I={i1,i2,…,im}是项集,ik(1<=k<=m)是一个项,序列S记为S=<s1,s2,…,sn>其中sj(1<=j<=n)为项集),即sj⊆I,每个元素由不同项组成,序列的元素可表示为(i1,i2,…,ik),若一个序列只有一个项,则括号可以省略。子序列:序列T=<ti1,ti2,…,tim>是另一个序列S=<s1,s2,…,sn>的子序列,满足下面条件:对于每一个j,1<=j<=m-1,有ij<ij+1i且对于每一个j,1<=j<=m存在1<=k<=n,使得tij⊆sk。即序列S包含序列T。称T为S的子序列,S为T的超序列。序列模式挖掘:就是找出数据库中所有的序列模式,即那些在序列集合中出现频率超过最小支 ...
【技术保护点】
一种基于CPU+MIC的序列模式挖掘方法,其特征在于,由CPU与MIC进行并行序列模式挖掘,CPU端负责序列数据,然后对序列数据进行分块,优化负载均衡,向MIC卡传递数据,CPU+MIC协同计算以及任务调度和参数初始化工作;MIC众核协处理器负责多线程并行地使用序列模式挖掘算法查找发现每个并行区图数据中的频繁项集。
【技术特征摘要】
1.一种基于CPU+MIC的序列模式挖掘方法,其特征在于,由CPU与MIC进行并行序列模式挖掘,CPU端负责序列数据,然后对序列数据进行分块,优化负载均衡,向MIC卡传递数据,CPU+MIC协同计算以及任务调度和参数初始化工作;MIC众核协处理器负责多线程并行地使用序列模式挖掘算法查找发现每个并行区图数据中的频繁项集。2.根据权利要求1所述的基于CPU+MIC的序列模式挖掘方法,其特征在于,在整个序列挖掘的计算任务CPU以openmp多线程模式。3.根据权利要求1所述的基于CPU+MIC的序列模式挖掘方法,其特征在于,MIC卡上也采...
【专利技术属性】
技术研发人员:龚湛,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。