当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于改进遗传算法的模式数据挖掘方法技术

技术编号:23672169 阅读:27 留言:0更新日期:2020-04-04 17:41
本发明专利技术公开了一种基于改进遗传算法的模式数据挖掘方法,属于数据挖掘技术领域。本发明专利技术种群初始化后,包括使用如下一种以上处理:个体修复处理,邻域探索处理,种群多样性维持处理和精英处理,来挖掘HUIs。本发明专利技术方法,在四个实际数据集上的实验结果表明,与目前最先进的基于EC的HUIM算法相比,所提出的HUIM‑IGA方法在发现的HUIs数量、发现HUIs的能力和运行时间方面具有更好的性能。可应用于处理日常应用中常见的交易型等事务数据库,在发现的高效用项集数量、发现高效用项集的能力和运行时间方面具有更好的性能。

A pattern data mining method based on Improved Genetic Algorithm

【技术实现步骤摘要】
一种基于改进遗传算法的模式数据挖掘方法
本专利技术涉及一种基于改进遗传算法的模式数据挖掘方法,属于数据挖掘

技术介绍
数据挖掘,指的是从大量的数据中提取出潜在的有趣的信息或模式,以供进一步使用的过程。项集是由事务数据库中的至少一个项组合而成的集合。事务数据库是一种可以记录交易、新闻等事务的数据库。事务数据库通常记录有至少一条事务,每条事务中包括至少一个数据项。在购物篮数据中,商品的数据项对应商品的名称,一条关于交易记录的事务中可以包括若干个商品的数据项。由于交易类的事务数据库往往能够反映用户的偏好信息,因此在向用户推荐相关信息时,往往会从事务数据库形成的多个项集中挖掘出向用户推荐的项集。频繁项集挖掘(frequentitemsetsmining,FIM),一直都是数据挖掘领域中的重要研究方向,它指的是从数据库中挖掘出其出现频率不低于用户指定阈值的项集的过程。虽然FIM能挖掘出事务数据库中那些频繁出现的项集,但是并没有考虑项集的效用值。而在挖掘项集的过程中,往往需要考虑效用值较高的项集(简称高效用项集,high-utilityi本文档来自技高网...

【技术保护点】
1.一种模式数据挖掘方法,所述方法基于遗传算法进行改进,其特征在于,包括:/n将原始数据库表示成位图的形式;/n初始化种群;/n对种群进行个体修复处理;/n得到高效用项集(HUIs)集合。/n

【技术特征摘要】
1.一种模式数据挖掘方法,所述方法基于遗传算法进行改进,其特征在于,包括:
将原始数据库表示成位图的形式;
初始化种群;
对种群进行个体修复处理;
得到高效用项集(HUIs)集合。


2.根据权利要求1所述的方法,所述对种群进行个体修复处理,包括:基于1-HTWUIs的TWU值大小进行顺序修剪;尽可能保存了个体中可能会产生较高效用值的项的组合;可选地,所述个体修复处理后,计算每个个体x的效用值,如果效用值不小于最小效用值,则将x添加到HUIs集合。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对种群中的重复HUIs进行邻域探索处理;可选地,所述对种群中的重复HUIs进行邻域探索处理,包括:针对基因操作之后所产生的新个体,不直接进行适应度评估,而是先检查该个体是否包含在HUIs集合中,如果是,则对其执行邻域变异,产生一个该HUI附近的新解,来探索其邻域空间内的解,然后再对其进行适应度评估,否则,直接进行适应度评估。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:进行种群多样性维持处理;可选地,所述进行种群多样性维持处理,包括:在每一次进化过程中,都从HUIs集合中选择两个连续存放的HUI来替换当前种群中的两个随机选择的个体。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:进行精英处理;可选地,所述进行精英处理,包括:将上一代种群Pt与当代种群Pt+1合并,并删除合并种群中的重复个体,然后按照utility值从大到小排序,并选择utility较大的个体构成下一代种群Q。


6.一种向用户...

【专利技术属性】
技术研发人员:方伟张强孙俊吴小俊
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1