基于改进二进制粒子群算法的烟叶复烤配方关联特征研究的方法组成比例

技术编号:32359003 阅读:11 留言:0更新日期:2022-02-20 03:23
本发明专利技术公开了一种基于改进二进制粒子群算法的烟叶复烤配方关联特征研究方法,涉及烟草生产领域,为了更好地挖掘出烟叶复烤配方内在的关联特征以更有效的对复烤配方进行维护。针对Apriori算法需要人工预设支持度和置信度,容易出现海量冗余规则、规则质量较低的缺陷。现提出如下方法,该方法具体是:从复烤配方数据集当中发现烟叶协同搭配的关系。本发明专利技术将改进后的二进制粒子群算法(Improved Binary Particle Swarm Optimization Algorithm,IBPSO)用于烟叶复烤配方关联规则挖掘,在种群初始化阶段引入拉丁超立方抽样,局部搜索方面提出limit机制和随机扰动等策略保证算法有效跳出局部最优,该方法不需要提前设定规则提取阈值,可自动提取M条较佳规则,同时结果无冗余规则。规则。规则。

【技术实现步骤摘要】
基于改进二进制粒子群算法的烟叶复烤配方关联特征研究的方法


[0001]本专利技术涉及烟草生产领域,尤其涉及基于改进二进制粒子群算法(IBPSO)的烟叶复烤配方关联特征研究的方法。

技术介绍

[0002]卷烟作为一种特殊的产品,通常要求吸食口感长期保持稳定。复烤企业作为烟草生产链的关键环节,实现对烟叶的初步加工及模块化配方打叶,对不同质量的烟叶进行协调搭配,为卷烟企业提供稳定的原材料。但在实际生产中,烟叶质量受气候、土质等因素的影响,导致复烤配方每年的波动性较大,如何维护复烤配方模块是目前亟待解决的问题。
[0003]近年来,研究人员通过关联规则Apriori算法挖掘可得到配方中隐藏的大量烟叶搭配协同信息进而提炼为规则,能在一定程度上实现配方稳定的维护。但采用Apriori算法进行关联分析,需要人工设定规则提取阈值,挖掘结果受主观性影响大,造成海量冗余规则的出现且规则质量很低,如何解决上述问题是现阶段研究的方向,关联分析属于离散域问题,而二进制粒子群算法在离散优化方面具有较好的性能,近年来出现了不少将二进制粒子群算法用于关联规则挖掘的研究,但现有文献并未将该算法运用到烟叶配方维护的领域中。
[0004]因此,如何更好地挖掘出烟叶复烤配方内在的关联特征以更有效的对复烤配方进行维护,针对Apriori算法需要人工预设支持度和置信度,避免出现海量冗余规则、提升规则质量是本领域技术人员目前需要解决的技术问题。

技术实现思路

[0005](一)专利技术目的
[0006]有鉴于此,本专利技术的目的在于提出基于改进二进制粒子群算法的烟叶复烤配方关联特征研究方法,以实现更好地挖掘出烟叶复烤配方内在的关联特征以更有效的对复烤配方进行维护,针对Apriori算法需要人工预设支持度和置信度,避免出现海量冗余规则且规则质量较低等缺陷为目的。
[0007](二)技术方案
[0008]为达到上述技术目的,本专利技术提供了基于改进二进制粒子群算法的烟叶复烤配方关联特征研究的方法:
[0009]其该方法具体是:
[0010]a).粒子编码包括关联规则:
[0011]从数据集当中发现事务之间的关系,用形如{A}

{B}这样的规则来表示,生成的关联规则必须同时满足最小支持度和置信度;
[0012]定义1:支持度表示事务A和B在整个数据库中的占比,数学表达为:
[0013][0014]定义2:置信度表示所有包含A的事务中又包含事务B的占比,数学表达为:
[0015][0016]由上述可知,关联规则挖掘属于离散域问题,采用二进制编码将原始数据转换为二进制数据,每条记录的属性为0或1,在实际计算时计算出相应的支持度和置信度;
[0017]b).解码:
[0018]在满足既定最大迭代次数M的前提下,最后得到的M个全局最佳位置即为关联规则,但是需要一定的方式去将其解码,此处采用采用Holland的密歇根方法,得到形如{A}

{B}的规则;
[0019]c).适应度函数;
[0020]在Apriori算法中,适应度函数多以支持度或置信度为主,单独使用支持度为适应度函数,数据集中很少出现的项会被删减,尽管它们仍然会产生潜在有价值的规则,若单独使用置信度,根据置信度的定义,具有更高支持度的结果将自动产生更高的置信值,即使项目之间不存在关联,支持度和置信度的乘积作为关联规则挖掘问题的适应度函数,将二者同时考虑;
[0021]Fitness=[Support(A

B)Confidence(A

B)]max
ꢀꢀꢀꢀꢀꢀꢀ
(3)
[0022]d).改进二进制粒子群算法:
[0023]基本粒子群优化算法只能解决连续问题,为了解决离散空间问题,针对二进制粒子群算法在进行关联规则挖掘时容易陷入局部最优,产生大量无用计算的缺陷,从全局优化以及局部搜索方面进行了改进;
[0024]全局改进主要从种群初始化方面进行设计,二进制粒子群算法一般都是采用随机初始化策略,但种群的好坏同样影响算法的收敛速度和精度,鉴于此采用拉丁超立方抽样初始化种群,均匀划分搜索空间,保持初始种群的多样性,同时拉丁超立方抽样可以保证变量覆盖整个分布空间,最终获得的规则可保持多样化;
[0025]局部搜索包括limit机制和随机扰动,其中随机扰动包括基本二进制粒子群算法速度更新表示为(4),受三部分的影响,即粒子当前速度、当前局部最优值、全局最优值;
[0026][0027]一旦粒子陷入局部最优,此时的全局最优解即局部最优解,但实际上还有更优质的解没有被搜索到,而且从一定程度上来说,对局部最优值有一定的依赖性,作为启发式算法,陷入局部最优不可避免,最直接的方式便是加入随机机制;
[0028]在粒子速度更新阶段加入随机位置扰动,可扩大搜索空间,使算法跳出局部最优成为可能,如式(5)所示;
[0029][0030]其中是第k次迭代时第i个粒子的速度,w为惯性因子,c1、c2为正常数,r1、r2来自均匀分布(0,1),p
i
为粒子最佳适应值,g为全局最优适应值,x
i
是粒子当前位置,x

为粒子的随机位置,类似的,r3来自均匀分布(0,1)。由于二进制粒子群算法中粒子位置只能为0、1,所以粒子位置通过映射函数来决定,rand()为[0,1]之间的随机数,如式(6);
[0031][0032]e).算法框架将改进后的粒子群算法用于关联分析;
[0033]f).实验与分析:
[0034]包括数据预处理和关联特征分析,可以很好的对粒子群算法从三个方面提出了改进策略,其次将其应用到关联规则复烤配方挖掘中,算法避免了传统Apriori算法预设最小支持度和最小置信度的缺陷,且能避免大量冗余规则的出现、且提升规则的质量,将历史配方中烟叶协同搭配信息表现为规则形式,在实际生产中,该方法可配方维护工作提供一定的指导作用,也能为配方的优化提供新的依据和方法。
[0035]优选的,引入limit阈值克服算法跳出局部最优,对于算法的迭代过程相当于一种监控,在算法初始阶段,提前设置阈值的极大值limit
max
,算法迭代时,观察每个粒子在阈值内的位置是否发生变化,若没有发生变化,则说明算法可能陷入了局部最优,此时需要调整陷入局部最优的粒子位置,是若某个粒子位置在limit
max
内位置没发生改变,则直接舍弃,生成新的粒子作为补充,阈值的大小对算法寻优能力的影响较大,经过多次试验,将limit
max
阈值设置为80,同时,阈值大小可随着种群以及迭代次数的改变适当调整。
[0036]优选的,数据预处理包括将现有复烤厂历史烟叶复烤配方共计82个,分为不同的模块配方,但是由于有些模块配方数较少,不适合关联规则挖掘,因此本文结合企业实际生产,对主要模块配方进行关联规则本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进二进制粒子群算法的烟叶复烤配方关联特征研究的方法,其特征在于,该方法具体是:a).粒子编码包括关联规则:从数据集当中发现事务之间的关系,用形如{A}

{B}这样的规则来表示,生成的关联规则必须同时满足最小支持度和置信度;定义1:支持度表示事务A和B在整个数据库中的占比,数学表达为:定义2:置信度表示所有包含A的事务中又包含事务B的占比,数学表达为:由上述可知,关联规则挖掘属于离散域问题,采用二进制编码将原始数据转换为二进制数据,每条记录的属性为0或1,在实际计算时计算出相应的支持度和置信度;b).解码:在满足既定最大迭代次数M的前提下,最后得到的M个全局最佳位置即为关联规则,但是需要一定的方式去将其解码,此处采用采用Holland的密歇根方法得到形如{A}

{B}的规则;c).适应度函数;将支持度和置信度的乘积作为关联规则挖掘问题的适应度函数同时考虑;Fitness=[Support(A

B)Confidence(A

B)]
max
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)d).改进二进制粒子群算法:针对二进制粒子群算法在进行关联规则挖掘时容易陷入局部最优,产生大量无用计算的缺陷,从全局优化以及局部搜索方面进行了改进;全局改进主要从种群初始化方面进行设计,采用拉丁超立方抽样初始化种群,均匀划分搜索空间,保持初始种群的多样性,同时拉丁超立方抽样可以保证变量覆盖整个分布空间,最终获得的规则可保持多样化;局部搜索包括limit机制和随机扰动,基本二进制粒子群算法速度更新表示为(4),v
ik+1
受三部分的影响,即粒子当前速度、当前局部最优值、全局最优值;一旦粒子陷入局部最优,此时的全局最优解即局部最优解,但实际上还有更优质的解没有被搜索到,而且从一定程度上来说,对局部最优值有一定的依赖性,作为启发式算法,陷入局部最优不可避免,最直接的方式便是加入随机机制;在粒子速度更新阶段加入随机位置扰动,可扩大搜索空间,使算法跳出局部最优成为可能,如式(5)所示;其中是第k次迭代时第i个粒子的速度,w为惯性因子,c1、c2为正常数,r1、r2来自均
匀分布(0,1),p
i
为粒子最佳适应值,g为全局最优适应值,x
i
是粒子当前位置,x

为粒子的随机位置,类似的,r3来自均匀分布(0,1)。由于二进制粒子群算法中粒子位置只能为0、1,所以粒子位置通过映射函数来决定,rand(...

【专利技术属性】
技术研发人员:侯开虎杜清清邓超朱波陈兴侯陈明马显滔范振宇刘雅琴
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1