System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于量子法医调查机制的特征选择方法、系统及存储介质技术方案_技高网

一种基于量子法医调查机制的特征选择方法、系统及存储介质技术方案

技术编号:41283543 阅读:6 留言:0更新日期:2024-05-11 09:33
一种基于量子法医调查机制的特征选择方法、系统及存储介质,涉及数据处理领域,为解决现有的特征选择方法分类正确率不高以及时间复杂度高,选择的特征子集精度不够的问题。包括:步骤一:对数据集进行归一化处理,采用K近邻分类器对训练集样本进行聚类,对测试集样本进行分类,构建特征选择的目标函数;步骤二:初始化量子警察群体中每个成员的量子位置,计算量子警察个体的适应度,确定初始全局最优量子位置;步骤三:分别对调查组和追捕组每个成员的量子位置进行更新;步骤四:更新调查组和追捕组以及量子警察群体的全局最优量子位置;步骤五:对调查组和追捕组中的部分成员进行交换,继续演化;步骤六:最终迭代得到选取的最优特征子集。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体而言,涉及一种基于量子法医调查机制的特征选择方法、系统及存储介质


技术介绍

1、特征选择技术是一种从原始特征中选择最有效的特征子集以降低数据集维度并使得系统的特定指标最优化的方法,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。现有的特征选择方法按照特征子集的评价标准是否与后续的学习算法相结合可分为嵌入式特征选择方法、过滤式特征选择方法和封装式特征选择方法。其中封装式特征选择方法因将特征选择问题与后续的学习方法相结合,利用分类器来评价选取特征子集的优劣使得所选子集的性能有较大的优势而被广泛应用。同时,封装式特征选择多与各类群智能算法相结合来提升特征选择的效率,降低时间复杂度,增加所选特征子集的精度。但是由于工程问题的困难性和复杂性,现有的群智能算法的优化能力很难同时达到收敛性好、收敛精度高和时间复杂度低的效果,因此设计一种特征选择用时短、所选特征子集性能好并且鲁棒性强的特征选择方法有重要的理论价值和研究意义。

2、现有研究中,贾鹤鸣等在《控制与决策》(2022,vol.37,no.02,pp.445-454)发表的“基于改进秃鹰搜索算法的同步优化特征选择”提出了一种利用算法同时优化支持向量机参数和进行特征选择的同步优化特征选择模型。将秃鹰算法与模拟退火算法相结合的改进秃鹰算法在收敛速度和收敛精度上有一定提升,但由于秃鹰算法是一种收敛精度较低的群智能算法,利用传统方法对该算法进行相应改进难以突破算法本身的局限性,因此该方法在特征子集的选取上未能达到十分理想的结果,且用支持向量机实现多分类问题的训练开销较大,特征选择用时较长。mohamed abdel-basset等在《artificial intelligencereview》(2020,vol.54,pp.1-45)发表的“a hybrid harris hawks optimizationalgorithm with simulated annealing for feature selection”中提出了一种基于模拟退火的哈里斯鹰算法并将算法应用于采用k近邻法作为学习算法评价指标的封装式特征选择中。该方法对哈里斯鹰算法进行了改进,提升了哈里斯鹰算法的收敛性。但由于改进后的哈里斯鹰算法时间优势仍不明显,不能较好的发挥利用k近邻法简单和时效性高的特点设计的封装式特征选择模型具有较低的时间复杂度的优势。r.k.agrawal等在《artificialintelligence review》(2020,vol.89)发表的“quantum based whale optimizationalgorithm for wrapper feature selection”中提出了双链编码的量子鲸鱼算法并应用于封装式特征选择。通过对鲸鱼算法的量子编码极大的提高了算法的收敛速度和收敛精度,并且可以兼顾所用时间。将量子鲸鱼算法与四种传统分类方法相结合的封装式特征选择模型均得到了较高的分类正确率和较低的平均特征数。但由于鲸鱼算法是一种被较早提出的群智能算法,其收敛性有明显不足,且所设计量子鲸鱼算法的量子旋转角更新公式过于简单,因此算法的精度有待进一步的提升。

3、可见,现有封装式特征选择方法将传统的优化方法应用于特征选择中会面临收敛精度低,时间成本高等问题,采用常见的改进策略对群智能方法进行改进难以同时兼顾收敛速度、收敛精度和所用时间。要达到智能优化方法快速收敛和所选特征子集优越性高的目标,如何提高收敛速度、收敛精度、减少所用时间是亟待解决的技术问题。


技术实现思路

1、本专利技术要解决的技术问题是:

2、现有的特征选择方法分类正确率不高以及时间复杂度高,选择的特征子集精度不够。

3、本专利技术为解决上述技术问题所采用的技术方案:

4、本专利技术提供一种基于量子法医调查机制的特征选择方法,包括如下步骤:

5、步骤一:对数据集进行归一化处理,将处理后的数据集随机划分为训练集和测试集,采用k近邻分类器对训练集样本进行聚类,对测试集样本进行分类,基于k近邻分类器的分类精度和所选特征个数构建特征选择的目标函数,随机生成含有多个分别代表不同特征子集的量子警察群体;

6、步骤二:初始化量子警察群体中每个成员的量子位置,利用目标函数计算量子警察个体的适应度,将量子警察群体平均分为调查组和追捕组两个子群体,确定各个子群体和量子警察群体的初始全局最优量子位置;

7、步骤三:分别对调查组和追捕组每个成员的量子位置同时进行更新;

8、步骤四:计算每个量子警察个体进行量子位置更新后的适应度值,更新调查组和追捕组以及量子警察群体的全局最优量子位置;

9、步骤五:对调查组和追捕组中的部分成员进行交换,形成新的调查组和追捕组继续执行步骤三至步骤四;

10、步骤六:迭代次数加1,重复执行步骤三至步骤五,至达到最大迭代次数;最终得到选取的最优特征子集。

11、进一步地,步骤一包括如下步骤:

12、(1)针对数据集i=[(z1,y1),(z2,y2),...,(zl,yl)],其中z=[z1,z2,...,zl]为数据集中的数据样本,y=[y1,y2,...,yl]为数据集中的类别标签,l为数据集中数据样本的总数,每个数据样本在特征向量中都有d个特征元素,即zi=[zi1,zi2,...,zid],i=1,2,...,l,d为数据集包含的特征数;

13、对数据集进行归一化处理,随机选取占比为α1的数据样本及其类别标签作为训练集其余数据为测试集遍历[kmin,kmax]范围内的所有奇数值为k的值,以0-1损失函数为交叉验证的损失函数采用c折交叉验证法确定[kmin,kmax]范围内的最优k值,其中k为k近邻法每一邻域内包含的样本个数,kmin为k值搜索的下界,kmax为k值搜索的上界;

14、(2)设i′2中第j个数据样本为z′j,初始化j=α1l+1;

15、(3)计算z′j与训练集中所有数据样本的欧氏距离其中z′i为训练集中的第i个数据样本,i=1,2,...,α1l;

16、(4)寻找训练集中与z′j的欧氏距离最小的k个数据样本,将涵盖这k个数据样本的z′j的邻域记作nk(z′j);

17、(5)采用多数表决法判定z′j的类别标签其中yi为z′i对应的类别标签,i=1,2,...,α1l,h=1,2,...,u,为指示函数,即当时的值为1;否则为0;

18、(6)若j=l,结束对测试集数据类别标签的判定,完成测试集分类;否则令j=j+1,重复执行步骤(3)-步骤(5),至满足分类结束的条件。

19、进一步地,步骤一中所述目标函数具体为:其中χ为分类精确性,代表分类正确率在适应度函数中所占的比重,γr为k近邻法分类器取得的分类正确率,ξ为所选特征重要性,表示所选特征个数在适应度函数中所占权重,ξ=1-χ,为所选特征子集数。

本文档来自技高网...

【技术保护点】

1.一种基于量子法医调查机制的特征选择方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤一包括如下步骤:

3.根据权利要求2所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤一中所述目标函数具体为:其中χ为分类精确性,代表分类正确率在适应度函数中所占的比重,γR为K近邻法分类器取得的分类正确率,ξ为所选特征重要性,表示所选特征个数在适应度函数中所占权重,ξ=1-χ,为所选特征子集数。

4.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤二包括如下过程:

5.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤三包括如下步骤:

6.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤五中调查组第n位成员被选中进入追捕组的概率为追捕组第n位成员被选中进入调查组的概率为

7.根据权利要求1所述的基于量子法医调查机制的特征选择方法的应用,其特征在于,用于数据分类、生物医学、图像处理和通信信号处理领域的特征选择。

8.一种基于量子法医调查机制的特征选择系统,其特征在于,该系统具有与上述权利要求1~7任一项权利要求的步骤对应的程序模块,运行时执行上述的基于量子法医调查机制的特征选择方法中的步骤。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现权利要求1~7中任一项所述的基于量子法医调查机制的特征选择方法中的步骤。

...

【技术特征摘要】

1.一种基于量子法医调查机制的特征选择方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤一包括如下步骤:

3.根据权利要求2所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤一中所述目标函数具体为:其中χ为分类精确性,代表分类正确率在适应度函数中所占的比重,γr为k近邻法分类器取得的分类正确率,ξ为所选特征重要性,表示所选特征个数在适应度函数中所占权重,ξ=1-χ,为所选特征子集数。

4.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤二包括如下过程:

5.根据权利要求1所述的基于量子法医调查机制的特征选择方法,其特征在于,步骤三包括如下步骤:

6.根...

【专利技术属性】
技术研发人员:高洪元郭颖贾克郭兰图金兆阳揣济阁谷晓苑陈暄王嘉瑶
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1