System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是一种基于蚁狮优化的缺失不平衡数据多分类方法和设备。
技术介绍
1、在大数据兴起的浪潮中,数据规模大幅增长,每日产生的数据量已经从pb、eb级迅速跃升至zb级,甚至是yb级。其中,不平衡性是大量数据的重要特征,不平衡数据中的少数类数据包含的信息较少,这使得算法对该类样本特征的学习和识别较为困难。
2、相关技术中,可以通过基于分解的方法对不平衡数据进行分类。基于分解的方法是将多分类问题分解为多个二分类问题,然后逐次求解。在每个二分类问题中都采取固定分类方法进行分类。
3、但是上述方法灵活性较低,在不同数据集上的分类效果差异较大。
技术实现思路
1、鉴于上述问题,本申请实施例提供了一种基于蚁狮优化的缺失不平衡数据多分类方法、装置、电子设备和可读存储介质,以便克服上述问题或者至少部分地解决上述问题。
2、本申请实施例的第一方面,提供了一种基于蚁狮优化的缺失不平衡数据多分类方法,所述方法包括:
3、基于目标场景下第一待分类数据集的缺失数据个数生成至少一个第一编码;
4、基于所述第一待分类数据集的预设类别数和分类器库所包含的分类器的类别数生成多个第二编码;
5、基于所述第一编码和各个所述第二编码生成多个迭代编码;
6、基于蚁狮优化算法,从所述多个迭代编码中筛选得到适应度最大的目标迭代编码;
7、从所述分类器库中抽取所述目标迭代编码对应的分类器进行组合,得到目标分类器群;
...【技术保护点】
1.一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于目标场景下的第一待分类数据集的缺失数据个数生成至少一个第一编码,包括:
3.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于蚁狮优化算法,从所述多个迭代编码中筛选得到适应度最大的目标迭代编码,包括:
5.根据权利要求2所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于所述目标分类器群识别所述第一待分类数据集的类别,包括:
6.根据权利要求5所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述取值区间的下限值的大小与所述填补特征值的大小正相关。
7.根据权利要求2所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于所述目标分类器群识别所述第一待分类数据集的类别,包括:
8.根据权利要求7所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于所述第一编码、所述第一待分类数据集中的最大特征值和所述第一待分类数据集中的最小特征值,计算填补特征值,包括:
9.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述目标场景包括:网络新闻数据的分类识别场景和医学图像数据的分类识别场景中的至少一个。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1至9任意一项所述的基于蚁狮优化的缺失不平衡数据多分类方法。
...【技术特征摘要】
1.一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于目标场景下的第一待分类数据集的缺失数据个数生成至少一个第一编码,包括:
3.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于蚁狮优化算法,从所述多个迭代编码中筛选得到适应度最大的目标迭代编码,包括:
5.根据权利要求2所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述基于所述目标分类器群识别所述第一待分类数据集的类别,包括:
6.根据权利要求5所述的一种基于蚁狮优化的缺失不平衡数据多分类方法,其特征在于,所述取值区...
【专利技术属性】
技术研发人员:刘艺,郑奇斌,李庚松,杨国利,李翔,史殿习,刁兴春,
申请(专利权)人:北京大数据先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。