【技术实现步骤摘要】
一种多模态数据模型的问题求解层选择方法、系统、装置
[0001]本专利技术属于大数据领域,具体涉及一种多模态数据模型的问题求解层选择方法、系统、装置。
技术介绍
[0002]在大数据处理领域,每一种信息的来源或者形式,都可以称为一种模态。例如,人的触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。同时,模态也可以有非常广泛的定义,比如我们可以把两种不同的语言当做是两种模态,甚至在两种不同情况下采集到的数据集,亦可认为是两种模态。
[0003]多模态数据是一种包含多个不同层次信息的数据,例如,真实的物理环境就是一个多模态的环境,用于分析和评估环境特征的数据通常为多模态数据。多模态数据广泛存在,对不同模态信息进行有效处理是大数据挖掘的迫切需求。现有对多模态数据进行知识获取的方法都是基于单层次的,但不同层次上是蕴含不同知识的,因此我们希望能对多模态数据实现不同层次上的表示,能从不同角度挖掘,就可以更好地获取知识。
[0004]在多模 ...
【技术保护点】
【技术特征摘要】
1.一种多模态数据模型的问题求解层选择方法,其用于在划分序乘积空间中对问题求解层进行优选,进而得到最优的问题求解层;其特征在于,所述问题求解层选择方法包括预选阶段和优选阶段,预选阶段采用经典遗传算法进行处理,用于选出部分次优问题求解层;优选阶段采用改进的自适应遗传算法进行处理,用于确定最优问题求解层;其中,所述问题求解层选择方法包括如下处理步骤:S1:采用实数编码方式将划分序乘积空间中的问题求解层表示成遗传空间的染色体个体,进而随机生成一个包含多个染色体的准初始种群;S2:根据目标问题求解层对分类精度指标和粒度指标的边界限制条件,定义一个适应度函数;S3:设定预选阶段的迭代条件,对所述准初始种群进行迭代更新,并保存每轮迭代更新过程中的最优个体,进而预选出种群中的部分次优个体;预选过程详细如下:S31:采用自定义的适应度函数计算当前轮次中所述准初始种群内每个个体的适应度值;S32:选择适应度值最佳的个体作为当前轮次的最优个体,并保存到一个预选集合中;S33:使用经典遗传算法依次对所述准初始种群进行选择、交叉以及变异操作;更新所述准初始种群;S34:循环执行步骤S31
‑
S33,直到达到预选阶段设定的迭代条件,结束算法迭代并输出所述预选集合;所述预选集合中包含的所有个体即为预选出的次优种群;S4:对经典遗传算法中的选择算子、交叉算子和变异算子进行改良,得到一种新的自适应遗传算法;所述自适应遗传算法的改进方法如下:S41:将选择算子设计为随当前种群进化迭代次数动态变化的自适应算子;在迭代前期同时选择轮盘赌选择和精英保留策略;在迭代后期仅选择精英保留策略;S42:将交叉算子设计为交叉概率随当前种群进化迭代次数以及交叉个体适应度值动态变化的自适应交叉算子;交叉方式选择多点交叉;S43:将变异算子设计为密集因子随当前种群进化迭代次数动态变化的自适应大变异算子,使得迭代前期的密集因子大于迭代后期的密集因子;S5:随机生成一批新的染色体,将新的染色体和所述次优种群合并作为优选阶段的初始种群;S6:设定优选阶段的迭代条件,对所述初始种群进行迭代更新;并在迭代更新结束后选择出最优的问题求解层;详细过程如下:S61:采用自定义的适应度函数计算当前轮次中所述初始种群内每个个体的适应度值;S62:使用自适应遗传算法依次对准初始种群进行自适应选择、自适应交叉以及自适应变异操作;S63:循环执行步骤S61
‑
S62,直到达到预选阶段设定的迭代条件,结束算法迭代并输出初始种群中适应度值最优的个体作为所需的最优问题求解层。2.如权利要求1所述的多模态数据模型的问题求解层选择方法,其特征在于:步骤S1的准初始种群和步骤S5的初始种群中,染色体中每一位对应一个视角,每一位上的基因值对应该视角下的层次序号。3.如权利要求1所述的多模态数据模型的问题求解层选择方法,其特征在于:自定义的
适应度函数定义如下:其中,α和β分别为分类精度与粒度的权重,满足0≤α≤1,0≤β≤1,α+β=1;r
O
(l,D)和g(l)分别是问题求解层l的分类精度和粒度;r
a
是问题求解层需要达到的分类精度;g
Thinnest
是划分序乘积空间中最细问题求解层的粒度;abs()是一个返回给定参数绝对值的函数。4.如权利要求1所述的多模态数据模型的问题求解层选择方法,其特征在于:步骤S33的经典遗传算法中,选择操作的选择方式为同时采用轮盘赌选择和精英保留策略;交叉操作的交叉方式为单点交叉;变异操作的变异方式为单点变异。5.如权利要求1所述的多模态数据模型的问题求解层选择方法,其特征在于:预选阶段和优选阶段的迭代终止条件均设置为达到迭代次数;其中,优选阶段的迭代次数大于预选阶段的迭代次数。6.如权利要求1所述的多模态数据模型的问题求解层选择方法,其特征在于:步骤S41中,迭代前期和迭代后期的划分方法如下:假设遗传算法的最大迭代次数为T,当前迭代次数为t,0<t<T;给定一个分段划分的阈...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。