【技术实现步骤摘要】
一种基于并行架构的迭代分割核学习方法
本专利技术涉及并行计算领域,尤其涉及一种基于并行架构的迭代分割核学习方法。
技术介绍
强化学习来源于动物学习和实验心理学,是一种交互式的机器学习方法,其所具有的强学习能力和适应能力是解决环境未知条件下最优策略学习的有效方法。传统的强化学习方法主要针对离散状态动作系统,当处理大规模空间或连续空间问题时,随着可取状态和动作数量的增加,会面临收敛速度慢甚至无法收敛的问题。自适应动态规划算法是模型未知时非线性系统最优控制的主流研究方法,该方法引入评价-执行网络结构,从而逼近系统的性能指标函数和控制策略。核方法作为一种非参数建模方法,使用核技巧将高维度中向量的内积通过低纬度的核函数计算。核方法具有不需要预设模型结构,对先验知识的依赖性很小,仅用少量的参数就能表达输入和输出的关系,具有很强的灵活性等优点。基于核学习构造的评价网络主要用于逼近值函数即性能指标函数,其关键在于权值向量的更新,当采用极大似然法更新权值向量的时候,会涉及到大规模的核矩阵求逆运算,导致计算的时间非常长,给算法的整体性能提升带来了十分严重的负担。研究一种基于并行架构的 ...
【技术保护点】
1.一种基于并行架构的迭代分割核学习方法,其特征在于:包括以下步骤:S101:获取核学习算法中的核矩阵
【技术特征摘要】
1.一种基于并行架构的迭代分割核学习方法,其特征在于:包括以下步骤:S101:获取核学习算法中的核矩阵并根据公式(1)对核矩阵进行分解:上式中,是L-p阶的方阵,是1×(L-p)阶的行向量,dp是1×1阶的矩阵;S102:根据公式(2)和公式(3)所示的等式计算得到矩阵EL-p:上式中,Ep为自定义的对称矩阵,IL-p是L-p阶的单位矩阵;S103:根据矩阵EL-p,计算得到hp如公式(4)所示:上式中,S104:根据cp、hp和γp,计算得到核矩阵的逆矩阵如公式(5):S105:将计算得到的逆矩阵存储于GPU的内核块中,并将循环次数p加1;判断循环次数p是否大于或者等于核矩阵的维数L?若否,则返回步骤S101,并将公式(5)中的作为新的核矩阵进行分解;若是,则到步骤S106;所述循环次数p的初始值为0;S106:结束循环迭代,并将每次循环迭代所存储的进行反向迭代,计算得到核矩阵的最终求逆结果2.如权利要求1所述的一种基于并行架构的迭代分割核学习方法,其特征在于:通过在GPU中自定义的Kernel1和Kernel2分别将向量与矩阵之间...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。