学习率计算方法及装置、分类模型计算方法及装置制造方法及图纸

技术编号：19594097 阅读：18 留言：0更新日期：2018-11-28 05:07

本发明专利技术涉及数据分类技术领域，提供一种学习率计算方法及装置、分类模型计算方法及装置。其中，该学习率计算方法包括：获得用于对数据进行分类的分类模型的经验风险，经验风险的参数包括用于迭代计算分类模型的学习率；基于随机漫步对学习率进行迭代计算，获得经验风险取最小值时学习率的值。由于将随机漫步引入了学习率的迭代计算过程，从而计算获得的学习率能够使作为优化对象的经验风险收敛到全局最优解而非局部最优解。进而分类模型在基于该学习率进行模型的迭代计算时，能够获得较高精度的模型，从而改善数据分类结果的准确性。该分类模型计算方法用于计算梯度渐进回归树模型，其中计算模型的学习率时采用该学习率计算方法进行计算。

全部详细技术资料下载

【技术实现步骤摘要】
学习率计算方法及装置、分类模型计算方法及装置
本专利技术涉数据分类
，具体而言，涉及一种学习率计算方法及装置、分类模型计算方法及装置。
技术介绍
机器学习(MachineLearning，ML)作为一门多领域交叉学科，广泛应用于数据挖掘、大数据等领域。常见的机器学习算法有：分类算法、聚类算法、神经网络、强化学习等。其中，分类算法是一种有监督学习方法，是数据挖掘中的一个很重要的任务，目的是依据训练样本学习一个分类器，从而实现将数据映射到给定类别中的某一类别(值)。常见的分类算法有决策树、逻辑回归、组合分类器等。梯度渐进回归树是一种组合分类器，由Freidman于1999年提出，属于一种迭代决策回归树算法，该算法生成的梯度渐进回归树模型为一种累加模型。算法的优点主要包括：算法可以灵活处理各种类型的数据、包括连续值和离散值；算法所需参数较少，且准确率较高；算法鲁棒性较好等。基于上述优点，该算法自提出以来应用于各行各业的数据挖掘与大数据分析中。梯度渐进回归树算法的主要缺陷之一是在求解累加模型的学习率时容易陷入局部最优解，不能得到最优模型，从而导致对某些数据进行分类的效果不佳。
技术实现思路
有鉴于此，本专利技术实施例提供一种学习率计算方法及装置、分类模型计算方法及装置，以解决上述技术问题。为实现上述目的，本专利技术提供如下技术方案：第一方面，本专利技术实施例提供一种学习率计算方法，包括：获得用于对数据进行分类的分类模型的经验风险，经验风险的参数包括用于迭代计算分类模型的学习率；基于随机漫步对学习率进行迭代计算，获得经验风险取最小值时学习率的值。可见，由于将随机漫...

【技术保护点】
1.一种学习率计算方法，其特征在于，包括：获得用于对数据进行分类的分类模型的经验风险，所述经验风险的参数包括用于迭代计算所述分类模型的学习率；基于随机漫步对所述学习率进行迭代计算，获得所述经验风险取最小值时所述学习率的值。

【技术特征摘要】
1.一种学习率计算方法，其特征在于，包括：获得用于对数据进行分类的分类模型的经验风险，所述经验风险的参数包括用于迭代计算所述分类模型的学习率；基于随机漫步对所述学习率进行迭代计算，获得所述经验风险取最小值时所述学习率的值。2.根据权利要求1所述的学习率计算方法，其特征在于，所述学习率为γ，所述经验风险为J(γ)，所述基于随机漫步进行迭代计算，获得所述经验风险取最小值时所述学习率的值，包括：确定迭代次数K、迭代步长λ的初始值、γ的初始值、误差容忍度ξ以及步长更新参数l，其中，K为正整数，λ>ξ>0，l>1；基于λ对γ进行K次迭代，将第K次迭代后γ的值γ(K)确定为在λ下J(γ)取最小值时γ的值，其中，每次迭代时均基于λ对γ进行随机更新并更新后J(γ)的值是否减小；将λ的值更新为λ/l；在确定满足λ≥ξ时，将γ(K)确定为γ的初始值，跳转至“基于λ对γ进行K次迭代”的步骤重复执行，直至满足λ<ξ；将满足λ<ξ时γ的值确定为J(γ)取最小值时γ的值。3.根据权利要求2所述的学习率计算方法，其特征在于，所述基于λ对γ进行K次迭代，将第K次迭代后γ的值γ(K)确定为在λ下J(γ)取最小值时γ的值，包括：取迭代次数k为1至K，在第k次迭代时生成随机数uk；基于公式γ(k)＝γ(k-1)+λuk计算所述第k次迭代后γ的值γ(k)，其中，γ(k-1)为第k－1次迭代后γ的值；在确定满足J(γ(k))<J(γ(k-1))时，将γ(k)作为γ的初始值，跳转至“取迭代次数k为1至K，在第k次迭代时生成随机数uk”的步骤重复执行；将第K次迭代后γ的值γ(K)确定为在λ下J(γ)取最小值时γ的值。4.根据权利要求3所述的学习率计算方法，其特征在于，uk为区间[－1，1]内的随机数。5.一种分类模型计算方法，其特征在于，所述分类模型为用于对数据进行分类的梯度渐进回归树模型F(x)，F(x)通过M次迭代获得，所述方法包括：确定迭代次数M、F(x)的初始化模型以及F(x)的经验风险J(γ)，其中，γ为用于迭代计算F(x)的学习率，M为正整数；取迭代次数m为1至M，在第m次迭代时，拟合决策回归树并将所述决策回归树表示为hm(x)；利用如权利要求1－4中任一项所述的学习率计算方法计算获得J(γ)在第m次迭代时对应的经验风险Jm(γ)取最小值时γ的值γm；基于公式Fm(x)＝Fm-1(x)+γmhm(x)计算所述第m次迭代后...

【专利技术属性】
技术研发人员：覃进学，王纯斌，詹雪薇，
申请(专利权)人：成都四方伟业软件股份有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人