基于随机梯度追踪技术的大数据二分类分布式优化方法技术

技术编号：26378401 阅读：37 留言：0更新日期：2020-11-19 23:47

本发明专利技术公开了一种基于随机梯度追踪技术的大数据二分类分布式优化方法，具体步骤为：设定二分类问题，获取训练样本数据、测试样本数据、样本特征；采用one‑hot编码将训练样本数据和测试样本数据扩展成向量数据，得到训练样本向量数据和测试样本向量数据；将训练样本向量数据进行智能体分配，结合梯度跟踪策略与随机平均梯度策略，建立带未知参数的分布式随机梯度跟踪策略S‑DIGing的问题模型；求解未知参数；将测试样本向量数据代入分布式随机梯度跟踪策略S‑DIGing的问题模型中进行二分类验证，并输出所述二分类问题对应的分布式随机梯度跟踪策略S‑DIGing的问题模型。极大降低了策略的复杂度和计算量，从而使S‑DIGing策略能够很好地处理大规模问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于随机梯度追踪技术的大数据二分类分布式优化方法
本专利技术涉及大数据分类处理
，具体的说是一种基于随机梯度追踪技术的大数据二分类分布式优化方法。
技术介绍
随着无线传感器网络、智能电网、机器学习和云计算等领域应用的出现，分布式优化理论和应用受到了广泛关注，并逐渐渗透到科学研究、工程应用和社会生活的多个方面。与传统的集中优化问题不同，分布式优化问题的主要思想是利用网络中的多个智能体共同最小化全局目标函数每个智能体计算自身的局部信息并将结果发送给其邻居代理。在现有文献中，对分布式优化策略的研究主要基于牛顿法、次梯度下降法和拉格朗日法。与其它两种策略相比，梯度下降策略相对简单，每个智能体只需计算局部目标函数的梯度，并根据梯度值进行梯度下降。基于梯度法，在文献[S.Liu,Z.Qiu,andL.Xie,“Convergencerateanalysisofdistributedoptimizationwithprojectedsubgradientalgorithm,”Automatica,vol.83,pp.162–169,20本文档来自技高网...

【技术保护点】
1.一种基于随机梯度追踪技术的大数据二分类分布式优化方法，其特征在于：具体步骤为：/nS1：设定二分类问题，获取对应二分类问题的数据集，从数据集中选取出N个训练样本数据和K个测试样本数据，并获取数据集样本的样本特征；/nS2：采用one-hot编码将训练样本数据和测试样本数据扩展成向量数据，得到N个训练样本向量数据和K个测试样本向量数据；/nS3：将N个训练样本向量数据进行智能体分配，每个智能体分配到q

【技术特征摘要】
1.一种基于随机梯度追踪技术的大数据二分类分布式优化方法，其特征在于：具体步骤为：
S1：设定二分类问题，获取对应二分类问题的数据集，从数据集中选取出N个训练样本数据和K个测试样本数据，并获取数据集样本的样本特征；
S2：采用one-hot编码将训练样本数据和测试样本数据扩展成向量数据，得到N个训练样本向量数据和K个测试样本向量数据；
S3：将N个训练样本向量数据进行智能体分配，每个智能体分配到qi个训练样本向量数据；
S4：结合梯度跟踪策略与随机平均梯度策略，建立带未知参数的分布式随机梯度跟踪策略S-DIGing的问题模型；
S5：求解分布式随机梯度跟踪策略S-DIGing的问题模型的未知参数；
S6：将K个测试样本向量数据代入分布式随机梯度跟踪策略S-DIGing的问题模型中进行二分类验证，并输出所述二分类问题对应的分布式随机梯度跟踪策略S-DIGing的问题模型。

2.根据权利要求1所述的基于随机梯度追踪技术的大数据二分类分布式优化方法，其特征在于：所述带未知参数的分布式随机梯度跟踪策略S-DIGing的问题模型为：

其中，li，h∈{-1，+1}表示智能体i的第h个样本的标签；ci，h表示智能体i第h个样本训练数据；m为智能体的个数；即将N个训练样本数据分配至m个智能体上，qi为每个智能体获得的样本；||·||表示向量的欧几里得范数与矩阵的谱范数表示实数集，表示n维的实数集；为问题模型的未知参数；为变量。

3.根据权利要求2所述的基于随机...

【专利技术属性】
技术研发人员：李华青，郑李逢，董滔，王政，吕庆国，严羽，冯丽萍，邬祥钊，郑祖卿，郭靖，
申请(专利权)人：西南大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人