一种基于在线学习的边云协同k均值聚类的模型优化方法技术

技术编号:23704429 阅读:135 留言:0更新日期:2020-04-08 11:05
本发明专利技术公开了一种基于在线学习的边云协同k均值聚类的模型优化方法,属于边缘计算/机器学习技术领域。提出了一种新的“Learning to Learn”的框架,用于在具有资源约束的边缘服务器上进行有效的边云协同K‑means学习。各个边缘服务器同时从云服务器读取当前时刻的全局聚类簇中心至本地服务器,从本地数据集中随机抽取一个小批量数据并在此批上进行K‑means的迭代训练,随后将局部聚类簇中心上传至云服务器完成全局参数的更新。将云服务器的协同策略的动态确定建模为在线优化问题,并设计了基于预算受限的固定资源消耗的MAB模型的在线学习算法。同时支持同步的学习模式,可用于非监督学习任务。有效地利用边缘处有限的计算和通信资源以获取最佳的分布式K‑means聚类算法性能。

An online learning based model optimization method for edge cloud collaborative K means clustering

【技术实现步骤摘要】
一种基于在线学习的边云协同k均值聚类的模型优化方法
本专利技术属于边缘计算/机器学习
,具体涉及一种基于在线学习的边云协同k均值聚类的模型优化方法。
技术介绍
K-means聚类分析是按照数据之间的相似性(距离准则)对数据进行划分或分组处理的重要技术,可以帮助人们发现数据的潜在规律,在数据挖掘、统计学、生物学以及市场营销等领域广泛应用。随着物联网、虚拟现实、社交网络和5G技术的激增,边缘网络服务的智能设备和传感器的数量不断增加,其中生成的数据量呈指数级增长,可用于K-means聚类分析的数据通常分布在各边缘服务器上,考虑到骨干网络在实际中的负担,将这种大数据传输到云以用于集中式K-means聚类分析会消耗大量的I/O资源。为了解决这个问题,已经提出了移动边缘计算(MEC)范例中的协作ML的概念,旨在通过分布式边缘节点/服务器(如笔记本电脑、智能手机和自动驾驶车)和云服务器之间的协作学习(各边不需要将本地数据上传至中心服务器,而只需将本地的参数上传至云)来实现灵活、快速且经济高效的机器学习。与云上的集中式学习相比,虽然典型的边云协作本文档来自技高网...

【技术保护点】
1.一种基于在线学习的边云协同k均值聚类的模型优化方法,其特征在于,包括以下步骤:/n步骤1:云服务器初始化全局参数,包括k个聚类簇中心w(0),本地迭代所用数据批量大小b,各边缘服务器的总资源约束R;以及多臂老虎机的臂个数K和每个臂对应的迭代次数p(K);/n步骤2:云服务器将当前时刻t的全局聚类簇中心w(t)和迭代次数p(K)广播给所有边缘服务器N

【技术特征摘要】
1.一种基于在线学习的边云协同k均值聚类的模型优化方法,其特征在于,包括以下步骤:
步骤1:云服务器初始化全局参数,包括k个聚类簇中心w(0),本地迭代所用数据批量大小b,各边缘服务器的总资源约束R;以及多臂老虎机的臂个数K和每个臂对应的迭代次数p(K);
步骤2:云服务器将当前时刻t的全局聚类簇中心w(t)和迭代次数p(K)广播给所有边缘服务器Ni;
步骤3:边缘服务器在本地数据集中随机抽取包含b条数据的一个batch,计算这个batch数据与全局聚类簇中心w(t)的距离,把每个数据样本点并入离其最近的簇中,对调整后的新簇计算新的聚类簇中心,进行p(K)次迭代训练,得到新的局部聚类簇中心wi(t);
步骤4:记录边缘服务器Ni本地迭代所消耗的时间ci,1和边缘服务器向云服务器上传参数所消耗的时间ci,2,用所有边缘服务器本地迭代所消耗的时间和向云服务器上传参数所消耗的时间的最大值更新总资源约束R;
步骤5:每个边缘服务器Ni将其局部聚类簇中心wi(t)上传至云服务器,云服务器读取所有边缘服务器的局部聚类簇中心来更新全局聚类簇中心w(t);
步骤6:云服务器同步对所有边缘服务器进行决策;根据全局聚类簇中心w(t)和云服务器中的测试数据得出全局模型的学习效用值,作为多臂老虎机中当前臂p(K)的收益值,资源消耗量作为当前臂p(K)的支付成本值;
步骤7:云服务器根据在线算法选择新的臂,作为边缘服务器下一次迭代的迭代次数p(K);
步骤8:云服务器将更新后的全局聚类簇中心w(t)和迭代次数p(K)广播给所有边缘服务器,作为边缘服务器K-means算法的初始值;
步骤9:重复步骤3~8,直到云服务器检测到总资源用尽,此时的全局聚类簇中心w(t)为最终K-means模型训练的结果,云服务器将该训练结果广播给各边缘服务器,完成k均值聚类的模型优化。


2.如权利要求1所述的基于在线学习的边云协同k均值聚类的模型优化方法,其特征在于,步骤5中,全局聚类簇中心w(t)的更新采用同步聚合方式。


3.如权利要求2所述的基于在线学习的边云协同k均值聚类的模型优化方法,其特征在于,步骤5的具体操作为:云服务器请求所有边缘服务器上传其局部聚类簇中心wi(t),然后利用下式计算所有局部聚类簇中心的加权平均值:



将得到的局部聚类簇中心的加权平均值作为更新后的全局聚类簇中心w(t)。


4.如权利要求1所述的基于在线学习的边云协同k均值...

【专利技术属性】
技术研发人员:杨树森张靖琪韩青赵鹏赵聪任雪斌王路辉王艺蒙王涛罗坚
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1