一种基于云边机协同计算的机器人自主轨迹跟踪系统技术方案

技术编号:37665109 阅读:10 留言:0更新日期:2023-05-26 04:22
本发明专利技术公开了一种基于云边机协同计算的机器人自主轨迹跟踪系统,本发明专利技术属于机器人自主轨迹跟踪领域,包括:机器人编队层、边缘计算层和云计算中心,其中所述机器人编队层、所述边缘计算层和所述云计算中心层依次连接;所述机器人编队层,用于采集机器人编队的动作状态;所述边缘计算层,采用单任务网络,用于对所述动作状态进行边缘计算,并对机器人编队中同一任务进行精确控制;所述云计算中心,采用多任务专家网络,用于输出与所述单任务网络的相似性,以实现机器人自主轨迹跟踪。本发明专利技术解决了现有技术中模型泛化困难、控制模型执行效果差等问题,同时能够利用大量的机器人实时运行数据对网络进行训练,降低了模型训练的时间成本和经济成本。本和经济成本。本和经济成本。

【技术实现步骤摘要】
一种基于云边机协同计算的机器人自主轨迹跟踪系统


[0001]本专利技术属于机器人自主轨迹跟踪
,尤其涉及一种基于云边机协同计算的机器人自主轨迹跟踪系统。

技术介绍

[0002]近些年来,机器人学技术不断发展,国内外对机器人自主控制问题进行了多方面研究,深度强化学习则是诸多方法中的研究热点。深度强化学习是强化学习方法与深度神经网络的结合,它能通过深层网络感知环境状态,并输出最优控制结果。由于深度网络强大的感知和描述能力,它在许多复杂控制问题上表现得十分出色,例如四足机器人和轮式机器人控制等。
[0003]随着机器人编队自主循迹任务的难度增加,训练一个能够熟练完成所要求任务的深度强化学习网络所需时间和物理成本呈指数形式增加。传统的解决方案局限于每个网络一次智能学习如何执行一种任务,尽管这些控制任务之间存在相似性。例如控制四足机器人前进、后退和转向、控制轮式机器人到达指定地点等。有对算法做轻量化处理、裁剪系统功能和精度等。这些方案在一定程度上限制了机器人编队智能化发展,并且面对大量不确定性和随机动态开放环境中,存在泛化困难、控制模型执行效果差等缺点。

技术实现思路

[0004]本专利技术提出了一种基于云边机协同计算的机器人自主轨迹跟踪系统,以解决上述现有技术中存在的机器人自主规划技术在多任务动态开放环境下泛化困难、模型执行精度差等技术问题。
[0005]为实现上述目的,本专利技术提供了一种基于云边机协同计算的机器人自主轨迹跟踪系统,包括:机器人编队层、边缘计算层和云计算中心,其中所述机器人编队层、所述边缘计算层和所述云计算中心层依次连接;
[0006]所述机器人编队层,用于采集机器人编队的动作状态;
[0007]所述边缘计算层,采用单任务网络,用于对所述动作状态进行边缘计算,并对机器人编队中同一任务进行精确控制;
[0008]所述云计算中心,采用多任务专家网络,用于输出与所述单任务网络的相似性,以实现机器人自主轨迹跟踪。
[0009]优选地,所述单任务网络,与所述机器人编队层连接,用于采集机器人编队的动作状态,基于所述动作状态的价值函数评估动作状态下执行动作的好坏。
[0010]优选地,所述边缘计算层中,机器人编队采集实时运行状态信息并上传至所述边缘计算层服务器,通过边缘计算层服务器中的单任务神经网络得到动作指令,机器人自主循迹完成所需目标。
[0011]优选地,机器人自主循迹的损失函数:
[0012][0013]其中,s
t
,a
t
代表当前机器人编队中某个机器人的实际状态和加速度;s
*t
,a
*t
则代表在t时刻,机器人编队被期望达到的状态和动作。
[0014]优选地,若边缘计算服务器接入i个机器人时,则单任务神经网络中损失函数的奖励r表示为:
[0015][0016]其中,L(s
t
,a
t
)为机器人自主循迹的损失函数。
[0017]优选地,所述单任务神经网络,通过一次输入i个机器人的状态,输出对i个机器人编队的指令。
[0018]优选地,所述多任务专家网络包括隐藏层,通过损失函数进行迭代收敛训练,所述损失函数为:
[0019][0020]其中,表示单任务专家网络和多任务网络输出结果的相似程度,表示单任务网络与多任务网络隐藏层对输入特征表达的相似程度,系数β则表示两者的权重,θ,分别为单任务网络参数和多任务网络第i层的参数。
[0021]优选地,通过定义单任务神经网络与多任务神经网络的输出交叉熵得到,用于表征两者的输出相似性,表示为:
[0022][0023]其中,π
AMN
(a|s;θ)为所述多任务神经网络,为单任务专家神经网络;
[0024]表达为:
[0025][0026]其中,是代表状态动作价值函数,τ为温度系数,代表了与各个状态动作价值函数的相似程度。
[0027]优选地,表示为:
[0028][0029]其中,为单任务神经网络的隐藏层特征向量,h
AMN
(s;θ)为多任务神经网络的隐藏层特征向量。
[0030]与现有技术相比,本专利技术具有如下优点和技术效果:
[0031]本专利技术提供了一种基于云边机协同计算的机器人自主轨迹跟踪系统,包括:机器人编队层、边缘计算层和云计算中心,其中所述机器人编队层、所述边缘计算层和所述云计
算中心层依次连接;通过机器人编队层,采集机器人编队的动作状态;通过边缘计算层,采用单任务网络,用于对所述动作状态进行边缘计算,并对机器人编队中同一任务进行精确控制;通过云计算中心,采用多任务专家网络,用于输出与所述单任务网络的相似性,以实现机器人自主轨迹跟踪。
[0032]本专利技术利用云边机协同计算、5G通信技术和深度强化学习等技术,使得云计算平台能够利用大量的机器人实时运行数据对网络进行训练,降低了模型训练的时间成本。其中,训练的多任务专家网络能够对未训练过的任务表现出较强的迁移特性,即面对训练集以外的任务时,多任务网络能够迅速收敛到该任务所需要的单一专家模型上,大幅缩短训练时间和经济成本。
附图说明
[0033]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0034]图1为本专利技术实施例的机器人编队网络架构示意图;
[0035]图2为本专利技术实施例的机器人自主轨迹跟踪的轨迹跟踪效果图;
[0036]图3为本专利技术实施例的机器人自主轨迹跟踪的编队协同跟踪结果示意图。
具体实施方式
[0037]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0038]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0039]实施例一
[0040]本实施例中提供一种基于云边机协同计算的机器人自主轨迹跟踪系统,包括:
[0041]云边机协同计算集群:用于提供所述方法需要的算力平台,其中包括云计算多任务蒸馏层、边缘单任务训练层和机器人编队实时运行层;
[0042]云计算中心多任务蒸馏层:用于接收边缘层训练好的单任务执行神经网络。云计算中心提供大量的算力资源并进行蒸馏训练得到能够完成多任务的专家网络;
[0043]边缘单任务训练层:用于为所述云边机协同计算机器人神经网络训练提供算力支持,边缘层与机器人编队保证实时通信连接,采集机器人编队运行数据并训练生成单任务专家网络用于机器人编队自主轨迹跟踪;
[0044]机器人编队实时运行层:用于执行机器人自主轨迹跟踪并向边缘层提供运行数据以供神经网络训练;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于云边机协同计算的机器人自主轨迹跟踪系统,其特征在于,包括:机器人编队层、边缘计算层和云计算中心,其中所述机器人编队层、所述边缘计算层和所述云计算中心层依次连接;所述机器人编队层,用于采集机器人编队的动作状态;所述边缘计算层,采用单任务网络,用于对所述动作状态进行边缘计算,并对机器人编队中同一任务进行精确控制;所述云计算中心,采用多任务专家网络,用于输出与所述单任务网络的相似性,以实现机器人自主轨迹跟踪。2.根据权利要求1所述的基于云边机协同计算的机器人自主轨迹跟踪系统,其特征在于,所述单任务网络,与所述机器人编队层连接,用于采集机器人编队的动作状态,基于所述动作状态的价值函数评估动作状态下执行动作的好坏。3.根据权利要求1所述的基于云边机协同计算的机器人自主轨迹跟踪系统,其特征在于,所述边缘计算层中,机器人编队采集实时运行状态信息并上传至所述边缘计算层服务器,通过边缘计算层服务器中的单任务神经网络得到动作指令,机器人自主循迹完成所需目标。4.根据权利要求3所述的基于云边机协同计算的机器人自主轨迹跟踪系统,其特征在于,机器人自主循迹的损失函数:其中,s
t
,a
t
代表当前机器人编队中某个机器人的实际状态和加速度;s
*t
,a
*t
则代表在t时刻,机器人编队被期望达到的状态和动作。5.根据权利要求4所述的基于云边机协同计算的机器人自主轨迹跟踪系统,其特征...

【专利技术属性】
技术研发人员:朱力陈骋郜新军王洪伟文韬
申请(专利权)人:中国铁道科学研究院集团有限公司中国铁道科学研究院集团有限公司通信信号研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1