一种动态环境下移动机器人控制方法及系统技术方案

技术编号:39594370 阅读:9 留言:0更新日期:2023-12-03 19:49
本发明专利技术公开了一种动态环境下移动机器人控制方法及系统,包括:基于

【技术实现步骤摘要】
一种动态环境下移动机器人控制方法及系统


[0001]本专利技术涉及物流机器人作业,尤其涉及一种动态环境下移动机器人控制方法及系统


技术介绍

[0002]随着人工智能技术的进步,机器人执行多任务的需求也日益增加,然而,机器人在执行多任务时的控制技术,尚有待提高,尤其是不确定风险情况下,多任务的控制以及安全路径规划

其中一个典型的应用场景,就是高校各校区间的材料物品配送

当前,当前诸多高校普遍拥有多个校区,分布在城市各角落,高校校区之间的距离会造成校区之间材料传递不便,尤其是疫情防控期间等特殊情况,多个校区间的文件

材料

物品运输极度依靠人工传递,费时费力,影响教职工的办公效率以及学生的日常生活

开发一个适用于执行多任务的机器人控制系统,实现跨校区机器人自动配送,可以给高校师生提供极大的便利

[0003]机器人在执行多任务时,面临的主要难点主要是多任务控制

安全路径规划

现有研究表明,单纯的强化学习算法,可以有效处理单任务情况下机器人的路径规划问题

但无法处理多任务控制问题,对于多任务控制,需要将作业任务分为多个阶段,定义多个奖惩函数,较为复杂
。Linear temporal logic
逻辑规范可以有效的进行多任务控制,并与强化学习进行融合,可以有效解决任务控制与路径规划

但现有的
Linear temporal logic
与强化学习的融合方式主要是乘积型,计算成本较大,并且未考虑环境中不确定因素所带来的风险问题


技术实现思路

[0004]本专利技术的目的在于提供一种动态环境下移动机器人控制方法及系统,提前规避环境中的潜在风险,实现复杂问题简单化,并压缩探索空间,降低计算成本,提高了求解速度

[0005]实现本专利技术目的的技术方案为:
[0006]一种动态环境下移动机器人控制方法,包括步骤:
[0007]基于
scLTL
逻辑规范构建编码器,将移动机器人的多维任务状态编码成一维状态;
[0008]基于历史数据和风险模拟对移动机器人作业环境中不确定因素的风险进行预测和评估;
[0009]融合编码器编码和强化学习,并考虑环境中的预测风险构建融合模型,通过融合模型得到移动机器人的多任务作业进行决策和路径规划

[0010]进一步地,基于
scLTL
逻辑规范构建编码器具体包括:
[0011]多任务原子命题化:根据每个单任务状态
τ
i
,将
I
项任务进行原子命题化,并写入构建的
scLTL
逻辑规范任务模型
φ

[0012]将任务模型
φ
转化为有限状态自动机
A
φ

[0013]基于有限状态自动机
A
φ
与机器人多任务状态,构建编码器

[0014]进一步地,所述
scLTL
逻辑规范任务模型
φ
为:
[0015][0016]其中,
T
表示布尔运算符真,
prp
是原子命题集,
φ

φ1、
φ2代表原子命题,
X
表示下一步,
X
φ
表示
φ
下一个状态为真,
F
表示未来,
F
φ
表示
φ
未来是真,
φ1U
φ2表示
φ1为真直到
φ2满足

[0017]进一步地,所述有限状态自动机
A
φ
为:
[0018]A
φ

<Q,2
PrP
,
δ
,q0,q
F
>
[0019]其中,
Q
表示有限状态集,2PrP
表示原子命题的有限集合,
δ
表示
Q
×2PrP

Q
的状态转移函数,
q0表示初始状态,
q
F
表示接受状态的有限集合

[0020]进一步地,所述编码器为:
[0021]m

Encoder(s
T
)

Encoder(
τ1,
τ2,

,
τ
i
,

,
τ
I
)
[0022]其中,
m∈M
,为编码后的机器人多任务状态,其维度为一维,多任务状态
S
T

(
τ1,
τ2,

,
τ
i
,

,
τ
I
)。
[0023]进一步地,所述基于历史数据和风险模拟对移动机器人作业环境中不确定因素的风险进行预测和评估具体包括:
[0024]基于历史风险数据构建历史风险模型,对历史风险模型迭代学习直至满足要求,通过历史风险模型对对未来一段时间
T0内的风险进行预测;
[0025]针对现实环境中可能发生的突发事件进行模拟,构建随机模拟模型,基于统计方法,计算每一条道路在未来时间段
T0的风险

[0026]进一步地,所述历史风险模型为:
[0027][0028][0029][0030][0031]其中,为时间段
T
的历史风险数据集,
c
由核方程计算得到;为模型输出值,
α

β

ε
为模型学习参数,
α

β

ε
通过多次迭代学习确定,
k
为路径编号;
[0032]该模型的迭代学习过程通过以下最小化公式进行:
[0033][0034]其中
C1、C2为核函数计算所得矩阵,
γ
为常数,
K
为训练数据的维数,
tr()
为计算矩阵的迹,
J
为数据长度,
d
为通过学习构建模型的维数,为训练数据集;
[0035]未来一段时间
T0内的风险为:
[0036][0037]其中
Y
t
为时刻
t
的风险模型值,为所构建的风险模型数据集合的转置<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种动态环境下移动机器人控制方法,其特征在于,包括如下步骤:步骤1:基于
scLTL
逻辑规范构建编码器,将移动机器人的多维任务状态编码成一维状态;步骤2:基于历史数据和风险模拟对移动机器人作业环境中不确定因素的风险进行预测和评估;步骤3:融合编码器编码和强化学习,并考虑环境中的预测风险构建融合模型,通过融合模型得到移动机器人的多任务作业进行决策和路径规划
。2.
根据权利要求1所述的动态环境下移动机器人控制方法,其特征在于,所述基于
scLTL
逻辑规范构建编码器具体包括:多任务原子命题化,根据每个单任务状态
τ
i
,将
I
项任务进行原子命题化,并写入构建的
scLTL
逻辑规范任务模型
φ
;将任务模型
φ
转化为有限状态自动机
A
φ
;基于有限状态自动机
A
φ
与机器人多任务状态,构建编码器
。3.
根据根据权利要求2所述的动态环境下移动机器人控制方法,其特征在于,所述
scLTL
逻辑规范任务模型
φ
为:其中,
T
表示布尔运算符真,
prp
是原子命题集,
φ

φ1、
φ2代表原子命题,
X
表示下一步,
X
φ
表示
φ
下一个状态为真,
F
表示未来,
F
φ
表示
φ
未来是真,
φ1U
φ2表示
φ1为真直到
φ2满足
。4.
根据根据权利要求2所述的动态环境下移动机器人控制方法,其特征在于,所述有限状态自动机
A
φ
为:其中,
Q
表示有限状态集,表示原子命题的有限集合,
δ
表示的状态转移函数,
q0表示初始状态,
q
F
表示接受状态的有限集合
。5.
根据根据权利要求1所述的动态环境下移动机器人控制方法,其特征在于,所述编码器为:
m

Encoder(s
T
)

Encoder(
τ1,
τ2,
...

τ
i

...

τ
I
)
其中,
m∈M
,为编码后的机器人多任务状态,其维度为一维,多任务状态
S
T

(
τ1,
τ2,
...

τ
i

...

τ
I
)。6.
根据根据权利要求1所述的动态环境下移动机器人控制方法,其特征在于,所述基于历史数据和风险模拟对移动机器人作业环境中不确定因素的风险进行预测和评估具体包括:基于历史风险数据构建历史风险模型,对历史风险模型迭代学习直至满足要求,通过历史风险模...

【专利技术属性】
技术研发人员:宓建邓社军徐伟廖华军白乐濛张俊秦婧逸于世军嵇涛徐悦马瑞阳沈梓怡朱云翔蔡爱鹏崔嘉贺张昱韬闫奇志张洋铭张炳坤艾尔帕尼
申请(专利权)人:慧知科技扬州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1