当前位置: 首页 > 专利查询>江南大学专利>正文

一种磁性微纳机器人的自主导航与控制方法技术

技术编号:30903358 阅读:19 留言:0更新日期:2021-11-22 23:48
本发明专利技术公开了一种磁性微纳机器人的自主导航与控制方法,涉及微纳机器人技术领域,该方法通过交流电流源来驱动三轴亥姆霍兹线圈产生空间旋转磁场以驱动磁性微纳机器人运动,采用显微镜对磁性微纳机器人的工作环境及其位置进行反馈,建立磁性微纳机器人的车辆等效模型,降低了控制的复杂度,然后基于边界扩充和路径平滑改进了RRT

【技术实现步骤摘要】
一种磁性微纳机器人的自主导航与控制方法


[0001]本专利技术涉及微纳机器人
,尤其是一种磁性微纳机器人的自主导航与控制方法。

技术介绍

[0002]近年来,磁场驱动式的微纳机器人由于远程化、入侵性小等优势,正受到广泛的关注,许多团体开始研究其在生物医疗中的应用,但是微纳机器人自主导航与控制系统在实际的应用中还是存在着不少的挑战。
[0003]以往的研究中,在对微纳机器人进行路径规划时,并未考虑运动对象的运动约束。如果规划的路径过于曲折,将会给机器人的运动控制带来很大的麻烦。另一方面,当前人们普遍采用PID或者滑膜控制器对微纳机器人进行控制,然而在一些复杂的高阶非线性系统中,传统的PID控制方法鲁棒性较差。基于滑膜控制器的方法在一定程度上具有优势,但其控制方法的主要缺点是“抖动”现象,在实际系统中可能会损坏执行器。

技术实现思路

[0004]本专利技术人针对上述问题及技术需求,提出了一种磁性微纳机器人的自主导航与控制方法,通过改进的RRT

CONNET算法,为磁性微纳机器人规划出平滑易控的最优避障路径,利用神经网络来构建从系统观测和控制输入到控制输出的磁性微纳机器人的轨迹跟踪控制器,弥补传统控制算法鲁棒性差,易产生抖动的缺点。
[0005]本专利技术的技术方案如下:
[0006]一种磁性微纳机器人的自主导航与控制方法,磁性微纳机器人的自主导航与控制系统包括形成闭环控制的交流电流源、三轴亥姆霍兹线圈、磁性微纳机器人、显微镜和上位机;
[0007]方法包括如下步骤:
[0008]建立磁性微纳机器人的车辆等效模型,将对磁性微纳机器人的控制等效为对微车的转向角和油门的控制;
[0009]对显微镜采集的图像进行图像特征的提取、匹配和融合,从局部地图扩充到全局地图,并利用语义分割和目标检测方法获取磁性微纳机器人的状态信息和所处环境信息;
[0010]利用改进的RRT

CONNET算法,引入边界扩充和曲线平滑算法对原始轨迹进行处理,得到磁性微纳机器人在全局地图的最优避障路径;
[0011]基于等效模型和状态信息,对磁性微纳机器人进行运动学建模得到状态空间方程;
[0012]利用状态空间方程设计基于强化学习的轨迹跟踪控制器,轨迹跟踪控制器依据状态信息输出控制信号至交流电流源,从而改变空间旋转磁场以跟踪最优避障路径,实现对磁性微纳机器人的闭环控制。
[0013]其进一步的技术方案为,利用改进的RRT

CONNET算法,引入边界扩充和曲线平滑
算法对原始轨迹进行处理,得到磁性微纳机器人在全局地图的最优避障路径,包括:
[0014]通过像素语义图计算磁性微纳机器人的设定工作环境的可驱动区域的边界,然后根据磁性微纳机器人在像素上的大小扩展可驱动区域的边界,将扩展结果以外的区域作为非驾驶区,可驱动区域边界内部为驾驶区;
[0015]通过RRT

CONNET算法对规划路径进行节点细化,以提取关键地标,然后使用B样条函数优化由关键地标形成的局部路径以产生具有连续曲率的平滑路径作为最优避障路径。
[0016]其进一步的技术方案为,基于磁性微纳机器人的运动状态,定义状态空间方程为:
[0017][0018]其中,δ表示微车的转向角,τ表示微车的油门;e
θ
表示微车与最优避障路径之间的角度差,是一阶导数;e
x
、e
y
分别是x和y轴方向的位置误差,和是相应的一阶导数,和是相应的二阶导数,导数用于向轨迹跟踪控制器提供时间信息;χ中包含在最优避障路径中当前位置的后两个路径点的二维坐标,S表示维度为14的状态空间方程。
[0019]其进一步的技术方案为,利用状态空间方程设计基于强化学习的轨迹跟踪控制器,包括:
[0020]基于强化学习的轨迹跟踪控制器由三种神经网络组成,包括两个软Q函数Q
θ1
(s
t
,a
t
)、Q
θ2
(s
t
,a
t
)和可处理策略其中,s
t
表示t时刻状态空间方程的状态信息,a
t
表示t时刻的动作空间,三种神经网络的参数是θ
1、2
和φ0;
[0021]算法流程如下:首先,观察当前时刻状态空间方程的14维状态,然后通过策略网络将状态信息转移到具有完全连接层的2维动作;从输出分布中采样动作,并使用tanh激活函数将其归一化为[

1,1],采样动作将被进一步映射和平滑以与环境交互;当获得下一个状态信息s
t+1
和r(s
t
,a
t
)时,参数(s
t
,a
t
,r(s
t
,a
t
),s
t+1
)被存储到缓冲区中,在训练过程中会重复进行上述交互和存储的过程;在训练结束时,当过渡次数大于设置阈值时,分别使用函数J
Q

i
)和J
π
(φ0)更新网络,重复整个算法流程,直到得到最佳策略为止。
[0022]其进一步的技术方案为,轨迹跟踪控制器依据状态信息输出控制信号至交流电流源,从而改变空间旋转磁场以跟踪最优避障路径,包括:
[0023]向轨迹跟踪控制器输入当前时刻的状态空间方程,输出包括转向角和油门控制量的动作空间;
[0024]将动作空间等效为空间旋转磁场的旋转角度,对当前时刻的空间旋转磁场值进行磁场转换,得到下一时刻旋转后的空间旋转磁场值;
[0025]根据下一时刻旋转后的空间旋转磁场值计算得到线圈的三轴电流,进而转换为交流电对应的频率和幅值作为控制信号输入至交流电流源。
[0026]其进一步的技术方案为,将动作空间等效为空间旋转磁场的旋转角度,对当前时刻的空间旋转磁场值进行磁场转换,得到下一时刻旋转后的空间旋转磁场值,包括:
[0027]采用四元数方法推导空间旋转磁场的产生,对于空间磁场矢量OM,O:(0,0,0)表示在空间的原点,设当前时刻的空间旋转磁场值M为(x,y,z),下一时刻旋转后的空间旋转磁场值M

为(x

,y

,z

);空间三维旋转视为绕三个基本轴的旋转组合,绕三个基本轴的旋转角度是其中,将旋转矢量的旋转角度等效为微车的转向角控制量,将旋转矢量的
旋转角度φ等效为微车的油门控制量,且φ=∫ωtdt,ω表示旋转角速度;
[0028]旋转前四元数坐标M[0(x,y,z)]是通过四元数方法展开磁场值(x,y,z)后得到的,求解旋转后四元数坐标M

[0(x

,y

,z

)]的过程如下:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种磁性微纳机器人的自主导航与控制方法,其特征在于,所述磁性微纳机器人的自主导航与控制系统包括形成闭环控制的交流电流源、三轴亥姆霍兹线圈、磁性微纳机器人、显微镜和上位机;所述方法包括:建立所述磁性微纳机器人的车辆等效模型,将对所述磁性微纳机器人的控制等效为对微车的转向角和油门的控制;对所述显微镜采集的图像进行图像特征的提取、匹配和融合,从局部地图扩充到全局地图,并利用语义分割和目标检测方法获取所述磁性微纳机器人的状态信息和所处环境信息;利用改进的RRT

CONNET算法,引入边界扩充和曲线平滑算法对原始轨迹进行处理,得到所述磁性微纳机器人在全局地图的最优避障路径;基于所述等效模型和状态信息,对所述磁性微纳机器人进行运动学建模得到状态空间方程;利用所述状态空间方程设计基于强化学习的轨迹跟踪控制器,所述轨迹跟踪控制器依据状态信息输出控制信号至所述交流电流源,从而改变空间旋转磁场以跟踪所述最优避障路径,实现对所述磁性微纳机器人的闭环控制。2.根据权利要求1所述的磁性微纳机器人的自主导航与控制方法,其特征在于,所述利用改进的RRT

CONNET算法,引入边界扩充和曲线平滑算法对原始轨迹进行处理,得到所述磁性微纳机器人在全局地图的最优避障路径,包括:通过像素语义图计算所述磁性微纳机器人的设定工作环境的可驱动区域的边界,然后根据所述磁性微纳机器人在像素上的大小扩展所述可驱动区域的边界,将扩展结果以外的区域作为非驾驶区,可驱动区域边界内部为驾驶区;通过RRT

CONNET算法对规划路径进行节点细化,以提取关键地标,然后使用B样条函数优化由所述关键地标形成的局部路径以产生具有连续曲率的平滑路径作为所述最优避障路径。3.根据权利要求1所述的磁性微纳机器人的自主导航与控制方法,其特征在于,基于所述磁性微纳机器人的运动状态,定义所述状态空间方程为:其中,δ表示微车的转向角,τ表示微车的油门;e
θ
表示微车与最优避障路径之间的角度差,是一阶导数;e
x
、e
y
分别是x和y轴方向的位置误差,和是相应的一阶导数,和是相应的二阶导数,导数用于向轨迹跟踪控制器提供时间信息;χ中包含在最优避障路径中当前位置的后两个路径点的二维坐标,S表示维度为14的状态空间方程。4.根据权利要求1所述的磁性微纳机器人的自主导航与控制方法,其特征在于,所述利用所述状态空间方程设计基于强化学习的轨迹跟踪控制器,包括:所述基于强化学习的轨迹跟踪控制器由三种神经网络组成,包括两个软Q函数Q
θ1
(s
t
,a
t
)、Q
θ2
(s
t
,a
t
)和可处理策略其中,s
t
表示t时刻状态空间方程的状态信息,a
t
表示t时刻的动作空间,三种神经网络的参数是θ
1、2
和φ0;
算法流程如下:首先,观察当前时刻状态空间方程的14维状态,然后通过策略网络将状态信息转移到具有完全连接层的2维动作;从输出分布中采样动作,并使用tanh激活函数将其归一化为[

1,1],所述采样动作将被进一步映射和平滑以与环境交互;当获得下一个状态信息s
t+1
和r(s
t
,a
t
)时,参数(s
t
,a
t
,r(s
t
,a
t
),s
t+1
)被存储到缓冲区中,在训练过程中会重复进行上述交互和存储的过程;在训练结束时,当过渡次数大于设置阈值时,分别使用函数J
Q

i
)和J
π
(φ0)更新网络,重复整个算法流程,直到得到最佳策略为止。5.根据权利要求1所述的磁性微纳机器人的自主导航与控制方法,其特征在于,所述轨迹跟踪控制器依据状态信息输出控制信号至所述交流电流源,从而改变空间旋转磁场以跟踪所述最优避障路径,包括:向所述轨迹跟踪控制器输入当前时刻的状态空间方程,输出包括转向角和油门控制量的动作空间;将所述动作空间等效为所述空间旋转磁场的旋转角度,对当前时刻的空间旋转磁场值进行磁场转换,得到下一时刻旋转后的空间旋转磁场值;根据所述下一时刻旋转后的空间旋转磁场值计算得到线圈的三轴电流,进而转换为交流电对应的频率和幅值作为控制信号输入至所述交流电流源。6.根据权利要求5所述的磁性微纳机器人的自主导航与控制方法,其特征在于,所述将所述动作空间等效为所述空间旋转磁场的旋转角度,对当前时刻的空间旋转磁场值进行磁场转换,得到下一时刻旋转后的空间旋转磁场值,包括:采用四元数方法推导所述空间旋转磁场的产生,对于空间磁场矢量OM,O:(0,0,0)表示在空间的原点,设所述当前时刻的空间旋转磁场值...

【专利技术属性】
技术研发人员:樊启高张鹏松谢林柏黄文涛朱一昕毕恺韬贾捷
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1