一种基于单应性和Q学习的无标定视觉伺服控制方法技术

技术编号:33793861 阅读:90 留言:0更新日期:2022-06-12 14:53
本发明专利技术提供了一种基于单应性和Q学习的无标定视觉伺服控制方法,包括如下步骤:S1、建立单目视觉伺服系统的运动学模型,用以得到当特征点投影到当前图像平面和期望图像平面时的像素坐标;S2、基于中央透视原理,建立单应性任务模型,设计相应的单应性任务函数;S3、利用Q学习算法选择最优的单应性任务模型的增益系数。本发明专利技术所述的基于单应性和Q学习的无标定视觉伺服控制方法与传统方法相比,在特征点较多的情况下,利用单应性任务函数设计,使雅可比矩阵的计算复杂度降低,收敛速度变快。利用Q学习方法进行增益的参数自适应调优,增快了视觉伺服任务的收敛速度。觉伺服任务的收敛速度。觉伺服任务的收敛速度。

【技术实现步骤摘要】
一种基于单应性和Q学习的无标定视觉伺服控制方法


[0001]本专利技术涉及机器人视觉伺服领域,尤其是涉及一种基于单应性和Q学习的无标定视觉伺服控制方法。

技术介绍

[0002]1.相机标定的过程不仅繁琐,而且相机标定误差会导致视觉伺服控制的精度下降。在很多情况,相机标定存在很多限制。
[0003]2.在实际工程中,图像特征的数量越多,则系统的鲁棒性越强,控制效果越准确。然而,增大图像特征点的个数会引起雅克比矩阵维数的增加,从而使计算量大大增大,增大系统的计算时间。
[0004]3.对于传统的IBVS来说,其伺服增益通常为一个固定值。然而,固定增益可能会导致系统的不稳定和收敛缓慢。与传统的固定增益相比,自适应增益可以提高系统的收敛速度。
[0005]专利CN202010151757.6提出了一种视觉伺服切换控制方法及系统。此专利技术公开了一种视觉伺服切换控制方法及系统。但是这种方法在特征点较多的情况下,会增大雅克比矩阵的计算负担,降低视觉伺服的速度。

技术实现思路

[0006]有鉴于此,本专利技术旨在提出一种基于单应性和Q学习的无标定视觉伺服控制方法,以解决上述至少部分技术问题中的至少之一。
[0007]为达到上述目的,本专利技术的技术方案是这样实现的:
[0008]一方面,本专利技术提供了一种基于单应性和Q学习的无标定视觉伺服控制方法,包括如下步骤:
[0009]S1、建立单目视觉伺服系统的运动学模型,用以得到当特征点投影到当前图像平面和期望图像平面时的像素坐标;
[0010]S2、基于中央透视原理,建立单应性任务模型,设计相应的单应性任务函数;
[0011]S3、利用Q学习算法选择最优的单应性任务模型的增益系数。
[0012]进一步的,步骤S1的具体方法如下:
[0013]设当前相机平面坐标系为{F}、期望相机平面坐标系为{F
*
}、特征点为P
i
,特征点P
i
在{F}和{F
*
}下的欧几里得坐标分别为X
i
=[X
i
,Y
i
,Z
i
]T
和X
i
和的关系为:
[0014][0015]其中,R表示{F
*
}相对于{F}的旋转,t表示{F
*
}相对于{F}的平移;
[0016]将P
i
的坐标在{F}和{F
*
}坐标系下进行归一化处理,定义
[0017][0018][0019]其中,m
i
为{F
i*
}坐标系下的归一化坐标,为{F
*
}坐标系下的归一化坐标;
[0020]当特征点P
i
投影到当前图像平面和期望图像平面时,其像素坐标pi,分别为:
[0021][0022]其中,K为增益矩阵。
[0023]进一步的,步骤S2的具体方法为:
[0024]设n
*
为平面π的法向量,且满足结合中央透射投影原理,得到
[0025][0026]归一化坐标的欧几里得单应性矩阵为:
[0027][0028]其中,H为归一化坐标的欧几里得单应性矩阵,
c
R
*
表示{F
*
}相对于{F}的旋转,t表示{F
*
}相对于{F}的平移,n
*
表示在{F
*
}坐标系下的平面π的法向量;
[0029]定义深度比为:
[0030][0031]得到,
[0032][0033]定义投影单应性矩阵为:
[0034]G=KHK
‑1[0035]由于单目视觉伺服系统的任务目标是使两个坐标系{F}和{F
*
}重合,即R=I且t=0,其中,I表示单位矩阵,可得:
[0036]H=I;
[0037]即
[0038]G=I
[0039]因此,等价于R=I和t=0,令
[0040][0041]其中,β是任意的比例系数,表示两组图像之间的映射比例关系,选择使
[0042]定义矩阵函数:
[0043][0044]则误差任务函数为:
[0045]E=[E
1 E
2 E3]T
[0046]对式E进行求导,得如下关系:
[0047][0048]其中,代表旋转矩阵和角速度之间的关系,即
[0049][0050]的计算公式为:
[0051][0052]其中,v表示相机的平移速度,w表示相机的角速度;
[0053]推导可得
[0054][0055]对上述公式进行变换:
[0056][0057]得到将e的导数与相机速度相关联的表达式为:
[0058][0059]其中,L
ec
是雅克比矩阵,V
c
是相机的空间速度;
[0060]计算得到针对静止目标的视觉伺服控制器的控制算法为:
[0061][0062]其中,λ为增益系数。
[0063]进一步的,步骤S3的具体方法如下:
[0064]单应性任务模型的增益系数λ=diag{λ
vx

vy

vz

ωx

ωy

ωz
}∈R6×6,包括六个维度的伺服增益的智能体A
vx
,A
vy
,A
vz
,A
ωx
,A
ωy
,A
ωz

[0065]由视觉伺服控制器的控制算法可知,伺服增益λ与图像雅可比矩阵和特征误差有关;此外,即使存在许多特征点时,的维数是固定不变的,因此选择作为状态空间;
[0066]六个智能体的状态空间为:
[0067][0068]其中,S
vx S
vy S
vz S
wx S
wy S
wz
为六个自由度下的状态空间集;每个维度的智能体的状态空间均采用对数划分的方法,但是上下限是不同的,上下限根据具体情况决定;
[0069]六个状态空间S
j
(j=1,

,6)的上限和下限通过环境获得;正区间分为n个区间段,则每个区间段为负区间分为n个区间段,则每个区间段为
[0070]对数分区方法如下:
[0071][0072]进一步的,还包括建立增益动作集,方法如下:
[0073]选取m个增益作为动作集a={a
i
|i=1,

,m},利用ε

贪心算法从动作集中选择一个动作a
i
,当随机概率小本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于单应性和Q学习的无标定视觉伺服控制方法,其特征在于,包括如下步骤:S1、建立单目视觉伺服系统的运动学模型,用以得到当特征点投影到当前图像平面和期望图像平面时的像素坐标;S2、基于中央透视原理,建立单应性任务模型,设计相应的单应性任务函数;S3、利用Q学习算法选择最优的单应性任务模型的增益系数。2.根据权利要求1所述的基于单应性和Q学习的无标定视觉伺服控制方法,其特征在于,步骤S1的具体方法如下:设当前相机平面坐标系为{F}、期望相机平面坐标系为{F
*
}、特征点为P
i
,特征点P
i
在{F}和{F
*
}下的欧几里得坐标分别为X
i
=[X
i
,Y
i
,Z
i
]
T
和X
i
和的关系为:其中,R表示{F
*
}相对于{F}的旋转,t表示{F
*
}相对于{F}的平移;将P
i
的坐标在{F}和{F
*
}坐标系下进行归一化处理,定义}坐标系下进行归一化处理,定义其中,m
i
为{F
i*
}坐标系下的归一化坐标,为{F
*
}坐标系下的归一化坐标;当特征点P
i
投影到当前图像平面和期望图像平面时,其像素坐标p
i
,分别为:其中,K为增益矩阵。3.根据权利要求2所述的基于单应性和Q学习的无标定视觉伺服控制方法,其特征在于,步骤S2的具体方法为:设n
*
为平面π的法向量,且满足结合中央透射投影原理,得到归一化坐标的欧几里得单应性矩阵为:其中,H为归一化坐标的欧几里得单应性矩阵,
c
R
*
表示{F
*
}相对于{F}的旋转,t表示{F
*
}相对于{F}的平移,n
*
表示在{F
*
}坐标系下的平面π的法向量;定义深度比为:得到,
定义投影单应性矩阵为:G=KHK
‑1由于单目视觉伺服系统的任务目标是使两个坐标系{F}和{F
*
}重合,即R=I且t=0,其中,I表示单位矩阵,可得:H=I;即G=I因此,等价于R=I和t=0,令其中,β是任意的比例系数,表示两组图像之间的映射比例关系,选择使定义矩阵函数:则误差任务函数为:E=[E
1 E
2 E3]
T
对式E进行求导,得如下关系:其中,代表旋转矩阵和角速度之间的关系,即代表旋转矩阵和角速度之间的关系,即的计算公式为:其中,v表示相机的平移速度,w表示相机的角速度;推导可得对上述公式进行变换:得到将e的导数与相机速度相关联的表达式为:其中,L
ec
是雅克比矩阵,V
c
是相机的空间速度;计算得到针对静止目标的视觉伺服控制器的控制算法为:其中,λ为增益系数。4.根据权利要求1所述的基于单应性和Q学习的无标定视觉伺服控制方法,其特征在
于,步骤S3的具体方法如下:单应性任务模型的增益系数λ=diag{λ
vx

vy

vz

ωx

ωy

ωz
}∈R6×6,包括六个维度的伺服增益的智...

【专利技术属性】
技术研发人员:康萌曹江威刘伟静魏鹏
申请(专利权)人:天津航天机电设备研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1