一种利用深度卷积神经网络实现视觉运动控制的方法技术

技术编号:21434730 阅读:26 留言:0更新日期:2019-06-22 12:42
本发明专利技术公开了一种利用深度卷积神经网络实现视觉运动控制的方法,只需要单目相机获取移动平台的当前图像,以及只需要对当前获取的单帧图像进行分析,便可得到当前视角下的合理运动控制规划。不需要通过多帧图像的多图像关联得到移动平台的定位信息,同时也不需要进行特征点数据匹配以及平面映射。另外,与已有的基于神经网络的视觉运控方案不同,本发明专利技术不需要进行路标识别以及特征点提取。再者,本发明专利技术利用深度神经网络具有语义分割的能力,对当前获取图像进行语义分割。并直接将该分割结果用以运动目标点规划,从单帧图像输入到运动控制目标点的规划,整个过程无需人为先验知识的输入。本发明专利技术具有成本低、运控简单快捷等优点。

【技术实现步骤摘要】
一种利用深度卷积神经网络实现视觉运动控制的方法
本专利技术涉及机器人视觉的
,尤其涉及到一种利用深度卷积神经网络实现视觉运动控制的方法。
技术介绍

技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种利用深度卷积神经网络实现视觉运动控制的方法。本方法使用深度卷积神经网络对单目视觉传感所采集的图像进行语义分割,以地板、土地等平面为分割目标,以得到当前获得图像视角下的可行驶区域。根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动目标。为实现上述目的,本专利技术所提供的技术方案为:一种利用深度卷积神经网络实现视觉运动控制的方法,包括以下步骤:S1:在移动平台上安装单目相机,采集移动平台前方的图像信息;S2:以单帧单目图像作为算法输入,利用深度卷积神经网络进行地面分割,以得到当前获得图像视角下的可行驶区域;S3:根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动控制目标点;S4:得到运动控制目标点后,将图像原点假设为当前移动平台所在位置,根据在图像空间得到的运动控制目标点与当前移动平台的相对位置,通过PID运动控制器实现移动平台控制。进一步地,所述步骤S3通过对可行驶区域分割结果的像素分布进行统计,得到其像素分布沿着图像空间XY方向的分布统计,进而根据该统计情况,在最大可能运动方向上进行目标点规划。进一步地,所述最大可能运动方向的求解过程为:像素坐标下不同方向的地面延伸程度分别用标准差vx和vy表示,也即是在该方向上移动平台可运动的幅度,利用像素的高斯分布统计,得到最大可能运动方向的解为:ηdirection=(vx,vy)。进一步地,所述步骤S3在图像空间根据离散的搜索线集合,进行运动控制目标点规划;具体步骤如下:在利用高斯分布统计以及图像不同方向的像素分布情况后,为了实现在该方向上的运动目标点的规划,设计一条从点oimage=(mx,my)出发,以ηdirection为方向的线作为中心搜索线lc;以lc为中心,以oimage为旋转基点,以给定值θ为旋转幅度,向左与向右各旋转i次,从而得到一系列离散的搜索线集合l,该搜索线集合l以lc为中心展开,离散并均匀地覆盖整个图像;沿着l的每个直线元素,分别从点(mx,my)开始,进行图像检索,一直找到最终一个地面分割有效点结束,进而得到由l的各个元素搜索得到的备选点集合pp;从pp中选择距离(mx,my)在图像空间上最远的点,作为最终运动规划目标点pg,也即是依据以下代价函数进行运动目标点求解:其中,函数d()为求解欧氏距离函数,mx,my分别为地面像素分布位置在XY方向的均值。与现有技术相比,本方案原理和优点如下:本方案只需要单目相机获取移动平台的当前图像,以及只需要对当前获取的单帧图像进行分析,便可得到当前视角下的合理运动控制规划。不需要通过多帧图像的多图像关联得到移动平台的定位信息,同时也不需要进行特征点数据匹配以及平面映射。另外,与已有的基于神经网络的视觉运控方案不同,本方案不需要进行路标识别以及特征点提取。再者,本方案利用深度神经网络具有语义分割的能力,对当前获取图像进行语义分割。并直接将该分割结果用以运动目标点规划,从单帧图像输入到运动控制目标点的规划,整个过程无需人为先验知识的输入。本方案具有成本低、运控简单快捷等优点。附图说明图1为本专利技术一种利用深度卷积神经网络实现视觉运动控制的方法的流程图;图2为本专利技术一种利用深度卷积神经网络实现视觉运动控制的方法中进行图像分割的示意图;图3为本专利技术一种利用深度卷积神经网络实现视觉运动控制的方法中运动控制目标点规划示意图。具体实施方式下面结合具体实施例对本专利技术作进一步说明:参见图1所示,本实施例所述的一种利用深度卷积神经网络实现视觉运动控制的方法,包括以下步骤:S1:在移动平台上安装单目相机,采集移动平台前方的图像信息;S2:以单帧单目图像作为算法输入,利用深度卷积神经网络进行地面分割,以得到当前获得图像视角下的可行驶区域;进行地面分割如图2所示,左图为实时图像信息;右图为分割结果,其中A部分为识别得到底面的像素分布。S3:通过对可行驶区域分割结果的像素分布进行统计,得到其像素分布沿着图像空间XY方向的分布统计,进而根据该统计情况,在最大可能运动方向上进行运动控制目标点规划。其中,在最大可能运动方向上进行运动控制目标点规划,能实现反应式的运动避障,而最大可能运动方向的求解过程为:分别用标准差vx和vy表示像素坐标下不同方向的地面延伸程度,也即是在该方向上移动平台可运动的幅度,利用像素的高斯分布统计,得到最大可能运动方向的解为:ηdirection=(vx,vy)。在图像空间中,非可运动区域,也即是非地面像素,往往是进行机器人运动时需要避开的对象。在通过地面分割将需避障物体分离之后,由于仅需对地面像素进行统计,因此,需避障对象在地面像素统计过程中,将得到一个降低的探索可能得分,也即是说ηdirection所代表矢量方向,必然避开需避障物体,根据ηdirection得到的运动控制目标点规划也可实现对避障物体的规避,实现反应式的运动避障。另外,本步骤中,在图像空间根据离散的搜索线集合,进行运动控制目标点规划;具体步骤如下:在利用高斯分布统计以及图像不同方向的像素分布情况后,为了实现在该方向上的运动目标点的规划,设计一条从点oimage=(mx,my)出发,以ηdirection为方向的线作为中心搜索线lc;以lc为中心,以oimage为旋转基点,以给定值θ为旋转幅度,向左与向右各旋转i次,从而得到一系列离散的搜索线集合l,该搜索线集合l以lc为中心展开,离散并均匀地覆盖整个图像;沿着l的每个直线元素,分别从点(mx,my)开始,进行图像检索,一直找到最终一个地面分割有效点结束,进而得到由l的各个元素搜索得到的备选点集合pp;从pp中选择距离(mx,my)在图像空间上最远的点,作为最终运动规划目标点pg,也即是依据以下代价函数进行运动目标点求解:其中,函数d()为求解欧氏距离函数,mx,my分别为地面像素分布位置在XY方向的均值。该运动控制目标点规划示意见图3,左图为实时图像;右图为在分割结果上进行运动目标点规划,其中B点为oimage=(mx,my),与B点连接的线为搜索线集合l,C点为规划得到的运动目标点pg,并将其映射到左图的实时图像中。S4:得到运动控制目标点后,将图像原点假设为当前移动平台所在位置,根据在图像空间得到的运动控制目标点与当前移动平台的相对位置,通过PID运动控制器实现移动平台控制。本实施例只需要单目相机获取移动平台的当前图像,以及只需要对当前获取的单帧图像进行分析,便可得到当前视角下的合理运动控制规划。不需要通过多帧图像的多图像关联得到移动平台的定位信息,同时也不需要进行特征点数据匹配以及平面映射。另外,与已有的基于神经网络的视觉运控方案不同,本实施例不需要进行路标识别以及特征点提取。再者,本实施例利用深度神经网络具有语义分割的能力,对当前获取图像进行语义分割。并直接将该分割结果用以运动目标点规划,从单帧图像输入到运动控制目标点的规划,整个过程无需人为先验知识的输入。本实施本文档来自技高网...

【技术保护点】
1.一种利用深度卷积神经网络实现视觉运动控制的方法,其特征在于,包括以下步骤:S1:在移动平台上安装单目相机,采集移动平台前方的图像信息;S2:以单帧单目图像作为算法输入,利用深度卷积神经网络进行地面分割,以得到当前获得图像视角下的可行驶区域;S3:根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动控制目标点;S4:得到运动控制目标点后,将图像原点假设为当前移动平台所在位置,根据在图像空间得到的运动控制目标点与当前移动平台的相对位置,通过PID运动控制器实现移动平台控制。

【技术特征摘要】
1.一种利用深度卷积神经网络实现视觉运动控制的方法,其特征在于,包括以下步骤:S1:在移动平台上安装单目相机,采集移动平台前方的图像信息;S2:以单帧单目图像作为算法输入,利用深度卷积神经网络进行地面分割,以得到当前获得图像视角下的可行驶区域;S3:根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动控制目标点;S4:得到运动控制目标点后,将图像原点假设为当前移动平台所在位置,根据在图像空间得到的运动控制目标点与当前移动平台的相对位置,通过PID运动控制器实现移动平台控制。2.根据权利要求1所述的一种利用深度卷积神经网络实现视觉运动控制的方法,其特征在于,所述步骤S3通过对可行驶区域分割结果的像素分布进行统计,得到其像素分布沿着图像空间XY方向的分布统计,进而根据该统计情况,在最大可能运动方向上进行运动控制目标点规划。3.根据权利要求2所述的一种利用深度卷积神经网络实现视觉运动控制的方法,其特征在于,所述最大可能运动方向的求解过程为:像素坐标下不同方向的地面延伸程度分别用标准差vx和vy表示,也即是在该方向上移动平台可...

【专利技术属性】
技术研发人员:张宏陈炜楠朱蕾何力管贻生
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1