System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于双目视觉的目标识别方法及目标识别模型训练方法技术_技高网

基于双目视觉的目标识别方法及目标识别模型训练方法技术

技术编号:41143845 阅读:17 留言:0更新日期:2024-04-30 18:12
本申请公开了基于双目视觉的目标识别方法及目标识别模型训练方法,其中,该目标识别方法包括:步骤11:获取采样图像及对应的视差图,并基于视差图中的视差,对采样图像进行剪裁,生成待拼接图像;步骤12:对待拼接图像进行拼接,生成待识别图像;步骤13:利用目标识别模型,对待识别图像进行目标检测,生成待识别图像的目标识别标签,并将目标识别标签映射至采样图像。通过本申请中的技术方案,基于视差图对采样图像进行剪裁、拼接,可以去除采样图像中的大部分无用的图像区域,并利用此类方法拼接得到的图像进行目标识别,有助于降低目标识别模型处理图像时的算力需求,减小算力的浪费。

【技术实现步骤摘要】

本申请涉及图像处理的,具体而言,涉及一种基于双目视觉的目标识别方法以及一种目标识别模型训练方法。


技术介绍

1、在计算机视觉领域,较高分辨率(如1280*720、1920*1080)的图像往往包含着更加丰富的图像信息,更有利于目标识别模型准确的对图像中的目标进行识别,但分辨率越高越需要平台提供足够高的算力进行支撑。但对于小算力平台(或者仅被划分一小部分算力的车机平台)而言,无法直接对较高分辨率的图像进行目标识别,影响了计算机视觉技术的落地。

2、而现有技术中,为了在此类小算力平台上实现对高分辨率图像进行目标识别,通常都是将采集到的高分辨率图像直接分割为若干张大小相等的小图像,然后再将分割得到的小图像输入至平台(模型)进行识别,输出最终目标结果。本领域技术人员能够理解的是,这样处理方式,会将图像中的完整目标,分割在不同的小图像中,导致漏检、误检,进而影响计算机视觉目标识别的准确性,同时,还会导致检测速度大幅度下降,影响检测的实时性要求。

3、而对于双目相机,由于其输出的视差图能够得出外轮廓连通的区域,因此,可以考虑基于视差图对待识别的图像(rgb图像)进行剪裁、拼接,以满足小算力平台的需求,但并没有此类相关的现有技术。

4、另外,由于视差仅能确定某一目标大致、且不规则的区域,并不能准确的获取其边界,导致其对应于待检测rgb图像的区域同样不规则,无法直接利用现有的目标检测模型进行识别。


技术实现思路

1、本申请的目的在于:如何对大分辨率待识别的图像进行剪裁、拼接,以降低目标识别模型处理图像时的算力需求,并对此类模型进行相应的训练。

2、本申请第一方面的技术方案是:提供了一种基于双目视觉的目标识别方法,该目标识别方法包括:步骤11:获取采样图像及对应的视差图,并基于视差图中的视差,对采样图像进行剪裁,生成待拼接图像;步骤12:对待拼接图像进行拼接,生成待识别图像;步骤13:利用目标识别模型,对待识别图像进行目标检测,生成待识别图像的目标识别标签,并将目标识别标签映射至采样图像。

3、在一些实施例中,步骤11中,基于视差图中的视差,对采样图像进行剪裁,生成待拼接图像,具体包括:基于视差图中的视差,确定潜在目标区域;确定潜在目标区域的最大外接矩形,并通过坐标变换的方式,将潜在目标区域变换至采样图像,并将变换至采样图像中的区域记作预处理感兴趣区域;基于预处理感兴趣区域,对采样图像进行剪裁,生成待拼接图像。

4、在一些实施例中,步骤12中,具体包括:创建全零图像,并选取任一张待拼接图像,采用滑动窗口的方式,按照由左至右、由上至下的顺序,将选取的待拼接图像在全零图像中进行位置匹配;当判定选取的待拼接图像完全位于全零图像内时,将选取的待拼接图像在全零图像中的位置记作待拼接区域;计算选取的待拼接图像的像素值与待拼接区域内像素值的卷积值;判断卷积值是否为0,若是,将选取的待拼接图像拼接至待拼接区域,生成待识别图像,并选取下一张待拼接图像,重新进行位置匹配,若否,重新进行位置匹配,选取下一个待拼接区域。

5、在一些实施例中,目标识别方法还包括:在生成待拼接图像时,记录各张待拼接图像在采样图像中的第一位置信息;在生成待识别图像时,记录各张待拼接图像在待识别图像中的第二位置信息;步骤13中,将目标识别标签映射至采样图像,具体包括:根据第一位置信息、第二位置信息,将待识别图像的目标识别标签,通过坐标映射的方式,映射至采样图像。

6、本申请第二方面的技术方案是:提供了一种目标识别模型训练方法,该训练方法包括:步骤21:基于样本图像中已标注的目标框的标签信息,确定预设比例,并基于预设比例对目标框的尺寸进行扩充,生成剪裁框;步骤22:基于剪裁框,对样本图像进行剪裁,将剪裁出的图像记作候选图像;步骤23:对多张候选图像进行拼接,生成训练图像,并基于训练图像,对目标识别模型进行训练。

7、在一些实施例中,步骤23中,具体包括:步骤231:基于剪裁框及坐标计算的方式,确定候选图像对应的至少一个候选目标框,并基于候选目标框,生成候选目标框序列,其中,候选目标框为位于剪裁框内、以及与剪裁框存在重叠区域的目标框;步骤232:对多张候选图像进行拼接,生成训练图像;步骤233:基于多张候选图像的拼接顺序,拼接候选目标框序列,生成训练图像对应的训练目标框序列;步骤234:基于训练图像、训练目标框序列,对目标识别模型进行训练。

8、在一些实施例中,步骤232,具体包括:选取任一张候选图像,确定候选图像对应的目标类别标签,其中,目标类别标签由候选图像对应的目标框的标签信息确定;基于目标类别标签,按照预设规则,确定缩放比例;基于缩放比例,对候选图像进行缩放;对多张缩放后的候选图像进行拼接,生成训练图像。

9、在一些实施例中,步骤231中,具体包括:计算任一候选目标框的相对位置坐标以及候选目标框尺寸;其中,相对位置坐标为候选目标框的中心点在候选图像中的坐标;基于缩放比例,对相对位置坐标进行变换,并对候选目标框尺寸进行缩放;基于候选目标框对应的目标类别标签、变换后的相对位置坐标以及缩放后的候选目标框尺寸,生成候选目标框序列。

10、在一些实施例中,步骤23中,对多张候选图像进行拼接,生成训练图像,具体包括:基于预设尺寸,创建全值图像,并选取任一张候选图像,记作当前候选图像,其中,全值图像中的像素值为0;采用滑动窗口的方式,按照由左至右、由上至下的顺序,将当前候选图像在全值图像中进行位置匹配;当判定当前候选图像完全位于全值图像内时,将当前候选图像在全值图像中的位置记作待拼接区域;计算当前候选图像的像素值与待拼接区域内像素值的卷积值;判断卷积值是否为0,若是,将当前候选图像拼接至待拼接区域,生成训练图像,并选取下一张候选图像,重新记作当前候选图像,若否,重新进行位置匹配,选取待拼接区域。

11、在一些实施例中,步骤21中,还包括:当判定剪裁框的坐标超出样本图像的边界坐标时,基于边界坐标,对剪裁框的坐标进行更新。

12、本申请的有益效果是:

13、本申请中的技术方案,基于视差图对待识别的图像(采样图像)进行剪裁、拼接,得到用于目标识别的待识别图像,可以去除采样图像中的大部分无用的图像区域,有助于降低目标识别模型处理图像时的算力需求,实现高分辨率、小算力情况下的目标检测,并提高了目标检测的实时性。

14、本申请为了使目标识别模型能够对上述剪裁、拼接得到的待识别图像进行识别,还提出了对应的模型训练方法,并且考虑到样本图像的目标框通常为正样本且尺寸小于按视差截取的图像尺寸,因此,对目标框进行扩充后再对样本图像进行剪裁、拼接,得到对应的训练图像,一方面,使视差图中的目标区域与重剪裁后样本图像中的目标区域,尺寸能够基本对应;另一方面,增加训练时所用图像中的负样本,提高了模型的训练效果和训练效率。

本文档来自技高网...

【技术保护点】

1.一种基于双目视觉的目标识别方法,其特征在于,所述目标识别方法包括:

2.如权利要求1所述的基于双目视觉的目标识别方法,其特征在于,所述步骤11中,基于所述视差图中的视差,对所述采样图像进行剪裁,生成待拼接图像,具体包括:

3.如权利要求1所述的基于双目视觉的目标识别方法,其特征在于,所述步骤12中,具体包括:

4.如权利要求1至3中任一项所述的基于双目视觉的目标识别方法,其特征在于,所述目标识别方法还包括:

5.一种目标识别模型训练方法,其特征在于,所述训练方法包括:

6.如权利要求5所述的目标识别模型训练方法,其特征在于,所述步骤23中,具体包括:

7.如权利要求6所述的目标识别模型训练方法,其特征在于,所述步骤232,具体包括:

8.如权利要求7所述的目标识别模型训练方法,其特征在于,所述步骤231中,具体包括:

9.如权利要求5所述的目标识别模型训练方法,其特征在于,所述步骤23中,所述对多张所述候选图像进行拼接,生成训练图像,具体包括:

10.如权利要求5所述的目标识别模型训练方法,其特征在于,所述步骤21中,还包括:

...

【技术特征摘要】

1.一种基于双目视觉的目标识别方法,其特征在于,所述目标识别方法包括:

2.如权利要求1所述的基于双目视觉的目标识别方法,其特征在于,所述步骤11中,基于所述视差图中的视差,对所述采样图像进行剪裁,生成待拼接图像,具体包括:

3.如权利要求1所述的基于双目视觉的目标识别方法,其特征在于,所述步骤12中,具体包括:

4.如权利要求1至3中任一项所述的基于双目视觉的目标识别方法,其特征在于,所述目标识别方法还包括:

5.一种目标识别模型训练方法,其特征在于,所述训练方法包括:<...

【专利技术属性】
技术研发人员:任杰王鑫袁振强郭昌佑
申请(专利权)人:元橡科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1