物体检测方法、网络训练方法、装置和计算机存储介质制造方法及图纸

技术编号:18658618 阅读:24 留言:0更新日期:2018-08-11 14:41
本发明专利技术实施例公开了一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。所述检测方法包括:基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的实际区域。

Object detection method, network training method, device and computer storage medium

The embodiment of the invention discloses an object detection method based on depth learning, a network training method, a device and a computer storage medium. The detection method includes: obtaining a second image data based on a first image data and a region estimation network, the second image data including an estimated region of an object to be detected in the first image data, and inputting the first image data and the second image data into an object detection network to enable the object detection. The network detects the first image data based on the estimated region, and obtains the actual region of the object to be detected in the first image data.

【技术实现步骤摘要】
物体检测方法、网络训练方法、装置和计算机存储介质
本专利技术涉及图像处理
,具体涉及一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。
技术介绍
物体检测是计算机视觉领域的重要问题之一,在多种任务诸如自动驾驶、场景分析、人脸分析中有着重要的应用。随着目前深度学习技术的大规模落地,检测算法的运行平台有可能是性能比较低的手机或者嵌入式平台,过慢的检测速度或者过差的检测效果必然会降低用户体验。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种基于深度学习的物体检测方法,所述方法包括:基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的检测区域。上述方案中,所述方法还包括:获得用于网络训练的第四图像数据,以及所述第四图像数据中包括的标注区域对应的标注信息;所述标注区域表征所述第四图像数据中物体所在区域;采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。上述方案中,所述采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,包括:确定除所述标注区域以外的背景区域的部分背景区域;所述部分背景区域采用随机方式从所述背景区域中确定;将所述部分背景区域添加至所述标注区域,生成所述第三图像数据的更新标注区域;基于有向卷积层分别识别所述第四图像数据中的标注区域和更新标注区域,对所述标注区域中的图像数据以及对应的标注信息进行训练,以及对所述更新标注区域中的图像数据以及对应的标注信息进行训练,获得物体检测网络。上述方案中,所述基于第一图像数据和区域估计网络,获得第二图像数据,包括:对所述第一图像数据进行卷积处理,获得所述第一图像数据对应的第一特征图;将所述特征图输入至少一个池化层,获得与所述特征图的尺度不同的至少一个第二特征图;对具有不同尺度的所述第一特征图、所述至少一个第二特征图分别进行卷积处理,对卷积处理后的所述第一特征图、所述至少一个第二特征图进行融合,输出携带有标识待检测物体的估计区域的第二图像数据。上述方案中,所述输出携带有标识待检测物体的估计区域的第二图像数据,包括:对融合后的所述第一特征图、所述至少一个第二特征图进行二值化处理,输出二值化表示的携带有标识待检测物体的估计区域的第二图像数据。上述方案中,所述将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,包括:将所述第一图像数据和所述第二图像数据输入物体检测网络;所述物体检测网络包括有向卷积层;基于所述有向卷积层识别所述第二图像数据中的所述估计区域,确定所述第一图像数据中、与所述估计区域对应的目标区域,对所述第一图像数据中的所述目标区域进行卷积操作。本专利技术实施例还提供了一种网络训练方法,所述方法包括:获得用于网络训练的第四图像数据,以及所述第四图像数据中标注区域对应的标注信息;所述标注区域表征所述第四图像数据中检测物体所在区域;采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。上述方案中,所述采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,包括:基于有向卷积层识别所述第四图像数据中的标注区域,对所述标注区域中的图像数据以及对应的标注信息进行训练,获得物体检测网络。上述方案中,所述采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,包括:确定除所述标注区域以外的背景区域的部分背景区域;所述部分背景区域采用随机方式从所述背景区域中确定;将所述部分背景区域添加至所述标注区域,生成所述第四图像数据的更新标注区域;基于有向卷积层分别识别所述第四图像数据中的标注区域和更新标注区域,对所述标注区域中的图像数据以及对应的标注信息进行训练,以及对所述更新标注区域中的图像数据以及对应的标注信息进行训练,获得物体检测网络。本专利技术实施例还提供了一种基于深度学习的物体检测装置,所述检测装置包括:第一获取单元和检测单元;其中,所述第一获取单元,用于基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;所述检测单元,用于将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的检测区域。上述方案中,所述装置还包括第二获取单元和第一训练单元;其中,所述第二获取单元,用于获得用于网络训练的第四图像数据,以及所述第四图像数据中标注区域对应的标注信息;所述标注区域表征所述第四图像数据中物体所在区域;所述第一训练单元,用于采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。上述方案中,所述装置还包括第一更新单元,用于确定除所述标注区域以外的背景区域的部分背景区域;所述部分背景区域采用随机方式从所述背景区域中确定;将所述部分背景区域添加至所述标注区域,生成所述第四图像数据的更新标注区域;所述第一训练单元,用于基于有向卷积层分别识别所述第四图像数据中的标注区域和更新标注区域,对所述标注区域中的图像数据以及对应的标注信息进行训练,以及对所述更新标注区域中的图像数据以及对应的标注信息进行训练,获得物体检测网络。上述方案中,所述第一获取单元,用于对所述第一图像数据进行卷积处理,获得所述第一图像数据对应的第一特征图;将所述特征图输入至少一个池化层,获得与所述特征图的尺度不同的至少一个第二特征图;对具有不同尺度的所述第一特征图、所述至少一个第二特征图分别进行卷积处理,对卷积处理后的所述第一特征图、所述至少一个第二特征图进行融合,输出携带有标识待检测物体的估计区域的第二图像数据。上述方案中,所述第一获取单元,用于对融合后的所述第一特征图、所述至少一个第二特征图进行二值化处理,输出二值化表示的携带有标识待检测物体的估计区域的第二图像数据。上述方案中,所述检测单元,用于将所述第一图像数据和所述第二图像数据输入物体检测网络;所述物体检测网络包括有向卷积层;基于所述有向卷积层识别所述第二图像数据中的所述估计区域,确定所述第一图像数据中、与所述估计区域对应的目标区域,对所述第一图像数据中的所述目标区域进行卷本文档来自技高网...

【技术保护点】
1.一种基于深度学习的物体检测方法,其特征在于,所述方法包括:基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的检测区域。

【技术特征摘要】
1.一种基于深度学习的物体检测方法,其特征在于,所述方法包括:基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的检测区域。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获得用于网络训练的第四图像数据,以及所述第四图像数据中包括的标注区域对应的标注信息;所述标注区域表征所述第四图像数据中物体所在区域;采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。3.根据权利要求1所述的方法,其特征在于,所述基于第一图像数据和区域估计网络,获得第二图像数据,包括:对所述第一图像数据进行卷积处理,获得所述第一图像数据对应的第一特征图;将所述特征图输入至少一个池化层,获得与所述特征图的尺度不同的至少一个第二特征图;对具有不同尺度的所述第一特征图、所述至少一个第二特征图分别进行卷积处理,对卷积处理后的所述第一特征图、所述至少一个第二特征图进行融合,输出携带有标识待检测物体的估计区域的第二图像数据。4.一种网络训练方法,其特征在于,所述方法包括:获得用于网络训练的第四图像数据,以及所述第四图像数据中标注区域对应的标注信息;所述标注区域表征所述第四图像数据中检测物体所在区域;采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。5.一种基于深度学习的物体检测装置,其特征在于,所述检测装置包括:第一获取单元和检测单元;其中,所述第一获取单元,用于...

【专利技术属性】
技术研发人员:岳晓宇旷章辉张兆阳陈振方张伟
申请(专利权)人:深圳市商汤科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1