一种深度学习样本收集方法、装置、设备及存储介质制造方法及图纸

技术编号:19546959 阅读:21 留言:0更新日期:2018-11-24 21:09
本发明专利技术公开了一种深度学习样本收集方法、装置、设备和存储介质。该方法包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。本发明专利技术将感兴趣区域作为对图像的标注,这样在存储目标对象的训练样本图像时,就已经对该训练样本图像进行了标注,且标注具有准确性。通过本实施例无需对大量的训练样本图像进行人工标注,并且避免了人工标注容易出现错误标注的问题。

A Sample Collection Method, Device, Equipment and Storage Medium for Deep Learning

The invention discloses a method, device, device and storage medium for collecting deep learning samples. The method includes: determining the target object in a frame image of video data and labeling the region of interest of the target object; constructing SLAM system by using real-time location and map according to the target object determined in the image and the region of interest of the target object, and labeling the multi-frame image of the video data. The region of interest (ROI) of the target object is annotated, and the image annotated with the ROI of the target object is collected as the training sample image of the target object. The method takes the region of interest as the annotation of the image, so that when the training sample image of the target object is stored, the training sample image has been annotated, and the annotation is accurate. The implementation does not require manual labeling of a large number of training sample images, and avoids the problem that manual labeling is prone to error labeling.

【技术实现步骤摘要】
一种深度学习样本收集方法、装置、设备及存储介质
本专利技术涉及深度学习
,特别是涉及一种深度学习样本收集方法、装置、设备及存储介质。
技术介绍
深度学习技术的概念是由Hinton等人于2006年提出。基于深度置信网络(DeepBeliefNets,简称DBN)提出的非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来了希望,基于此随后提出了多层自动编码器深层结构。卷积神经网络是第一个真正的多层自动编码器深层结构学习算法,该算法利用空间相对关系来减少参数数目用以提高训练性能。到目前为止,深度学习技术凭借其强大的特征提取能力已经在目标识别、目标检测、目标分割、目标跟踪等各个计算机视觉
以碾压性的优势压倒了众多传统视觉算法。虽然深度学习技术在效果上较传统的计算机视觉方法具有明显优势,但是深度学习技术要达到很好的效果必须要有大量的训练样本作为支撑,否则也无法得到准确率很高的深度模型。然而现实情况是:在一个方面,获取大量准确标注的训练样本通常是一件极其困难的事情,这极大的阻碍了深度学习技术在很多领域的应用,在另外一个方面,即使花费大量人力和物力对训练样本进行标注,但是由于工作量太大且太繁琐的原因,容易出现一些错误标注的训练样本,这对最终获得的深度模型的准确率具有较大影响。
技术实现思路
本专利技术要解决的技术问题是提供一种深度学习样本收集方法、装置、设备及存储介质,用以解决现有技术中通过人工的方式标注大量训练样本成本高且易出现标注错误的问题。为了解决上述技术问题,本专利技术是通过以下技术方案来解决的:本专利技术提供了一种深度学习样本收集方法,包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。其中,所述利用即时定位与地图构建SLAM系统,在视频数据中标注出所述目标对象的感兴趣区域,包括:针对正在拍摄的视频数据或者拍摄完成的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域。其中,所述针对正在拍摄的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域,包括:拍摄不同光线条件下和/或不同位姿下的所述目标对象,并利用所述SLAM系统,在包含所述目标对象的每帧图像中标注出所述目标对象的感兴趣区域。其中,所述拍摄不同光线条件下和不同位姿下的所述目标对象,包括:步骤2,调整当前光线亮度;步骤4,对所述目标对象进行不同尺度的拍摄,以获得在当前光线亮度下不同尺度的所述目标对象的图像;步骤6,围绕所述目标对象进行不同视角的拍摄,以获得在当前光线亮度下不同视角的所述目标对象的图像;步骤8,判断预设的多个光线亮度是否都拍摄完毕,如果否,则跳转到步骤2。其中,所述在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域,包括:利用预设的目标检测模型,在视频数据中的图像中检测目标对象并标注出所述目标对象的感兴趣区域。其中,所述根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域,包括:通过所述SLAM系统,确定本帧图像中的所述目标对象相对于前一帧图像中的所述目标对象的位姿变化;根据所述目标对象的位姿变化以及所述目标对象在所述前一帧图像中的感兴趣区域,标注出所述目标对象在本帧图像中的感兴趣区域。本专利技术提供了一种深度学习样本收集装置,包括以下程序模块:目标确定模块,用于在视频数据的一帧图像中,确定目标对象并标注出所述目标对象的感兴趣区域;目标标注模块,用于根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用SLAM系统,在视频数据的多帧图像中标注出所述目标对象的感兴趣区域;图像采集模块,用于采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。其中,所述目标标注模块,用于:针对正在拍摄的视频数据或者拍摄完成的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域。其中,所述目标标注模块,用于:拍摄不同光线条件下和/或不同位姿下的所述目标对象,并利用所述SLAM系统,在包含所述目标对象的每帧图像中标注出所述目标对象的感兴趣区域。其中,所述目标标注模块,包括:调整单元,用于调整当前光线亮度;尺度拍摄单元,用于对所述目标对象进行不同尺度的拍摄,以获得在当前光线亮度下不同尺度的所述目标对象的图像;视角拍摄单元,用于围绕所述目标对象进行不同视角的拍摄,以获得在当前光线亮度下不同视角的所述目标对象的图像;判断单元,用于判断预设的多个光线亮度是否都拍摄完毕,如果否,则调用所述调整单元调整当前光线亮度。其中,所述目标确定模块,用于利用预设的目标检测模型,在视频数据中的图像中检测目标对象并标注出所述目标对象的感兴趣区域。其中,所述目标标注模块,用于:通过所述SLAM系统,确定本帧图像中的所述目标对象相对于前一帧图像中的所述目标对象的位姿变化;根据所述目标对象的位姿变化以及所述目标对象在所述前一帧图像中的感兴趣区域,标注出所述目标对象在本帧图像中的感兴趣区域。本专利技术提供了一种存储介质,存储有计算机程序,所述存储介质中存储的计算机程序被处理器执行时实现上述的深度学习样本收集方法。本专利技术提供了一种深度学习样本收集设备,所述深度学习样本收集设备包括处理器和存储器;所述处理器用于执行所述存储器中存储的深度学习样本收集程序,以实现上述的深度学习样本收集方法。本专利技术有益效果如下:本专利技术可以利用SLAM系统在图像中标注出目标对象的感兴趣区域,获得包含目标对象感兴趣区域的训练样本图像,进而可以将感兴趣区域作为对包含目标对象的图像的标注,这样在存储目标对象的训练样本图像时,就已经对该训练样本图像进行了标注,且标注具有准确性。通过本实施例无需对大量的训练样本图像进行人工标注,并且避免了人工标注容易出现错误标注的问题,标注效率高且具有准确性,能够提高最终训练出的深度模型的准确性。附图说明图1是根据本专利技术第一实施例的深度学习样本收集方法的流程图;图2是根据本专利技术第二实施例的深度学习样本收集方法的流程图;图3是根据本专利技术第三实施例的深度学习样本收集方法的流程图;图4是根据本专利技术第三实施例的摄像头拍摄时采集的环境图像的示意图;图5是根据本专利技术第三实施例的摄像头远离目标对象拍摄时采集的图像示意图;图6是根据本专利技术第三实施例的摄像头靠近目标对象拍摄时采集的图像示意图;图7是根据本专利技术第三实施例的摄像头围绕目标对象拍摄时采集的图像示意图;图8是根据本专利技术第三实施例的摄像头围绕目标对象拍摄时采集的图像示意图;图9是根据本专利技术第三实施例的摄像头围绕目标对象拍摄时采集的图像示意图;图10是根据本专利技术第四实施例的深度学习样本收集装置的结构图。具体实施方式以下结合附图以及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不限定本专利技术。实施例一本发本文档来自技高网...

【技术保护点】
1.一种深度学习样本收集方法,其特征在于,包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。

【技术特征摘要】
1.一种深度学习样本收集方法,其特征在于,包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。2.如权利要求1所述的方法,其特征在于,所述利用即时定位与地图构建SLAM系统,在视频数据中标注出所述目标对象的感兴趣区域,包括:针对正在拍摄的视频数据或者拍摄完成的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域。3.如权利要求2所述的方法,其特征在于,所述针对正在拍摄的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域,包括:拍摄不同光线条件下和/或不同位姿下的所述目标对象,并利用所述SLAM系统,在包含所述目标对象的每帧图像中标注出所述目标对象的感兴趣区域。4.如权利要求3所述的方法,其特征在于,所述拍摄不同光线条件下和不同位姿下的所述目标对象,包括:步骤2,调整当前光线亮度;步骤4,对所述目标对象进行不同尺度的拍摄,以获得在当前光线亮度下不同尺度的所述目标对象的图像;步骤6,围绕所述目标对象进行不同视角的拍摄,以获得在当前光线亮度下不同视角的所述目标对象的图像;步骤8,判断预设的多个光线亮度是否都拍摄完毕,如果否,则跳转到步骤2。5.如权利要求1~4中任一项所述的方法,其特征在于,所述在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域,包括:利用预设的目标检测模型,在视频数据中的图像中检测目标对象并标注出所述目标对象的感兴趣区域。6.如权利要求1~4中任一项所述的方法,其特征在于,所述根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域,包括:通过所述SLAM系统,确定本帧图像中的所述目标对象相对于前一帧图像中的所述目标对象的位姿变化;根据所述目标对象的位姿变化以及所述目标对象在所述前一帧图像中的感兴趣区域,标注出所述目标对象在本帧图像中的感兴趣区域。7.一种深度学习样...

【专利技术属性】
技术研发人员:陈文杰
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1