The invention discloses a method, device, device and storage medium for collecting deep learning samples. The method includes: determining the target object in a frame image of video data and labeling the region of interest of the target object; constructing SLAM system by using real-time location and map according to the target object determined in the image and the region of interest of the target object, and labeling the multi-frame image of the video data. The region of interest (ROI) of the target object is annotated, and the image annotated with the ROI of the target object is collected as the training sample image of the target object. The method takes the region of interest as the annotation of the image, so that when the training sample image of the target object is stored, the training sample image has been annotated, and the annotation is accurate. The implementation does not require manual labeling of a large number of training sample images, and avoids the problem that manual labeling is prone to error labeling.
【技术实现步骤摘要】
一种深度学习样本收集方法、装置、设备及存储介质
本专利技术涉及深度学习
,特别是涉及一种深度学习样本收集方法、装置、设备及存储介质。
技术介绍
深度学习技术的概念是由Hinton等人于2006年提出。基于深度置信网络(DeepBeliefNets,简称DBN)提出的非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来了希望,基于此随后提出了多层自动编码器深层结构。卷积神经网络是第一个真正的多层自动编码器深层结构学习算法,该算法利用空间相对关系来减少参数数目用以提高训练性能。到目前为止,深度学习技术凭借其强大的特征提取能力已经在目标识别、目标检测、目标分割、目标跟踪等各个计算机视觉
以碾压性的优势压倒了众多传统视觉算法。虽然深度学习技术在效果上较传统的计算机视觉方法具有明显优势,但是深度学习技术要达到很好的效果必须要有大量的训练样本作为支撑,否则也无法得到准确率很高的深度模型。然而现实情况是:在一个方面,获取大量准确标注的训练样本通常是一件极其困难的事情,这极大的阻碍了深度学习技术在很多领域的应用,在另外一个方面,即使花费大量人力和物力对训练样本进行标注,但是由于工作量太大且太繁琐的原因,容易出现一些错误标注的训练样本,这对最终获得的深度模型的准确率具有较大影响。
技术实现思路
本专利技术要解决的技术问题是提供一种深度学习样本收集方法、装置、设备及存储介质,用以解决现有技术中通过人工的方式标注大量训练样本成本高且易出现标注错误的问题。为了解决上述技术问题,本专利技术是通过以下技术方案来解决的:本专利技术提供了一种深度学习样本收集方法,包括:在视频 ...
【技术保护点】
1.一种深度学习样本收集方法,其特征在于,包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。
【技术特征摘要】
1.一种深度学习样本收集方法,其特征在于,包括:在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域;根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域;采集标注有所述目标对象的感兴趣区域的图像,作为所述目标对象的训练样本图像。2.如权利要求1所述的方法,其特征在于,所述利用即时定位与地图构建SLAM系统,在视频数据中标注出所述目标对象的感兴趣区域,包括:针对正在拍摄的视频数据或者拍摄完成的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域。3.如权利要求2所述的方法,其特征在于,所述针对正在拍摄的视频数据,利用所述SLAM系统,在包含所述目标对象的每帧图像中,标注出所述目标对象的感兴趣区域,包括:拍摄不同光线条件下和/或不同位姿下的所述目标对象,并利用所述SLAM系统,在包含所述目标对象的每帧图像中标注出所述目标对象的感兴趣区域。4.如权利要求3所述的方法,其特征在于,所述拍摄不同光线条件下和不同位姿下的所述目标对象,包括:步骤2,调整当前光线亮度;步骤4,对所述目标对象进行不同尺度的拍摄,以获得在当前光线亮度下不同尺度的所述目标对象的图像;步骤6,围绕所述目标对象进行不同视角的拍摄,以获得在当前光线亮度下不同视角的所述目标对象的图像;步骤8,判断预设的多个光线亮度是否都拍摄完毕,如果否,则跳转到步骤2。5.如权利要求1~4中任一项所述的方法,其特征在于,所述在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域,包括:利用预设的目标检测模型,在视频数据中的图像中检测目标对象并标注出所述目标对象的感兴趣区域。6.如权利要求1~4中任一项所述的方法,其特征在于,所述根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域,利用即时定位与地图构建SLAM系统,在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域,包括:通过所述SLAM系统,确定本帧图像中的所述目标对象相对于前一帧图像中的所述目标对象的位姿变化;根据所述目标对象的位姿变化以及所述目标对象在所述前一帧图像中的感兴趣区域,标注出所述目标对象在本帧图像中的感兴趣区域。7.一种深度学习样...
【专利技术属性】
技术研发人员:陈文杰,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。