一种深度学习样本收集方法、装置、设备及存储介质制造方法及图纸

技术编号：19546959 阅读：30 留言：0更新日期：2018-11-24 21:09

本发明专利技术公开了一种深度学习样本收集方法、装置、设备和存储介质。该方法包括：在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域；根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域，利用即时定位与地图构建SLAM系统，在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域；采集标注有所述目标对象的感兴趣区域的图像，作为所述目标对象的训练样本图像。本发明专利技术将感兴趣区域作为对图像的标注，这样在存储目标对象的训练样本图像时，就已经对该训练样本图像进行了标注，且标注具有准确性。通过本实施例无需对大量的训练样本图像进行人工标注，并且避免了人工标注容易出现错误标注的问题。

A Sample Collection Method, Device, Equipment and Storage Medium for Deep Learning

The invention discloses a method, device, device and storage medium for collecting deep learning samples. The method includes: determining the target object in a frame image of video data and labeling the region of interest of the target object; constructing SLAM system by using real-time location and map according to the target object determined in the image and the region of interest of the target object, and labeling the multi-frame image of the video data. The region of interest (ROI) of the target object is annotated, and the image annotated with the ROI of the target object is collected as the training sample image of the target object. The method takes the region of interest as the annotation of the image, so that when the training sample image of the target object is stored, the training sample image has been annotated, and the annotation is accurate. The implementation does not require manual labeling of a large number of training sample images, and avoids the problem that manual labeling is prone to error labeling.

全部详细技术资料下载

【技术实现步骤摘要】
一种深度学习样本收集方法、装置、设备及存储介质
本专利技术涉及深度学习
，特别是涉及一种深度学习样本收集方法、装置、设备及存储介质。
技术介绍
深度学习技术的概念是由Hinton等人于2006年提出。基于深度置信网络(DeepBeliefNets，简称DBN)提出的非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来了希望，基于此随后提出了多层自动编码器深层结构。卷积神经网络是第一个真正的多层自动编码器深层结构学习算法，该算法利用空间相对关系来减少参数数目用以提高训练性能。到目前为止，深度学习技术凭借其强大的特征提取能力已经在目标识别、目标检测、目标分割、目标跟踪等各个计算机视觉
以碾压性的优势压倒了众多传统视觉算法。虽然深度学习技术在效果上较传统的计算机视觉方法具有明显优势，但是深度学习技术要达到很好的效果必须要有大量的训练样本作为支撑，否则也无法得到准确率很高的深度模型。然而现实情况是：在一个方面，获取大量准确标注的训练样本通常是一件极其困难的事情，这极大的阻碍了深度学习技术在很多领域的应用，在另外一个方面，即使花费大量人力和物力对训练样本进行...

【技术保护点】
1.一种深度学习样本收集方法，其特征在于，包括：在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域；根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域，利用即时定位与地图构建SLAM系统，在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域；采集标注有所述目标对象的感兴趣区域的图像，作为所述目标对象的训练样本图像。

【技术特征摘要】
1.一种深度学习样本收集方法，其特征在于，包括：在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域；根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域，利用即时定位与地图构建SLAM系统，在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域；采集标注有所述目标对象的感兴趣区域的图像，作为所述目标对象的训练样本图像。2.如权利要求1所述的方法，其特征在于，所述利用即时定位与地图构建SLAM系统，在视频数据中标注出所述目标对象的感兴趣区域，包括：针对正在拍摄的视频数据或者拍摄完成的视频数据，利用所述SLAM系统，在包含所述目标对象的每帧图像中，标注出所述目标对象的感兴趣区域。3.如权利要求2所述的方法，其特征在于，所述针对正在拍摄的视频数据，利用所述SLAM系统，在包含所述目标对象的每帧图像中，标注出所述目标对象的感兴趣区域，包括：拍摄不同光线条件下和/或不同位姿下的所述目标对象，并利用所述SLAM系统，在包含所述目标对象的每帧图像中标注出所述目标对象的感兴趣区域。4.如权利要求3所述的方法，其特征在于，所述拍摄不同光线条件下和不同位姿下的所述目标对象，包括：步骤2，调整当前光线亮度；步骤4，对所述目标对象进行不同尺度的拍摄，以获得在当前光线亮度下不同尺度的所述目标对象的图像；步骤6，围绕所述目标对象进行不同视角的拍摄，以获得在当前光线亮度下不同视角的所述目标对象的图像；步骤8，判断预设的多个光线亮度是否都拍摄完毕，如果否，则跳转到步骤2。5.如权利要求1～4中任一项所述的方法，其特征在于，所述在视频数据的一帧图像中确定目标对象并标注出所述目标对象的感兴趣区域，包括：利用预设的目标检测模型，在视频数据中的图像中检测目标对象并标注出所述目标对象的感兴趣区域。6.如权利要求1～4中任一项所述的方法，其特征在于，所述根据在所述图像中确定的目标对象以及所述目标对象的感兴趣区域，利用即时定位与地图构建SLAM系统，在所述视频数据的多帧图像中标注出所述目标对象的感兴趣区域，包括：通过所述SLAM系统，确定本帧图像中的所述目标对象相对于前一帧图像中的所述目标对象的位姿变化；根据所述目标对象的位姿变化以及所述目标对象在所述前一帧图像中的感兴趣区域，标注出所述目标对象在本帧图像中的感兴趣区域。7.一种深度学习样...

【专利技术属性】
技术研发人员：陈文杰，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人