The embodiment of the present invention provides a method and device for generating SSD framework for target detection, which obtains the initial SSD framework. The feature extraction network and the target detection network in the initial SSD framework are not pre-trained. The structure of the initial SSD framework is improved, and the SSD framework is improved. The first unit of the feature extraction network in the SSD framework is convolution unit, and the SSD frame is improved. The frame includes batch standardization operation, random initialization of parameters in improved SSD framework, and training of improved SSD framework with samples from target data sets. It can be seen that when generating SSD framework, the structure of the original SSD framework is improved without the help of pre-training network model, so that the improved SSD framework can ensure the accuracy of target detection. Under the premise of sex, avoid the limitation of pre-training network on SSD framework, and improve the flexibility of SSD framework.
【技术实现步骤摘要】
用于目标检测的SSD框架的生成方法及装置
本专利技术实施例涉及人工智能
,尤其涉及一种用于目标检测的SSD框架的生成方法及装置。
技术介绍
目标检测(ObjectDetection)是计算机视觉研究领域的热点和难点问题,应用在无人驾驶、无人仓储物流中、智能机器人等。目标检测要解决的问题是:通过目标框找出图像或视频中某些类别的物体,并且给出该物体属于某一类别的概率,即一种位置坐标回归与类别预测结合的任务。近年来,随着深度学习与卷积神经网络的发展,目标检测技术得以应用在实际场景中。目前,基于深度学习的目标检测算法包括:R-CNN、Faster-RCNN(中文全称快速区域候选网络,英文全称:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks)、SSD(中文全称:单次多框检测器,英文全称:SingleShotMultiBoxDetector)。下面以SSD框架为例进行说明:SSD框架包括特征提取网络和目标检测网络,其中,特征提取网络用于对图像进行特征提取,目标检测网络用于根据提取的特征进行位置回归和目标类别的预测,从而识别该图像中的物体类别。由于深度学习过程需要大量的训练数据,而针对某种特定需求的目标数据集中的样本数量通常是有限的。因此,现有技术中,为了提高检测准确率,在使用SSD框架时,通常会借助预训练网络模型(例如:借助在ImageNet数据库上经过预训练的VGG网络模型)。具体的,首先获取在ImageNet数据库上经过预训练的VGG网络模型,然后使用目标数据集中的样本对预训练的VGG网络模 ...
【技术保护点】
1.一种用于目标检测的单次多框检测SSD框架的生成方法,其特征在于,包括:获取初始SSD框架,所述初始SSD框架包括:特征提取网络和目标检测网络,所述特征提取网络中包括至少一个卷积单元和至少一个降采样单元,所述卷积单元和所述降采样单元间隔设置,所述目标检测网络包括至少一个检测单元,各所述检测单元与各所述卷积单元一一对应连接;所述特征提取网络和所述目标检测网络均未经过预训练;对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,所述改进SSD框架中的所述特征提取网络的第一个单元为卷积单元,所述改进SSD框架中包括批标准化操作;对所述改进SSD框架中参数进行随机初始化,并采用目标数据集中的样本对所述改进SSD框架进行训练,得到训练后的SSD框架。
【技术特征摘要】
1.一种用于目标检测的单次多框检测SSD框架的生成方法,其特征在于,包括:获取初始SSD框架,所述初始SSD框架包括:特征提取网络和目标检测网络,所述特征提取网络中包括至少一个卷积单元和至少一个降采样单元,所述卷积单元和所述降采样单元间隔设置,所述目标检测网络包括至少一个检测单元,各所述检测单元与各所述卷积单元一一对应连接;所述特征提取网络和所述目标检测网络均未经过预训练;对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,所述改进SSD框架中的所述特征提取网络的第一个单元为卷积单元,所述改进SSD框架中包括批标准化操作;对所述改进SSD框架中参数进行随机初始化,并采用目标数据集中的样本对所述改进SSD框架进行训练,得到训练后的SSD框架。2.根据权利要求1所述的方法,其特征在于,所述特征提取网络中的部分卷积单元和部分降采样单元组成第一子网络,其余卷积单元和其余降采样单元组成第二子网络,所述第一子网络的结构为VGG网络模型的结构;所述对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,包括:对所述特征提取网络和/或所述目标检测网络进行批标准化处理,得到改进SSD框架。3.根据权利要求2所述的方法,其特征在于,所述卷积单元包括卷积层和激活层,所述检测单元包括卷积层和激活层;所述对所述特征提取网络和/或所述目标检测网络进行批标准化处理,得到改进SSD框架,包括:针对所述特征提取网络中的各所述卷积单元和/或所述目标检测网络中的各所述检测单元,在所述卷积层和所述激活层之间增加批标准化层。4.根据权利要求2或3所述的方法,其特征在于,所述VGG网络模型为VGG-16网络模型。5.根据权利要求1所述的方法,其特征在于,所述特征提取网络中的部分卷积单元和部分降采样单元组成第一子网络,其余卷积单元和其余降采样单元组成第二子网络,所述第一子网络的结构为ResNet网络的结构;所述对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,包括:将所述ResNet网络中的第一个降采样单元删除,以使所述特征提取网络的第一个单元为卷积单元。6.根据权利要求5所述的方法,其特征在于,所述对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,还包括:将所述ResNet网络中第一个卷积单元中的7*7的卷积层替换为3个3*3的卷积层。7.根据权利要求5所述的方法,其特征在于,所述对所述初始SSD框架的结构进行改进处理,得到改进SSD框架,还包括:将所述第二子网络中的各卷积单元的结构修改为与所述ResNet网络中的各卷积单元相同的残差结构。8.根据权利要求5至7任一项所述的方法,其特征在于,所述ResNet网络为ResNet-18网络或者ResNet-34网络。9.一种用于目标检测的单次多框检测SSD框架的生成装置,其特征在于,包括:获取模块,用于获取初始SSD框架,...
【专利技术属性】
技术研发人员:朱睿,石海林,张士峰,王晓波,梅涛,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。