【技术实现步骤摘要】
一种多个小目标的自动准确检测方法
本专利技术涉及智能监控视频处理领域,具体涉及一种多个小目标的自动准确检测方法。
技术介绍
近年来,随着全国各地平安城市、国家安防等需求日益增进,国家大力发展相关行业技术的研究和实施,视频图像监控技术在其中起着越来越核心的作用,同时大量数据的产生以及如何高效利用大数据带来的信息和内容成为行业前进的关键,智慧监控的图像视频大数据是获取大量有效信息的源头,也为深度学习算法等模型训练验证提供了数据支撑。自2006年以来,深度学习在学术界和工业界持续升温,在语音识别、自然语言处理、图像识别等领域取得了惊人进展,从而推动了人工智能和人机交互的大踏步前进。深度学习成为了新世纪以来最具有技术性和突破性的研究方向,为科技新时代的建立提供了整体的技术框架和核心思路。传统来说,视频图像中的物体识别可以划分成三个步骤,一个是图像分割,即将图像主体,待识别检测的前景,与背景进行分离,二是通过主体前景进行图像特征的提取,使用数学向量或张量的形式进行简化和特征突出,三是将提取好的图像特征进行机器学习的分类迭代,得 ...
【技术保护点】
1.一种多个小目标的自动准确检测方法,其特征在于,包括如下步骤:/nS1生成多类别的训练集和测试数据集,对图像数据进行标定,记录类别序号及位置信息;/nS2对图像数据进行预处理,所述预处理包括标准化和归一化处理,对预处理后的图像数据进行压缩,然后重叠分块,得到多张小图像,对其序列进行编号;/nS3采用基于caffe框架的VGGNet模型作为基础网络,在基础网络中添加从大到小的卷积层用于预测图像中物体的位置信息,通过迭代训练数据集,不断迭代优化损失函数,得到物体检测模型;/nS4在物体检测模型中添加dropout结构,对dropout结构输出的特征向量进行rescale操作, ...
【技术特征摘要】
1.一种多个小目标的自动准确检测方法,其特征在于,包括如下步骤:
S1生成多类别的训练集和测试数据集,对图像数据进行标定,记录类别序号及位置信息;
S2对图像数据进行预处理,所述预处理包括标准化和归一化处理,对预处理后的图像数据进行压缩,然后重叠分块,得到多张小图像,对其序列进行编号;
S3采用基于caffe框架的VGGNet模型作为基础网络,在基础网络中添加从大到小的卷积层用于预测图像中物体的位置信息,通过迭代训练数据集,不断迭代优化损失函数,得到物体检测模型;
S4在物体检测模型中添加dropout结构,对dropout结构输出的特征向量进行rescale操作,来保证数据归一化后数据的分布相同;
S5将训练得到的caffemodel文件和网络结构描述文件共同打包成Jar包,封装成SDK;
S6对分块后的序列图像进行合并,并进行非极大值抑制,输出该图的检测框结果。
2.根据权利要求1所述的自动准确检测方法,其特征在于,所述S1生成多类别的训练集和测试数据集,对图像数据进行标定,记录类别序号及位置信息,具体为:
S1.1每个类别制定类别名;
S1.2对所有的图像文件进行标定,标定出图像中出现的物体信息,包括类别和位置信息;
S1.3根据标定的xml文件和图片文件生成训练数据和测试数据描述文件。
3.根据权利要求1所述的自动准确检测方法,其特征在于,所述S2重叠分块,得到多张小图像的检测,具体为:
S2.1根据小目标物体的大小将整张图像进行n*n的分块,分配序列号1至n*n;
S2.2对于长宽分别为l和w的图像,截取图像长从l/2n到l-l/2n,宽从w/2n到w-w/2n的部分,将该图像进行(n-1)*(n-1)的分块,分配序列号n*n+1至n*n+(n-1)*(n-1);
S2.3将分块后的n*n+(n-1)*(n-1)张序列图像和原图一同作为对应的训练集和测试集进行物体检测。
4.根据权利要求1所述的自动准确检测方法,其特征在于,所述S3采用基于caffe框架的VGGNet模型作为基础网络,在基础网络中添加从大到小的卷积层用于预测图像中物体的位置信息,通过迭代训练数据集,不断迭...
【专利技术属性】
技术研发人员:黄翰,黄黎龙,李刚,徐杨,郝志峰,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。