一种摄像头场景图像的成分智能分析方法技术

技术编号:19009560 阅读:28 留言:0更新日期:2018-09-22 09:22
本发明专利技术公开一种摄像头场景图像的成分智能分析方法,包括:过程1、将图像数据输入AlexNet深度神经网络模型进行特征解离得到预设维度特征;过程2、接收过程1输出的预设维度特征,进行反向特征消除;过程3、接收过程2的输出数据,对其进行矩阵的高相关滤波;过程4、接收上一步数据,利用随机投影森林,对所有的数据进行划分,将每次搜索与计算的点的数目减小到一个可接受的范围,然后建立多个随机投影树构成随机投影森林,将森林的综合结果作为最终的结果。本发明专利技术通过上述方案,在保证最终数据规模与现有方法基本同级别的情况下,兼顾对后期比对、搜索的精确等价性,这是PCA主成分分析或其他方法无法兼顾到的。

An intelligent component analysis method for scene images of cameras

The invention discloses an intelligent component analysis method for camera scene images, including: process 1, feature dissociation of image data into AlexNet depth neural network model to obtain preset dimension features; process 2, preset dimension features output from reception process 1, reverse feature elimination; process 3, transmission of reception process 2. Procedure 4. Receiving the last step of data, using the random projection forest, divide all the data, reduce the number of points searched and calculated each time to an acceptable range, then establish a number of random projection trees to form a random projection forest, forest synthesis. The result is the final result. Through the above scheme, under the condition of guaranteeing that the final data size is basically the same level as the existing method, the invention takes into account the accuracy and equivalence of post-comparison and search, which can not be taken into account by PCA principal component analysis or other methods.

【技术实现步骤摘要】
一种摄像头场景图像的成分智能分析方法
本专利技术涉及图像处理领域,具体是一种图像成分的智能分析方法。
技术介绍
图像的成分一般是指兴趣成分,是总大小比原图像大幅缩减但在内容搜索、相似性比对等应用中可等价替换原图像的一种数据组合。鉴于越来越多的行业需要对亿级规模的图片库进行多种类型的大数据分析(比如内容相似性比对以及兴趣内容搜索等),传统的查找方法无论在精度、速度抑或存储开销上都越来越无法满足需求。此外,在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在多数情况下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性,同时对分析带来不便。如果分别对每个指标进行分析,分析往往是孤立的,而不是综合的。盲目减少指标会损失很多信息,容易产生错误的结论。因此需要找到一个合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的。由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息。PCA(PrincipalComponentAnalysis,PCA)主成分分析就属于这类降维的方法。PCA主成分分析,是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。但是现有的PCA主成分分析风发具有如下缺点:1、过程耗时极长,对50000个10000维数组进行PCA过程需耗时20分钟;2、数据主要成分损失和存储空间无法达到好的平衡,压缩程度越高,损失的越多。
技术实现思路
因此,针对上述的问题,本专利技术提出一种摄像头场景图像的成分智能分析方法,能使原始数据集大小大幅缩减,同时能最大限度保持原数据的重要特性使新数据在进行搜索、比对等操作时能保持与原数据不变,并大幅降低分析时间,同时降低存储空间占用和数据损失。为此,本专利技术所采用的技术方案是,一种摄像头场景图像的成分智能分析方法,包括:过程1、将图像数据输入AlexNet深度神经网络模型进行特征解离得到预设维度特征;具体的,AlexNet深度神经网络模型包括依次设置的五个卷积层和三个全连接层,分别记为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第一全连接层、第二全连接层和第三全连接层,预设维度特征是在第一全连接层(AlexNet深度神经网络模型的第六层)得到的预设维度特征,其中,预设维度特征优选选择4096维特征,相对于其他维数,4096维在反向特征消除的精准度平均可达99.2%,为并在提取精度与后续大数据比对操作的平衡最好,也是本专利技术采用AlexNet的原因之一。第二全连接层优选输出256维特征。假设一共有N张图片,则过程1生成4096*N的矩阵,也即最原始的高维向量矩阵;本申请还特别针对摄像头场景的图像,对AlexNet深度神经网络模型进行改进,使其与现有的模型结构不同。具体的,上述AlexNet深度神经网络模型中,第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层的卷积核(滤波器)均从原版的5x5下调至3x3。优选的,第一卷积层和第五卷积层中,在3x3卷积核的前面分别增设一个1x1卷积核。第二卷积层、第三卷积层和第四卷积层中,在3x3卷积核的前后都各增设一个1x1卷积核。以一输入的特征图(featuremap)是28×28×192为例,令3x3卷积通道为N2,5x5卷积通道为N3,如果以第二卷积层、第三卷积层和第四卷积层均为5x5卷积核来计算,那么卷积核参数为5×5×192×N3+5×5×192×N3+5×5×192×N3,以第二卷积层、第三卷积层和第四卷积层均为3x3卷积核来计算,那么卷积核参数为3×3×192×N2+3×3×192×N2+3×3×192×N2,而本申请对3×3卷积核前后都加上了1x1卷积核(将加在3×3卷积核前、后的1x1卷积核分别记为第一1x1卷积核和第二1x1卷积核),第一1x1卷积核的通道数记为N4,第二1x1卷积核的通道数记为N5,那么卷积核参数就变成了(1×1×192×N4+3×3×N4×N2+1×1×N2×N5)+(1×1×192×N4+3×3×N4×N2+1×1×N2×N5)+(1×1×192×N4+3×3×N4×N2+1×1×N2×N5),实际设计中,上述卷积核的通道数由实际需要来设定,例如,设置3x3卷积通道N2=128,5x5卷积通道N3=32,第一1x1卷积核通道N4=96,第二1x1卷积核通道N5=16,那么可知,由上述方案,使得卷积层的输入和输出的通道数都减小,卷积核参数也大大减小了。本申请通过上述对不同卷积层的不同设计方案,不仅进行了降维,还进行了升维,使得卷积层的输入和输出的通道数都减小,参数数量进一步减少。针对普遍兴趣目标较小的视频图像更能捕捉目标特征细节同时降低运算开销(为原卷积核的36%),同时第二全连接层从第一全连接层的4096维的输出降至256维,使特征提取速度后续步骤运算速度、以及存储空间利用率提升16倍而平均精度仅下降5.7%,从而大大降低了分析时间以及存储空间占用和数据损失情况的发生。过程2、接收过程1输出的预设维度特征,进行反向特征消除;在该方法中,所有分类算法先用n个特征进行训练。每次降维操作,采用n-1个特征对分类器训练n次,得到新的n个分类器。将新分类器中错分率变化最小的分类器所用的n-1维特征作为降维后的特征集。不断的对该过程进行迭代,即可得到降维后的结果。第k次迭代过程中得到的是n-k维特征分类器。通过选择最大的错误容忍率(优选错误容忍率取10%),可以得到在选择分类器上达到指定分类性能最小需要多少个特征。过程3、接收过程2的输出数据,对其进行矩阵的高相关滤波;高相关滤波认为当两列数据变化趋势相似时,它们包含的信息也显示。这样,使用相似列中的一列就可以满足机器学习模型。对于数值列之间的相似性通过计算相关系数来表示,对于名词类列的相关系数可以通过计算皮尔逊卡方值来表示。相关系数大于某个阈值的两列只保留一列。本申请的方案尤其适合摄像头下场景,因其具有高度角度以及画面的同一性较强,从分类的角度上看:类内距离小、类间距离大,所以可以对步骤1进行调整而不至于漏抓或误抓。而在2、3步骤中由于较大的类间差距可保证目标特征损失在较低水平。其中,过程2与过程3扮演至关重要的角色,既将图像中的重复与无价值信息剔除以节省空间、又将主要内容成分最大限度保留,保持相对于原始图片的功能等价性。其中,过程2与过程3与PCA降维的区别主要在于:PCA适用于全种类的图像向量降维、甚至可用于其他类型数据的向量降维。而本方法中只针对道路监控摄像头本文档来自技高网
...
一种摄像头场景图像的成分智能分析方法

【技术保护点】
1.一种摄像头场景图像的成分智能分析方法,包括:过程1、将图像数据输入AlexNet深度神经网络模型进行特征解离得到预设维度特征;具体的,AlexNet深度神经网络模型包括依次设置的五个卷积层和三个全连接层,分别记为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第一全连接层、第二全连接层和第三全连接层,预设维度特征是在第一全连接层得到的预设维度特征;过程2、接收过程1输出的预设维度特征,进行反向特征消除;过程3、接收过程2的输出数据,对其进行矩阵的高相关滤波;过程4、接收上一步数据,利用随机投影森林,对所有的数据进行划分,将每次搜索与计算的点的数目减小到一个可接受的范围,然后建立多个随机投影树构成随机投影森林,将森林的综合结果作为最终的结果。

【技术特征摘要】
1.一种摄像头场景图像的成分智能分析方法,包括:过程1、将图像数据输入AlexNet深度神经网络模型进行特征解离得到预设维度特征;具体的,AlexNet深度神经网络模型包括依次设置的五个卷积层和三个全连接层,分别记为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第一全连接层、第二全连接层和第三全连接层,预设维度特征是在第一全连接层得到的预设维度特征;过程2、接收过程1输出的预设维度特征,进行反向特征消除;过程3、接收过程2的输出数据,对其进行矩阵的高相关滤波;过程4、接收上一步数据,利用随机投影森林,对所有的数据进行划分,将每次搜索与计算的点的数目减小到一个可接受的范围,然后建立多个随机投影树构成随机投影森林,将森林的综合结果作为最终的结果。2.根据权利要求1所述的摄像头场景图像的成分智能分析方法,其特征在于:所述AlexNet深度神经网络模型中,第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层均为3x3卷积核。3.根据权利要求2所述的摄像头场景图像的成分智能分析方法,其特征在于:第一卷积层和第五卷积层中,在3x3卷积核的前面分别增设一个1x1卷积核。4.根据权利要求3所述的摄像头场景图像的成分智能分析方法,其特征在于:第二卷积层、第三卷积层和第四卷积层中,在3x3卷积核的前后都各增设一个1x1卷积核。5.根据权利要求1-4任一所述的摄像头场景图像的成分智能分析方法,其特征在于:预设维度特征是在全连接层第六层得到的4096维特征。6.根据权利要求6所述的摄像头场景图像的成分智能分析方法,其特征在于:第二全连接层输出256维特征。7.根据权利要求1-4任一所述的摄像头场景图像的成分智能分析方法,其特征在于:过程2的反向特征消除中,所有分类算法先用n个特征进行训练;每次降维操作,采用n-1个特征对分类器训练n次,得到新的n个分类器;将新分类器中错分率变化最小的分类器所用的n-1维特征作为降维后的特征集;不断的对该过程进行迭代,即可得到降维后的结果;第k次迭代过程中得到的是n-k维特征分类器;通过选择最大的错误容忍率,即得到在选择分类器上达到指定分类性能最小需要多少个特征;具体包括如下步骤:输入:训练样本集{(xi,vi)}Ni=...

【专利技术属性】
技术研发人员:闫潇宁
申请(专利权)人:深圳市安软慧视科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1