当前位置: 首页 > 专利查询>邓毅华专利>正文

一种基于图像特征编码的目标检测方法技术

技术编号:26651197 阅读:47 留言:0更新日期:2020-12-09 00:52
一种基于图像特征编码的目标检测方法,包括以下步骤:(1)训练变分自编码器;(2)获得检测目标的特征编码;(3)切割待分析图像,计算各分割图块的特征编码;(4)计算目标图像特征编码与分割图块特征编码的距离;(5)判别切割图块是否包含目标,由此完成图像目标检测。本发明专利技术对检测目标仅需要少量图像样本,而且对新增目标检测类别,无需重新训练检测模型。

【技术实现步骤摘要】
一种基于图像特征编码的目标检测方法
本专利技术涉及一种基于图像特征编码的目标检测方法。
技术介绍
本专利技术的一种基于图像特征编码的目标检测方法主要是面向目标图像样本数量少或极少的图像目标检测领域。本专利技术所述目标检测是指计算机图像处理的一个领域,目标检测技术大致可以分为两类:第一类是利用人工设计提取图像特征技术,一方面提取目标特征,另一方面提取待分析图像特征,两者进行比对,从而完成目标对象在分析图像中定位和类别判定;第二类是利用深度神经网络自动提取图像的特征,输入待分析图像,上述神经网络能够直接给出目标位置信息和类别信息。这两种方法各有优缺点,上述第一类方法,不需要样本学习,没有繁琐的样本标注过程,但鲁棒性不够,图像一经变化,目标检测错误率就会急剧增加;上述第二类方法则需要大量的学习样本,但对图像变化的适应度远远超过上述第一类方法。在本专利技术所面对的场合下,只有少数目标样本,而待分析图像变化大,则上述两种方法均不合适。为解决上述问题,本专利技术提出一种通过变分自编码技术提取目标特征编码的方法,结合计算图像特征编码间距离的方法,既可解决了目标样本数量少的问题,又实现了目标检测。
技术实现思路
本专利技术所解决问题在于提供一种基于图像特征编码的目标检测方法,以解决上述
技术介绍
中的缺点。一种基于图像特征编码的目标检测方法,包括以下步骤:为详细介绍本
技术实现思路
,下面对一些概念进行阐述或定义:定义一:变分自编码器(VariationalAuto-Encoder),是深度学习神经网络的一个分支,由三部分构成:第一部分为由深度神经网络构成的编码器;第二部分为随机分布的隐变量,一般该随机分布为多维正态随机分布,各维相互独立;第三部分为深度神经网络构成的解码器;一种基于图像特征编码的目标检测方法包括如下步骤:步骤一:训练变分自编码器(上述定义一),即说明书附图1模块1,变分自编码器训练时采用的损失函数是:其中,N是小批次(mini-batch)样本的数量;Dz是隐变量正态分布的为数;和是第i样本对应的隐变量第j维的期望和方差;xi是小批次样本的第i个样本;N是隐随机变量的抽样次数;zl是隐随机变量的第l个抽样;p(xi|zl)是给定zl条件下xi的条件分布,通过上述损失函数,对变分自编码器进行训练,直至收敛;步骤二:获得检测目标的特征编码,即说明书附图1模块2,将图像输入步骤一训练好的变分自编码器,在变分自编码器的第一个部分,即深度神经网络构成的编码器的输出是一个实数序列,该序列构成了目标的特征编码,其特征编码矢量是:C=[μ1σ1μ2σ2…μnσn]T其中,μi和σi分别表示隐变量的第i维的正态分布的期望和均方差;步骤三:切割待分析图像,计算各分割后图块的特征编码,即说明书附图1模块3,将图像均匀分割成若干个图块,图块尺寸大小根据实际图像大小决定,将分割后图块处理成变分自编码器输入图像尺寸要求,逐一输入编码器,由此得到各图块的特征编码矢量;步骤四:计算目标图像特征编码与分割图块特征编码的距离,即说明书附图1模块4,所述编码距离是两个特征编码矢量的距离,可采用欧拉距离定义两个编码矢量的距离,如下:其中C1和C2分别对应两个特征编码矢量,用步骤二得到的目标特征编码与步骤三所得的各切割图块特征编码代入上述距离公式,计算特征编码间距离;步骤五:根据步骤4计算的距离,判别步骤三的切割图块是否包含目标,即说明书附图1模块5,通过将步骤四得到的各特征编码矢量距离分别与门限距离做比较,小于门限的,表示所述分割图块包含目标,大于门限的,表示该切割图块不包含目标,由此,包含目标的图块原来在待分析图像中的位置就是目标位置;完成上述五个步骤即可实现目标在待分析图像中的检测。有益效果:本专利技术对新检测目标仅需要少量图像样本,在增加新目标检测类别时,无需重新训练变分自编码器。附图说明:图1为本专利技术的处理流程具体实施方式:为了使本专利技术的技术手段、创作特征、工作流程、使用方法达到目的,以及功效易于明白了解,下面结合具体实施例,进一步阐述本专利技术。定义一:变分自编码器(VariationalAuto-Encoder),是深度学习神经网络的一个分支,由三部分构成:第一部分为由深度神经网络构成的编码器;第二部分为随机分布的隐变量,一般该随机分布为多维正态随机分布,各维相互独立;第三部分为深度神经网络构成的解码器;一种基于图像特征编码的目标检测方法,包括以下步骤:步骤一:训练变分自编码器(上述定义一),即说明书附图1模块1,变分自编码器的编码器部分可以通过常见的深度神经网络来构建,比如ResNet模型,本专利技术所述变分自编码器的编码器部分的输出可以选择为40维,但不限定;变分自编码器的解码器可以由反卷积深度神经网络组成;变分自编码器训练时采用的损失函数是:其中,N是小批次(mini-batch)样本的数量;Dz是隐变量正态分布的维数;和是第i样本对应的隐变量第j维的期望和方差;xi是小批次样本的第i个样本;N是隐随机变量的抽样次数,在本专利技术中N可取12,但不限定;zl是隐随机变量的第1个抽样;p(xi|zl)是给定zl条件下xi的条件分布,通过上述损失函数,对变分自编码器进行训练,直至收敛;步骤二:获得检测目标的特征编码,即说明书附图1模块2,将图像输入步骤一训练好的变分自编码器,在变分自编码器的第一个部分,即深度神经网络构成的编码器的输出是一个实数序列,该序列构成了目标的特征编码,其特征编码矢量是:C=[μ1σ1μ2σ2…μnσn]T本专利技术所述特征编码矢量可取20组(μi,σi)作为特征矢量,即特征矢量的长度这时为40,但不限定;步骤三:切割待分析图像,计算各切割后图块的特征编码,即说明书附图1模块3,本专利技术可将图像横切成n块,竖切成n块,n的大小根据实际图像大小决定,这样待分析图像就被切割成n*n个图块,将分割后图块处理成变分自编码器输入图像尺寸要求,本专利技术输入图块要求的大小可选择200*200像素,但不限定,经尺寸变换后的图块逐一输入编码器,由此得到各图块的特征编码矢量;步骤四:计算目标图像特征编码与分割图块特征编码的距离,即说明书附图1模块4,所述编码距离是两个特征编码矢量的距离,可采用欧拉距离定义两个编码矢量的距离,如下:其中C1和C2分别对应两个特征编码矢量,用步骤二得到的目标特征编码与步骤三所得的各切割图块特征编码代入上述距离公式,计算特征编码间距离;步骤五:根据步骤4计算的距离,判别步骤三的切割图块是否包含目标,即说明书附图1模块5,通过将步骤四得到的各特征编码矢量距离分别与门限距离做比较,小于门限的,表示所述分割图块包含目标,大于门限的,表示该切割图块不包含目标,由此,包含目标的图块在待分析图像中的位置为目标位置。本文档来自技高网...

【技术保护点】
1.一种基于图像特征编码的目标检测方法,其特征在于,包括以下步骤:/n(1)训练变分自编码器,训练时采用的损失函数是:/n

【技术特征摘要】
1.一种基于图像特征编码的目标检测方法,其特征在于,包括以下步骤:
(1)训练变分自编码器,训练时采用的损失函数是:



其中,L表示隐变量的抽样次数,为适应目标图像样本数较少,它应该大于1,对变分自编码器进行训练,直至收敛;
(2)获得检测目标的特征编码,将目标图像输入训练好的变分自编码器,在编码器的输出端得到一个实数序列,该序列构成了目标的特征编码,其特征编码矢量是:
C=[μ1σ1μ2σ2…μnσn]T;
(3)切割待分析图像,计算各分割后图块的...

【专利技术属性】
技术研发人员:邓毅华李少辉
申请(专利权)人:邓毅华李少辉
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1