一种熟悉场景下熟悉目标的优化识别方法技术

技术编号:34384946 阅读:10 留言:0更新日期:2022-08-03 21:06
本发明专利技术公开了一种熟悉场景下熟悉目标的优化识别方法,包括:一:采集熟悉目标图像并构建熟悉目标库;二:对熟悉目标库中所有的熟悉目标图像分别进行显著性区域检测,判断检测出的目标是否为熟悉目标,若是,则输出识别成功的结果;若否,则先根据未识别成功的熟悉目标图像建立智能优化的时空序列融合模型,再基于智能优化后的时空序列融合模型对未识别成功的熟悉目标图像进行识别并输出识别结果。该方法采用了基于显著性像素簇的不规则目标检测技术与基于全特征融合的目标预判建模及启发式优化技术,基于这两种技术的结合,最终实现了熟悉场景下熟悉目标的快速检测和高效识别。了熟悉场景下熟悉目标的快速检测和高效识别。了熟悉场景下熟悉目标的快速检测和高效识别。

【技术实现步骤摘要】
一种熟悉场景下熟悉目标的优化识别方法


[0001]本专利技术属于目标识别
,具体涉及一种熟悉场景下熟悉目标的优化识别方法。

技术介绍

[0002]伴随着多媒体和通信技术迅速发展,图像数据呈现出空前的爆炸式增长,这使得如何高效提取图片信息并从中获取显著物体区域成为当下的一个研究热点。受到人类自有的注意力机制启发,图像显著性检测往往通过引入注意力机制来识别图像的显著性区域。重点关注显著性区域可以有效降低识别任务中后续的计算量,提高速度,并进一步提高后续识别的准确率。目前显著性检测算法主要包含有三个大类,包括基于非学习模型的显著性检测、基于传统机器学习模型的显著性检测和基于深度学习模型的显著性检测。然而,前述已有的显著性检测算法大都集中在规则区域,研究不够完善,难以对复杂结构目标物体进行显著性区域检测。同时,在显著性区域检测中没有引入先验信息,导致对象边界模糊、检测准确度不足。此外,由于环境的影响,例如检测距离过远、光照强度的不同、检测物体与设备之间存在遮挡等,导致图像分辨率过低,从而无法在检测精度上满足现有需求。
[0003]限于以上原因,现有的熟悉目标识别技术不能快速、有效、安全地在熟悉场景下完成对目标的识别。所以,迫切需要一种高效、精确的熟悉场景下熟悉目标的检测与识别的方法。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中存在的上述技术问题,提供了一种熟悉场景下熟悉目标的优化识别方法,该方法采用了基于显著性像素簇的不规则目标检测技术与基于全特征融合的目标预判建模及启发式优化技术,基于这两种技术的结合,针对熟悉场景下的熟悉目标,先通过构建研究基于不规则显著像素簇的先验检测技术提升熟悉目标的检测速度,然后通过基于全特征融合的远距离目标预判建模及其优化技术,利用启发式学习思维,赋予模型自学习和自适应能力,使模型随着时间推移,不断提升识别效率,最终实现熟悉目标的快速检测和高效识别。
[0005]为实现上述目的,本专利技术采用的技术方案如下:
[0006]一种熟悉场景下熟悉目标的优化识别方法,其特征在于包括如下步骤:
[0007]步骤一:采集熟悉场景下的熟悉目标图像并构建熟悉目标库,并针对熟悉目标库引入注意力机制;
[0008]步骤二:对熟悉目标库中所有的熟悉目标图像分别进行显著性区域检测,判断检测出的目标是否为熟悉目标,若是,则输出识别成功的结果;若否,则先根据未识别成功的熟悉目标图像建立智能优化的时空序列融合模型,再基于智能优化后的时空序列融合模型对未识别成功的熟悉目标图像进行识别并输出识别结果;其中,
[0009]所述的智能优化的时空序列融合模型的建立方法如下:
[0010]步骤A:根据未识别成功的熟悉目标图像分别确定出对应熟悉目标图像的不规则显著像素簇;
[0011]步骤B:根据不规则显著像素簇对熟悉目标图像进行去噪增强处理,处理完成后得到去噪增强熟悉目标图像;
[0012]步骤C:在去噪增强熟悉目标图像中引入品质函数,将去噪增强熟悉目标图像转换成空间序列并建立识别模型;
[0013]步骤D:采用广义高阶循环网络,将时序信息与空序信息融合至识别模型,并在保留时序信息的情况下,将熟悉目标库中熟悉目标图像的图像帧融合至识别模型中,融合完成后得到时空序列融合模型;
[0014]步骤E:对时空序列融合模型进行智能优化,得到智能优化的时空序列融合模型。
[0015]步骤一中的注意力机制为优化的Attention算法。
[0016]步骤二中采用ConvLSTM算法的前向传播与注意力机制相结合的方式进行显著性区域检测,并综合判断检测出的目标是否为熟悉目标;其中,ConvLSTM算法的前向传播公式如下:
[0017][0018][0019][0020]式中,f
t
、i
t
、o
t
均是三维张量参数,第一维度代表时间信息,第二维度和第三维度代表空间信息,分别表示LSTM在时刻t的遗忘门、输入门和输出门;W
xf
、W
xi
、W
xo
分别表示遗忘门、输入门和输出门的权重矩阵,b
f
、b
i
、b
o
分别表示遗忘门、输入门和输出门的偏置项;σ表示sigmoid函数或者其他非线性激活函数,*表示卷积神经网络中的卷积操作,表示Hadamard乘积。
[0021]步骤B的实现方法为:
[0022]S11:将所有熟悉目标图像的不规则显著像素簇以像素点为单位转换成序列数据,转换完成后得到多组序列数据;
[0023]S12:采用基于Transformer的深度学习网络结构分别对序列数据进行处理,得到多组处理数据;
[0024]S13:采用BM3D算法对多组处理数据进行处理,将空域去噪和变换域去噪相结合,得到低噪熟悉目标图像;
[0025]S14:根据NL

Means算法在低噪熟悉目标图像中通过相似图像块之间的距离搜索相似图像块,使用相似图像块的块邻域实现维纳滤波,滤波完成后,再经加权聚合和比对即得到去噪增强熟悉目标图像。
[0026]步骤S14中,去噪增强熟悉目标图像的得出方法为:
[0027]Step1:计算相似图像块之间的距离,计算公式如下:
[0028][0029]式中,Z
x
为低噪熟悉目标图像中的参考图像块,Z
xR
为低噪熟悉目标图像中的待匹
配区域图像块,表示对所有的参考图像块和待匹配区域图像块进行2D变换,Υ

表示对所有低噪熟悉目标图像的数值进行硬阈值操作,d(ZxR,Zx)为相似图像块的距离;
[0030][0031][0032]Step2:将相似图像块之间的距离进行分组,分组后通过设置阈值进行协同滤波,协同滤波后再通过逆变换恢复所有低噪熟悉目标图像的数值到空域,得到空域下相似图像块的距离,其中,空域下相似图像块的距离的计算方法为:
[0033][0034]式中,表示对所有的参考图像块和待匹配区域图像块进行3D逆变换,表示低噪熟悉目标图像中匹配后的区域图像块,Y表示协同滤波,表示空域下相似图像块的距离;
[0035]Step3:对空域下相似图像块的距离进行加权聚合操作,得到最终恢复的相似图像块的块邻域,块邻域的计算方法为:
[0036][0037]式中,表示块邻域;
[0038]Step4:先对所有的低噪熟悉目标图像进行维纳滤波,得到去噪熟悉目标图像,再对所有的去噪熟悉目标图像进行加权聚合,并使用权重公式对所有的去噪熟悉目标图像设置权重,然后将设置了权重的去噪熟悉目标图像与块邻域进行比对,比对结果满足阈值条件的去噪熟悉目标图像则为去噪增强熟悉目标图像;其中,所述的权重公式为:
[0039][0040]式中,表示维纳滤波系数,表示经过维纳滤波后的去噪增强熟悉目标图像权重值,σ表示权重设置系数。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种熟悉场景下熟悉目标的优化识别方法,其特征在于包括如下步骤:步骤一:采集熟悉场景下的熟悉目标图像并构建熟悉目标库,并针对熟悉目标库引入注意力机制;步骤二:对熟悉目标库中所有的熟悉目标图像分别进行显著性区域检测,判断检测出的目标是否为熟悉目标,若是,则输出识别成功的结果;若否,则先根据未识别成功的熟悉目标图像建立智能优化的时空序列融合模型,再基于智能优化后的时空序列融合模型对未识别成功的熟悉目标图像进行识别并输出识别结果;其中,所述的智能优化的时空序列融合模型的建立方法如下:步骤A:根据未识别成功的熟悉目标图像分别确定出对应熟悉目标图像的不规则显著像素簇;步骤B:根据不规则显著像素簇对熟悉目标图像进行去噪增强处理,处理完成后得到去噪增强熟悉目标图像;步骤C:在去噪增强熟悉目标图像中引入品质函数,将去噪增强熟悉目标图像转换成空间序列并建立识别模型;步骤D:采用广义高阶循环网络,将时序信息与空序信息融合至识别模型,并在保留时序信息的情况下,将熟悉目标库中熟悉目标图像的图像帧融合至识别模型中,融合完成后得到时空序列融合模型;步骤E:对时空序列融合模型进行智能优化,得到智能优化的时空序列融合模型。2.根据权利要求1所述的一种熟悉场景下熟悉目标的优化识别方法,其特征在于:步骤一中的注意力机制为优化的Attention算法。3.根据权利要求1所述的一种熟悉场景下熟悉目标的优化识别方法,其特征在于:步骤二中采用ConvLSTM算法的前向传播与注意力机制相结合的方式进行显著性区域检测,并综合判断检测出的目标是否为熟悉目标;其中,ConvLSTM算法的前向传播公式如下:是否为熟悉目标;其中,ConvLSTM算法的前向传播公式如下:是否为熟悉目标;其中,ConvLSTM算法的前向传播公式如下:式中,f
t
、i
t
、o
t
均是三维张量参数,第一维度代表时间信息,第二维度和第三维度代表空间信息,分别表示LSTM在时刻t的遗忘门、输入门和输出门;W
xf
、W
xi
、W
xo
分别表示遗忘门、输入门和输出门的权重矩阵,b
f
、b
i
、b
o
分别表示遗忘门、输入门和输出门的偏置项;σ表示sigmoid函数或者其他非线性激活函数,*表示卷积神经网络中的卷积操作,表示Hadamard乘积。4.根据权利要求1

3中任一项所述的一种熟悉场景下熟悉目标的优化识别方法,其特征在于:步骤B的实现方法为:S11:将所有熟悉目标图像的不规则显著像素簇以像素点为单位转换成序列数据,转换完成后得到多组序列数据;S12:采用基于Transformer的深度学习网络结构分别对序列数据进行处理,得到多组处理数据;S13:采用BM3D算法对多组处理数据进行处理,将空域去噪和变换域去噪相结合,得到

【专利技术属性】
技术研发人员:李超殷光强米尔卡米力江
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1