一种熟悉场景下熟悉目标的优化识别方法技术

技术编号：34384946 阅读：10 留言：0更新日期：2022-08-03 21:06

本发明专利技术公开了一种熟悉场景下熟悉目标的优化识别方法，包括：一：采集熟悉目标图像并构建熟悉目标库；二：对熟悉目标库中所有的熟悉目标图像分别进行显著性区域检测，判断检测出的目标是否为熟悉目标，若是，则输出识别成功的结果；若否，则先根据未识别成功的熟悉目标图像建立智能优化的时空序列融合模型，再基于智能优化后的时空序列融合模型对未识别成功的熟悉目标图像进行识别并输出识别结果。该方法采用了基于显著性像素簇的不规则目标检测技术与基于全特征融合的目标预判建模及启发式优化技术，基于这两种技术的结合，最终实现了熟悉场景下熟悉目标的快速检测和高效识别。了熟悉场景下熟悉目标的快速检测和高效识别。了熟悉场景下熟悉目标的快速检测和高效识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种熟悉场景下熟悉目标的优化识别方法

[0001]本专利技术属于目标识别
，具体涉及一种熟悉场景下熟悉目标的优化识别方法。

技术介绍

[0002]伴随着多媒体和通信技术迅速发展，图像数据呈现出空前的爆炸式增长，这使得如何高效提取图片信息并从中获取显著物体区域成为当下的一个研究热点。受到人类自有的注意力机制启发，图像显著性检测往往通过引入注意力机制来识别图像的显著性区域。重点关注显著性区域可以有效降低识别任务中后续的计算量，提高速度，并进一步提高后续识别的准确率。目前显著性检测算法主要包含有三个大类，包括基于非学习模型的显著性检测、基于传统机器学习模型的显著性检测和基于深度学习模型的显著性检测。然而，前述已有的显著性检测算法大都集中在规则区域，研究不够完善，难以对复杂结构目标物体进行显著性区域检测。同时，在显著性区域检测中没有引入先验信息，导致对象边界模糊、检测准确度不足。此外，由于环境的影响，例如检测距离过远、光照强度的不同、检测物体与设备之间存在遮挡等，导致图像分辨率过低，从而无法在检测精度上满足现有需求。
[0003]限于以上原因，现有的熟悉目标识别技术不能快速、有效、安全地在熟悉场景下完成对目标的识别。所以，迫切需要一种高效、精确的熟悉场景下熟悉目标的检测与识别的方法。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中存在的上述技术问题，提供了一种熟悉场景下熟悉目标的优化识别方法，该方法采用了基于显著性像素簇的不规则目标检测技术与基于全特征融合的目标预判建模及启发式优化...

【技术保护点】

【技术特征摘要】
1.一种熟悉场景下熟悉目标的优化识别方法，其特征在于包括如下步骤：步骤一：采集熟悉场景下的熟悉目标图像并构建熟悉目标库，并针对熟悉目标库引入注意力机制；步骤二：对熟悉目标库中所有的熟悉目标图像分别进行显著性区域检测，判断检测出的目标是否为熟悉目标，若是，则输出识别成功的结果；若否，则先根据未识别成功的熟悉目标图像建立智能优化的时空序列融合模型，再基于智能优化后的时空序列融合模型对未识别成功的熟悉目标图像进行识别并输出识别结果；其中，所述的智能优化的时空序列融合模型的建立方法如下：步骤A：根据未识别成功的熟悉目标图像分别确定出对应熟悉目标图像的不规则显著像素簇；步骤B：根据不规则显著像素簇对熟悉目标图像进行去噪增强处理，处理完成后得到去噪增强熟悉目标图像；步骤C：在去噪增强熟悉目标图像中引入品质函数，将去噪增强熟悉目标图像转换成空间序列并建立识别模型；步骤D：采用广义高阶循环网络，将时序信息与空序信息融合至识别模型，并在保留时序信息的情况下，将熟悉目标库中熟悉目标图像的图像帧融合至识别模型中，融合完成后得到时空序列融合模型；步骤E：对时空序列融合模型进行智能优化，得到智能优化的时空序列融合模型。2.根据权利要求1所述的一种熟悉场景下熟悉目标的优化识别方法，其特征在于：步骤一中的注意力机制为优化的Attention算法。3.根据权利要求1所述的一种熟悉场景下熟悉目标的优化识别方法，其特征在于：步骤二中采用ConvLSTM算法的前向传播与注意力机制相结合的方式进行显著性区域检测，并综合判断检测出的目标是否为熟悉目标；其中，ConvLSTM算法的前向传播公式如下：是否为熟悉目标；其中，ConvLSTM算法的前向传播公式如下：是否为熟悉目标；其中，ConvLSTM算法的前向传播公式如下：式中，f
t
、i
t
、o
t
均是三维张量参数，第一维度代表时间信息，第二维度和第三维度代表空间信息，分别表示LSTM在时刻t的遗忘门、输入门和输出门；W
xf
、W
xi
、W
xo
分别表示遗忘门、输入门和输出门的权重矩阵，b
f
、b
i
、b
o
分别表示遗忘门、输入门和输出门的偏置项；σ表示sigmoid函数或者其他非线性激活函数，*表示卷积神经网络中的卷积操作，表示Hadamard乘积。4.根据权利要求1
‑
3中任一项所述的一种熟悉场景下熟悉目标的优化识别方法，其特征在于：步骤B的实现方法为：S11：将所有熟悉目标图像的不规则显著像素簇以像素点为单位转换成序列数据，转换完成后得到多组序列数据；S12：采用基于Transformer的深度学习网络结构分别对序列数据进行处理，得到多组处理数据；S13：采用BM3D算法对多组处理数据进行处理，将空域去噪和变换域去噪相结合，得到

【专利技术属性】
技术研发人员：李超，殷光强，米尔卡米力江，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人