一种图像检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：33921870 阅读：24 留言：0更新日期：2022-06-25 21:09

本发明专利技术公开了一种图像检测方法、装置、电子设备及存储介质，可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景，该方法包括：根据待处理图像对应的图像块序列确定第一向量序列；基于多个注意力编码层依次对第一向量序列进行注意力编码得到第一特征图；基于分类嵌入向量对应的目标注意力特征得到第一注意力分布图；对第一注意力分布图取反后与第一特征图融合得到第二特征图；根据所述第一特征图、所述第一注意力分布图和所述第二特征图进行目标对象检测，得到所述待处理图像中目标对象的类别信息和位置信息。本发明专利技术提高了检测结果中位置信息的准确性。中位置信息的准确性。中位置信息的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像检测方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机
，特别涉及一种图像检测方法、装置、电子设备及存储介质。

技术介绍

[0002]目标检测能够给出图像中的感兴趣目标所在的位置信息和类别信息，是后续计算机视觉任务的前置基础性任务。
[0003]相关技术中，通常基于卷积神经网络CNN(Convolutional Neural Networks)的方法对图像进行目标检测，即先使用卷积神经网络提取图像的深层次语义特征图，对该深层次语义特征图进行全局池化后通过全连接层整合具有类别区分性的局部信息并给到分类层进行分类，并结合分类结果确定定位框得到位置信息。由于卷积神经网络仅提取局部特征，从而使得相关技术仅关注目标的最具判别力的特征，导致目标检测的定位精度差，检测结果中的位置信息不够准确。

技术实现思路

[0004]为了解决现有技术的问题，本专利技术实施例提供了一种图像检测方法、装置、电子设备及存储介质。所述技术方案如下：
[0005]一方面，提供了一种图像检测方法，所述方法包括：
[0006]根据待处理图像对应的图像块序列，确定第一向量序列；所述第一向量序列包括分类嵌入向量和所述图像块序列中各图像块对应的图像块向量；
[0007]基于多个注意力编码层依次对所述第一向量序列进行注意力编码，得到第一特征图；
[0008]确定每个所述注意力编码层对应的注意力矩阵，提取每个所述注意力矩阵中对应所述分类嵌入向量的目标注意力特征，对各所述目标注意力特征进...

【技术保护点】

【技术特征摘要】
1.一种图像检测方法，其特征在于，所述方法包括：根据待处理图像对应的图像块序列，确定第一向量序列；所述第一向量序列包括分类嵌入向量和所述图像块序列中各图像块对应的图像块向量；基于多个注意力编码层依次对所述第一向量序列进行注意力编码，得到第一特征图；确定每个所述注意力编码层对应的注意力矩阵，提取每个所述注意力矩阵中对应所述分类嵌入向量的目标注意力特征，对各所述目标注意力特征进行融合处理，得到第一注意力分布图；对所述第一注意力分布图进行取反处理，得到反向注意力分布图，将所述反向注意力分布图与所述第一特征图进行融合处理得到第二特征图；根据所述第一特征图、所述第一注意力分布图和所述第二特征图进行目标对象检测，得到所述待处理图像中目标对象的类别信息和位置信息。2.根据权利要求1所述的图像检测方法，其特征在于，所述根据所述第一特征图、所述第一注意力分布图和所述第二特征图进行目标对象检测，得到所述待处理图像中所述目标对象的类别信息和位置信息，包括：根据所述第二特征图和所述第一特征图，确定所述待处理图像中目标对象的类别信息并生成第二注意力分布图；对所述第一注意力分布图与第二注意力分布图进行逐像素相乘得到目标注意力分布图；根据所述目标注意力分布图确定所述待处理图像中所述目标对象的位置信息。3.根据权利要求2所述的图像检测方法，其特征在于，所述根据所述第二特征图和所述第一特征图，确定所述待处理图像中目标对象的类别信息并生成第二注意力分布图包括：根据所述第二特征图进行分类，得到第一分类结果；所述第一分类结果包括多个预设类别中各预设类别对应的概率值；根据所述第一分类结果对多个初始化卷积核进行加权求和，得到目标卷积核；根据所述目标卷积核对所述第一特征图进行特征提取，得到第三特征图；根据所述第三特征图，确定所述待处理图像中目标对象的类别信息并生成第二注意力分布图。4.根据权利要求3所述的图像检测方法，其特征在于，所述根据所述第二特征图进行分类，得到第一分类结果包括：对所述第二特征图进行降维处理，得到降维特征图；对所述降维特征图分别进行全局最大池化和全局平均池化，得到第一池化特征和第二池化特征；融合所述第一池化特征和所述第二池化特征，得到融合池化特征；对所述融合池化特征进行分类，得到第一分类结果。5.根据权利要求3所述的图像检测方法，其特征在于，所述根据所述第三特征图，确定所述待处理图像中目标对象的类别信息并生成第二注意力分布图，包括：对所述第三特征图进行全局平均池化，得到第三池化特征；基于所述第三池化特征进行分类，得到第二分类结果；所述第二分类结果表征待处理图像中目标对象的类别信息；
基于所述第三池化特征和所述第三特征图，生成第二注意力分布图。6.根据权利要求1所述的图像检测方法，其特征在于，所述将所述反向注意力分布图与所述第一特征图进行融合处理得到第二特征图，包括：将所述反向注意力分布图与所述第一特征图相乘，得到第二特征图。7.根据权利要求1所述的图像检测方法，其特征在于，所述确定每个所述注意力编码层对应的注意力矩阵，提取每个所述注意力矩阵中对应所述分类嵌入向量的目标注意力特征，对各所述目标注意力特征进行融合处理，得到第一注意力分布图，包括：针对每个所述注意力编码层，确定各自注意力机制模块的注意力矩阵的平均，得到所述注意力...

【专利技术属性】
技术研发人员：王昌安，王亚彪，
申请(专利权)人：腾讯科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人