一种图像识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：28121233 阅读：18 留言：0更新日期：2021-04-19 11:28

本公开关于一种图像识别方法、装置、电子设备及存储介质，该方法包括：获取预先训练好的图像识别模型，所述图像识别模型包括卷积层、特征整合层和全连接层；获取待识别图像，确定与所述待识别图像对应的像素值数组；通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图；通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列；将所述具有交互关系的特征序列输入到所述图像识别模型的全连接层，通过所述全连接层对所述具有交互关系的特征序列进行处理，基于处理结果确定所述待识别图像的目标类别。本公开能够提高图像识别的准确率和精度。识别的准确率和精度。识别的准确率和精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像识别方法、装置、电子设备及存储介质

[0001]本公开涉及图像处理
，尤其涉及一种图像识别方法、装置、电子设备及存储介质。

技术介绍

[0002]图像识别是指对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是人工智能的一个重要领域。图像识别技术是以图像的主要特征为基础的，每个图像都有其自身的特征，由此可见对待识别图像的特征提取是图像识别过程中的一个重要步骤。
[0003]相关技术中，在采用深度学习网络模型进行图像识别时，可通过深度学习网络模型的各层对待识别图像进行识别，不断扩大每层节点在图像中的感受区域，然而每个节点能够感受到的图像区域依旧是有限的，从而使得每个节点只能从图像中获取有限的图像特征信息，进而导致基于每个节点获取的图像特征信息进行图像识别的识别结果不准确；因此需要提出一种能够提高图像识别准确率的方法。

技术实现思路

[0004]本公开提供一种图像识别方法、装置、电子设备及存储介质，以至少解决相关技术中存在的图像识别不准确的问题。本公开的技术方案如下：
[0005]根据本公开实施例的第一方面，提供一种图像识别方法，包括：
[0006]获取预先训练好的图像识别模型，所述图像识别模型包括卷积层、特征整合层和全连接层；
[0007]获取待识别图像，确定与所述待识别图像对应的像素值数组；
[0008]将所述像素值数组输入到所述图像识别模型的卷积层，通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图；/>[0009]将所述特征图输入到所述图像识别模型的特征整合层，通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列；
[0010]将所述具有交互关系的特征序列输入到所述图像识别模型的全连接层，通过所述全连接层对所述具有交互关系的特征序列进行处理，基于处理结果确定所述待识别图像的目标类别。
[0011]在一示例性实施例中，所述卷积层中包括第一数量的卷积核；
[0012]所述通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图包括：
[0013]采用每个卷积核分别与所述像素值数组进行卷积操作，得到层级深度为第一数量的特征图。
[0014]在一示例性实施例中，所述特征整合层包括词向量序列重构层以及注意力交互层；
[0015]所述通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列包括：
[0016]将所述特征图输入到所述词向量序列重构层，通过所述词向量序列重构层对所述特征图中的各特征点进行处理，生成具有空间位置信息的词向量序列；
[0017]将所述具有空间位置信息的词向量序列输入到所述注意力交互层，生成所述具有交互关系的特征序列。
[0018]在一示例性实施例中，所述通过所述词向量序列重构层对所述特征图中的各特征点进行处理，生成具有空间位置信息的词向量序列包括：
[0019]生成所述特征图中各特征点的词向量；
[0020]确定所述特征图中各特征点之间的空间位置关系信息；
[0021]基于所述特征图中各特征点之间的空间位置关系信息对各特征点的词向量进行拼接，生成所述具有空间位置信息的词向量序列。
[0022]在一示例性实施例中，所述生成所述特征图中各特征点的词向量包括：
[0023]遍历所述特征图中的各特征点；
[0024]对于每个特征点，获取每个特征点在各层级的特征值，得到与每个特征点对应的所述第一数量的特征值；
[0025]基于每个特征点对应的所述第一数量的特征值，生成与每个特征点对应的词向量。
[0026]在一示例性实施例中，所述确定所述特征图中各特征点之间的空间位置关系信息包括：
[0027]确定所述特征图的尺寸；
[0028]基于所述特征图的尺寸确定对所述特征图中各特征点的采样策略，所述采样策略中包括对多个待采样点的采样顺序以及所述多个采样点的空间位置信息；
[0029]以所述特征图的左上角的特征点为采样起点，基于所述多个采样点的采样顺序以及所述多个采样点的空间位置信息对所述特征图中的各特征点进行采样，得到特征点采样序列；
[0030]基于各特征点在所述特征点采样序列中的排序位置信息确定各特征点之间的空间位置关系信息。
[0031]在一示例性实施例中，所述方法还包括对所述图像识别模型进行训练的步骤，包括：
[0032]获取预设深度学习模型，所述预设深度学习模型包括卷积层、特征整合层和全连接层；
[0033]获取样本图像集合，所述样本图像集合中包括多个样本图像以及与每个样本图像对应的原始类别标签；
[0034]对于每个样本图像：
[0035]确定与所述样本图像对应的像素值数组；
[0036]将所述样本图像对应的像素值数组输入到所述预设深度学习模型的卷积层，通过所述卷积层对所述样本图像对应的像素值数组进行卷积处理得到与所述样本图像对应的特征图；
[0037]将所述样本图像对应的特征图输入到所述预设深度学习模型的特征整合层，通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列；
[0038]将所述具有交互关系的特征序列输入到所述预设深度学习模型的全连接层，通过所述全连接层对所述具有交互关系的特征序列进行处理，基于处理结果确定所述样本图像的预测类别；
[0039]基于所述样本图像的预测类别标签以及所述样本图像的原始类别标签，对所述预设深度学习模型的模型参数进行调整；
[0040]当基于所述样本图像集合中的多个样本图像以及相应的原始类别标签完成对所述预设深度学习模型的训练时，确定训练完成时的预设深度模型为所述图像识别模型。
[0041]根据本公开实施例的第二方面，提供一种图像识别装置，包括：
[0042]图像识别模型获取单元，被配置为执行获取预先训练好的图像识别模型，所述图像识别模型包括卷积层、特征整合层和全连接层；
[0043]待识别图像获取单元，被配置为执行获取待识别图像，确定与所述待识别图像对应的像素值数组；
[0044]第一特征图生成单元，被配置为执行将所述像素值数组输入到所述图像识别模型的卷积层，通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图；
[0045]第一特征序列生成单元，被配置为执行将所述特征图输入到所述图像识别模型的特征整合层，通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列；
[0046]目标类别识别单元，被配置为执行将所述具有交互关系的特征序列输入到所述图像识别模型的全连接层，通过所述全连接层对所述具有交互关系的特征序列进行处理，基于处理结果确定所述待识别图像的目标类别。
[0047]在一示例性实施例中，所述卷积层中包括第一数量的卷积核；
[本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：获取预先训练好的图像识别模型，所述图像识别模型包括卷积层、特征整合层和全连接层；获取待识别图像，确定与所述待识别图像对应的像素值数组；将所述像素值数组输入到所述图像识别模型的卷积层，通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图；将所述特征图输入到所述图像识别模型的特征整合层，通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列；将所述具有交互关系的特征序列输入到所述图像识别模型的全连接层，通过所述全连接层对所述具有交互关系的特征序列进行处理，基于处理结果确定所述待识别图像的目标类别。2.根据权利要求1所述的图像识别方法，其特征在于，所述卷积层中包括第一数量的卷积核；所述通过所述卷积层对所述像素值数组进行卷积处理得到与所述待识别图像对应的特征图包括：采用每个卷积核分别与所述像素值数组进行卷积操作，得到层级深度为第一数量的特征图。3.根据权利要求2所述的图像识别方法，其特征在于，所述特征整合层包括词向量序列重构层以及注意力交互层；所述通过所述特征整合层对所述特征图中的各特征点进行特征整合，生成具有交互关系的特征序列包括：将所述特征图输入到所述词向量序列重构层，通过所述词向量序列重构层对所述特征图中的各特征点进行处理，生成具有空间位置信息的词向量序列；将所述具有空间位置信息的词向量序列输入到所述注意力交互层，生成所述具有交互关系的特征序列。4.根据权利要求3所述的图像识别方法，其特征在于，所述通过所述词向量序列重构层对所述特征图中的各特征点进行处理，生成具有空间位置信息的词向量序列包括：生成所述特征图中各特征点的词向量；确定所述特征图中各特征点之间的空间位置关系信息；基于所述特征图中各特征点之间的空间位置关系信息对各特征点的词向量进行拼接，生成所述具有空间位置信息的词向量序列。5.根据权利要求4所述的图像识别方法，其特征在于，所述生成所述特征图中各特征点的词向量包括：遍历所述特征图中的各特征点；对于每个特征点，获取每个特征点在各层级的特征值，得到与每个特征点对应的所述第一数量的特征值；基于每个特征点对应的所述第一数量的特征值，生成与每个特征点对应的词向量。6.根据权利要求4所述的图像识别方法，其特征在于，所述确定所述特征图中各特征点之间的空间位置关系信息包括：
确定所述特征图的尺寸；基于所述特征图的尺寸确定对所述特征图中各特征点的采样策略，所述采样策略中包括对多个待采样点的采样顺序以及所述多个采样点的空间位置信息；以所述特征图的左上角的特征点为采样起点，基于所述多个采样点的采样顺序以及所述多个采样点的空间位置信息对所...

【专利技术属性】
技术研发人员：申世伟，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人