一种图像识别方法和装置制造方法及图纸

技术编号：29200762 阅读：21 留言：0更新日期：2021-07-10 00:34

本发明专利技术公开了图像识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：接收图像信息，输入至全卷积神经网络中，生成特征图；基于所述特征图，对每个类别标签的语义区域进行语义特定表示；利用基于标签共现的知识图谱对所述语义特征表示进行关联，进而将其用于预测标签的分布。该实施方式能够解决现有技术中学习到图像中语义区域之间的相互关联较为困难、不准确的问题。不准确的问题。不准确的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像识别方法和装置

[0001]本专利技术涉及计算机
，尤其涉及一种图像识别方法和装置。

技术介绍

[0002]多标签图像分类是一种基础但应用却很广泛的计算机视觉任务，因为在现实世界中，一张图像往往包含多个不同的语义对象，如一张风景图中可能有大海、别墅、游艇等语义对象。最近，它受到越来越多的关注，并在图像的内容检索和推荐系统中得到大量应用。多标签分类依然存在很多问题，如图像的视角变换，语义目标的规格大小不一，光照因子的影响和部分遮挡等问题。如何挖掘图像中多标签对应的语义特征区域并且利用这些语义特征区域之间的关联信息，是多标签图像分类尚未解决却具有挑战性的任务。
[0003]在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：
[0004]在现有技术中，虽然通过搜索语义感知区域和建模标签关联性已取得了进展，但是模型效果仍不理想。由于缺乏监督和指导，目前只能粗略地定位语义区域。而且，很难完全学习到语义区域之间的相互关联，也没有明确地模拟标签共现。

技术实现思路

[0005]有鉴于此，本专利技术实施例提供一种图像识别方法和装置，能够解决现有技术中学习到图像中语义区域之间的相互关联较为困难、不准确的问题。
[0006]为实现上述目的，根据本专利技术实施例的一个方面，提供了一种图像识别方法，包括接收图像信息，输入至全卷积神经网络中，生成特征图；基于所述特征图，对每个类别标签的语义区域进行语义特定表示；利用基于标签共现的知识图谱对所述语义特征表示进行关联，进而将其用...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：接收图像信息，输入至全卷积神经网络中，生成特征图；基于所述特征图，对每个类别标签的语义区域进行语义特定表示；利用基于标签共现的知识图谱对所述语义特征表示进行关联，进而将其用于预测标签的分布。2.根据权利要求1所述的方法，其特征在于，基于所述特征图，对每个类别标签的语义区域进行语义特定表示，包括：基于所述特征图，对每个类别标签的语义区域采用预设的词嵌入模型提取语义嵌入向量；根据语义注意力机制，学习对应于该标签类别的语义嵌入向量，以获得标签类别的特征向量。3.根据权利要求2所述的方法，其特征在于，根据语义注意力机制，学习对应于该标签类别的语义嵌入向量，以获得标签类别的特征向量，包括：根据每个类别标签的语义区域，获取语义区域内的每个位置点；利用低秩双线性池化的方法，融合每个位置点相应的特征图和语义嵌入向量得到每个位置点的特征向量；在语义嵌入向量的指导下，计算每个位置点的注意系数；对所有位置点的注意系数与特征向量的乘积求和，以获得标签类别的特征向量。4.根据权利要求3所述的方法，其特征在于，计算每个位置点的注意系数之后，包括：使用逻辑回归函数对所有位置点的注意系数进行归一化处理；对所有位置点归一化后的注意系数与特征向量的乘积求和，以获得标签类别的特征向量。5.根据权利要求1所述的方法，其特征在于，利用基于标签共现的知识图谱对所述语义特征表示进行关联，包括：基于涵盖标签类别的数据集，利用标签注释计算所有标签类别对之间的关联概率，...

【专利技术属性】
技术研发人员：刘义明，
申请(专利权)人：北京京东世纪贸易有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人