目标对象的类别识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26032942 阅读:22 留言:0更新日期:2020-10-23 21:10
本公开关于一种目标对象的类别识别方法、装置、电子设备及存储介质,其中,所述方法包括:分别获取待识别的图像的目标对象的目标类别特征向量、图像的场景信息的第一词向量和多个第一类别的多个第二词向量;根据目标类别特征向量和映射参数生成目标对象的第三词向量;根据第一词向量、多个第二词向量和第三词向量识别出目标对象的类别。本公开引入了待识别的图像的场景信息。某些目标对象经常出现在对应的场景中。因此,在目标对象的类别未知的情况下,若确定了待识别的图像的场景信息,则可以将待识别的图像中的目标对象的类别缩小到与待识别的图像的场景信息相关的范围内,进而提升目标对象的类别的识别准确率。

【技术实现步骤摘要】
目标对象的类别识别方法、装置、电子设备及存储介质
本公开涉及深度学习
,尤其涉及一种目标对象的类别识别方法、装置、电子设备及存储介质。
技术介绍
深度学习在人工智能领域已经取得了非常优秀的成就,使用深度学习算法训练海量的带标签的样本数据,可以达到前所未有的识别精确度。但是,由于对海量数据的标注工作成本昂贵,对罕见类别获取海量数据难度较大,所以如何识别在训练过程中少见或从未见过的未知类别仍然是一个严峻的问题。零样本目标对象的类别识别表示在已知类别上训练目标对象识别模型,要求目标对象识别模型能够用于识别待识别的图像中未知类别的目标对象。相关技术中,在目标对象识别模型的训练过程中,样本数据中不包含未知类别的目标对象,因此,现有的零样本目标对象的类别识别方案的识别准确率较差。
技术实现思路
本公开提供了一种目标对象的类别识别方法、装置、电子设备及存储介质,以至少解决相关技术零样本目标对象的类别识别方案的识别准确率较差的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供了一种目标对象的类别识别方法,包括:分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量;根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量;根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。可选地,所述根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量,包括:将所述目标类别特征向量和所述映射参数进行矩阵相乘得到所述第三词向量。可选地,所述根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别,包括:根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别;根据多个所述第二类别的多个第四词向量和所述第三词向量识别出所述目标对象的类别。可选地,所述根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别,包括:分别计算所述第一词向量和多个所述第二词向量之间的余弦距离;将余弦距离最少的预设数量的多个所述第二词向量对应的多个所述第一类别确定为多个所述第二类别。可选地,所述根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别,包括:分别计算多个所述第四词向量和所述第三词向量之间的余弦距离;将余弦距离最少的所述第四词向量对应的所述第二类别确定为所述目标对象的类别。可选地,所述映射参数的生成步骤,包括:在预设的第一分类模型的训练过程中,根据所述第一分类模型的样本数据中样本类别的第五词向量和所述样本数据中样本图像的样本对象的样本类别特征向量生成所述映射参数。可选地,所述根据所述第一分类模型的样本数据中样本类别的第五词向量和所述样本数据中样本图像的样本对象的样本类别特征向量生成所述映射参数,包括:基于所述第五词向量和所述样本类别特征向量,利用岭回归算法生成所述映射参数。根据本公开实施例的第二方面,提供了一种目标对象的类别识别装置,包括:获取模块,被配置为分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量;生成模块,被配置为根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量;识别模块,被配置为根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。可选地,所述生成模块,被配置为将所述目标类别特征向量和所述映射参数进行矩阵相乘得到所述第三词向量。可选地,所述识别模块,包括:类别筛选模块,被配置为根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别;类别识别模块,被配置为根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别。可选地,所述类别筛选模块,包括:第一计算模块,被配置为分别计算所述第一词向量和多个所述第二词向量之间的余弦距离;第一确定模块,被配置为将余弦距离最少的预设数量的多个所述第二词向量对应的多个所述第一类别确定为多个所述第二类别。可选地,所述类别识别模块,包括:第二计算模块,被配置为分别计算多个所述第四词向量和所述第三词向量之间的余弦距离;第二确定模块,被配置为将余弦距离最少的所述第四词向量对应的所述第二类别确定为所述目标对象的类别。可选地,所述装置还包括:训练模块,被配置为生成所述映射参数,所述训练模块,被配置为在预设的第一分类模型的训练过程中,根据所述第一分类模型的样本数据中样本类别的第五词向量和所述样本数据中样本图像的样本对象的样本类别特征向量生成所述映射参数。可选地,所述训练模块,被配置为基于所述第五词向量和所述样本类别特征向量,利用岭回归算法生成所述映射参数。根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的目标对象的类别识别方法。根据本公开实施例的第四方面,提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的目标对象的类别识别方法。根据本公开实施例的第五方面,提供了一种计算机程序产品,包括可读性程序代码,所述可读性程序代码可由电子设备的处理器执行以完成上述第一方面所述的目标对象的类别识别方法。本公开的实施例提供的技术方案至少带来以下有益效果:在本公开的实施例中,分别获取待识别的图像的目标对象的目标类别特征向量、场景信息的第一词向量和预设的多个第一类别的多个第二词向量。然后,根据目标类别特征向量和预设的映射参数生成目标对象的第三词向量。接下来,根据第一词向量、多个第二词向量和第三词向量识别出目标对象的类别。在公开的实施例在识别目标对象的类别时,引入了待识别的图像的场景信息。基于常识性的观察可知,某些目标对象经常出现在对应的场景中,例如骆驼经常出现在沙漠场景里;鱼经常出现在水场景里;风筝经常出现在天空场景里。因此,在待识别的图像中的目标对象的类别未知的情况下,若确定了待识别的图像的场景信息,则可以将待识别的图像中的目标对象的类别缩小到与待识别的图像的场景信息相关的范围内,进而提升目标对象的类别的识别准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。图1是根据一示例性实施例示出的一种标目标对象的类别识别方法的流程图。图2是根据一示例性实施例示出的目标对象的类别识别过程的步骤流程图。图3是根据一示例性实施例示出的一种目标对象的类别识别装置的框图。图4是根据一示例性实施例示出的一种目标对象本文档来自技高网...

【技术保护点】
1.一种目标对象的类别识别方法,其特征在于,包括:/n分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量;/n根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量;/n根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。/n

【技术特征摘要】
1.一种目标对象的类别识别方法,其特征在于,包括:
分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量;
根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量;
根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量,包括:
将所述目标类别特征向量和所述映射参数进行矩阵相乘得到所述第三词向量。


3.根据权利要求1所述的方法,其特征在于,所述根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别,包括:
根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别;
根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别,包括:
分别计算所述第一词向量和多个所述第二词向量之间的余弦距离;
将余弦距离最少的预设数量的多个所述第二词向量对应的多个所述第一类别确定为多个所述第二类别。


5.根据权利要求3所述的方法,其特征在于,所述根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别,包括:
分别计算多个所述第四词向量和所述第三词向量之间的余弦距离;

【专利技术属性】
技术研发人员:申世伟
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1