目标对象的类别识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26032942 阅读：22 留言：0更新日期：2020-10-23 21:10

本公开关于一种目标对象的类别识别方法、装置、电子设备及存储介质，其中，所述方法包括：分别获取待识别的图像的目标对象的目标类别特征向量、图像的场景信息的第一词向量和多个第一类别的多个第二词向量；根据目标类别特征向量和映射参数生成目标对象的第三词向量；根据第一词向量、多个第二词向量和第三词向量识别出目标对象的类别。本公开引入了待识别的图像的场景信息。某些目标对象经常出现在对应的场景中。因此，在目标对象的类别未知的情况下，若确定了待识别的图像的场景信息，则可以将待识别的图像中的目标对象的类别缩小到与待识别的图像的场景信息相关的范围内，进而提升目标对象的类别的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
目标对象的类别识别方法、装置、电子设备及存储介质
本公开涉及深度学习
，尤其涉及一种目标对象的类别识别方法、装置、电子设备及存储介质。
技术介绍
深度学习在人工智能领域已经取得了非常优秀的成就，使用深度学习算法训练海量的带标签的样本数据，可以达到前所未有的识别精确度。但是，由于对海量数据的标注工作成本昂贵，对罕见类别获取海量数据难度较大，所以如何识别在训练过程中少见或从未见过的未知类别仍然是一个严峻的问题。零样本目标对象的类别识别表示在已知类别上训练目标对象识别模型，要求目标对象识别模型能够用于识别待识别的图像中未知类别的目标对象。相关技术中，在目标对象识别模型的训练过程中，样本数据中不包含未知类别的目标对象，因此，现有的零样本目标对象的类别识别方案的识别准确率较差。
技术实现思路
本公开提供了一种目标对象的类别识别方法、装置、电子设备及存储介质，以至少解决相关技术零样本目标对象的类别识别方案的识别准确率较差的问题。本公开的技术方案如下：根据本公开实施例的第一方面，提供了一种目标对象的类别识别方法，包括：分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量；根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量；根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。可选地，所述根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量，包括：将所述目...

【技术保护点】
1.一种目标对象的类别识别方法，其特征在于，包括：/n分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量；/n根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量；/n根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。/n

【技术特征摘要】
1.一种目标对象的类别识别方法，其特征在于，包括：
分别获取待识别的图像中包含的目标对象的目标类别特征向量、所述图像的场景信息的第一词向量和预设的多个第一类别的多个第二词向量；
根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量；
根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标类别特征向量和预设的映射参数生成所述目标对象的第三词向量，包括：
将所述目标类别特征向量和所述映射参数进行矩阵相乘得到所述第三词向量。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一词向量、多个所述第二词向量和所述第三词向量识别出所述目标对象的类别，包括：
根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别；
根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一词向量和多个所述第二词向量从多个所述第一类别中筛选出所述图像的多个第二类别，包括：
分别计算所述第一词向量和多个所述第二词向量之间的余弦距离；
将余弦距离最少的预设数量的多个所述第二词向量对应的多个所述第一类别确定为多个所述第二类别。

5.根据权利要求3所述的方法，其特征在于，所述根据多个所述第二类别的第四词向量和所述第三词向量识别出所述目标对象的类别，包括：
分别计算多个所述第四词向量和所述第三词向量之间的余弦距离；

【专利技术属性】
技术研发人员：申世伟，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人