【技术实现步骤摘要】
多标签图像分类方法、装置及相关设备
[0001]本申请涉及人工智能
,尤其涉及一种多标签图像分类方法、装置、计算机设备及介质。
技术介绍
[0002]随着计算机视觉技术的发展,图像分类已经得到了广泛应用。多标签图像分类是非常常见的一种视觉计算问题,其用于对单张图片自动生成包含多种标签的描述,例如,在一张包含复杂场景的图像中自动识别出其中的多种物体(例如,行人、动物、树木等)以及场景相关的描述(例如,蓝天、白云、日出等)。
[0003]在实现本申请的过程中,申请人发现现有技术存在如下问题:现有的多标签图像分类是将多标签图像分类模型转换为目标检测问题来解决,这样不仅需要大量的图片样本,极大的增加了数据标注的困难性,也会在实际场景中缺乏图片样本的情况下,无法保证模型训练效果,导致多标签图像分类的准确性较低;此外,上述方法还会存在无法将多标签图片分类转换成目标检测问题的情况,例如需要分辩的属性是一种状态或者一种风格的时候,往往这样的类别是需要结合整张图像才能判定,而不是在目标检测模型中结合图片的一部分,导致多标签图像分
【技术保护点】
【技术特征摘要】
1.一种多标签图像分类方法,其特征在于,所述多标签图像分类方法包括:获取预先标注好标签的已分类图像中的标签,并调用预先训练好的语义转换模型处理所述标签,得到所述标签对应的标签语义向量;调用预先训练好的特征提取模型处理所述已分类图像,得到所述已分类图像对应的特征语义向量;根据所述标签语义向量与所述特征语义向量计算实际相关性值;将所述已分类图像作为输入向量,所述已分类图像对应的标签作为输出向量训练多标签图像分类模型,其中,根据所述实际相关性值与预先设置的目标相关性值确定所述多标签图像分类模型的损失函数,以收敛所述损失函数为目标,直至所述多标签图像分类模型训练完成;调用所述多标签图像分类模型处理待分类图像,得到所述待分类图像包含的初始标签集;调用所述语义转换模型处理所述初始标签集,得到所述初始标签集中每一初始标签对应的目标标签语义向量;获取每一所述目标标签语义向量间的语义关系,并根据所述语义关系输出所述待分类图像对应的目标标签集。2.根据权利要求1所述的多标签图像分类方法,其特征在于,所述调用预先训练好的语义转换模型处理所述标签,得到所述标签对应的标签语义向量包括:获取所述标签对应的目标属性,所述目标属性包括标签名称以及标签在所述已分类图像中的空间位置;将所述目标属性按照预设数据格式进行组合,得到目标属性序列;调用预先训练好的语义转换模型处理所述目标属性序列,得到所述标签对应的目标维度的标签语义向量。3.根据权利要求2所述的多标签图像分类方法,其特征在于,在所述调用预先训练好的特征提取模型处理所述已分类图像,得到所述已分类图像对应的特征语义向量之前,所述方法还包括:灰度处理所述已分类图像,得到目标已分类图像;获取所述目标已分类图像对应的预先标记好的若干区域标号,并根据所述区域标号确定所述目标已分类图像的目标区域集;提取所述目标区域集中各个所述目标区域对应的特征语料,并将所述特征语料转换为所述目标维度的特征语义向量;以所述已分类图像为输入向量,所述已分类图像对应的特征语义向量为输出向量训练初始神经网络,得到训练好的特征提取模型。4.根据权利要求1所述的多标签图像分类方法,其特征在于,所述根据所述标签语义向量与所述特征语义向量计算实际相关性值包括:乘积处理所述标签语义向量与所述特征语义向量,得到初始值;调用预设函数处理所述初始值,得到实际相关性值。5.根据权利要求1所述的多标签图像分类方法,其特征在于,所述获取每一所述目标标签语义向量间的语义关系包括:
计算每一所述目标标签语义向量间的相似度值;获取所述...
【专利技术属性】
技术研发人员:张玉琪,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。