【技术实现步骤摘要】
一种图像中的对象标识信息识别方法、装置及存储介质
本申请涉及图像识别
,尤其涉及一种图像中的对象标识信息识别方法、装置及存储介质。
技术介绍
现有技术中,对视频信息中某一个特定对象进行识别时,通常是基于样本与全连接层权重间欧式距离构建损失函数,并确定识别模型。将全连接层权重作为类中心计算样本和某类之间相似度时,由于全连接层的表达能力很强,因此其容易对样本进行过拟合,从而导致将其权重作为类中心时无法代表该类样本真正的分布情况;此外,基于欧式距离计算向量相似度时,数值会受到向量本身模大小的影响,无法准确地描述样本与类的归属关系,从而无法准确识别图像中的对象标识。因此,有必要提供一种图像中的对象标识信息识别方法、装置及存储介质,减小训练期间对象标识信息识别模型的过拟合,提高模型的泛化能力,从而提高图像中对象标识信息的识别准确率。
技术实现思路
本申请提供了一种图像中的对象标识信息识别方法、装置及存储介质,可以减小训练期间对象标识信息识别模型的过拟合,提高模型的泛化能力,从而提高图像中对象标识信息的识别准确率。一方面,本申请提供了一种图像中的对象标识信息识别方法,所述方法包括:获取待识别对象图像;基于对象标识信息识别模型,对所述待识别对象图像进行对象标识信息识别处理,得到所述待识别对象图像所对应的对象标识信息;其中,所述对象标识信息识别模型的训练方法包括:构建预设机器学习模型,并将所述预设机器学习模型确定为当前机器学习模型;将标注有对象 ...
【技术保护点】
1.一种图像中的对象标识信息识别方法,其特征在于,所述方法包括:/n获取待识别对象图像;/n基于对象标识信息识别模型,对所述待识别对象图像进行对象标识信息识别处理,得到所述待识别对象图像所对应的对象标识信息;/n其中,所述对象标识信息识别模型的训练方法包括:/n构建预设机器学习模型,并将所述预设机器学习模型确定为当前机器学习模型;/n将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集,所述图像特征集包括至少一类图像特征子集;/n确定每类图像特征子集的样本中心,并将所述每类图像特征子集的样本中心作为所述每类图像特征子集的类中心;/n基于所述每类图像特征子集的类中心,确定交叉熵损失值;/n当所述交叉熵损失值大于预设阈值时,基于所述交叉熵损失值进行反向传播,对所述当前机器学习模型进行更新以得到更新后机器学习模型,将所述更新后机器学习模型重新确定为所述当前机器学习模型;重复步骤:将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集;/n当所述交叉熵损失值小于或等于所述预设阈值时,将 ...
【技术特征摘要】 【专利技术属性】
1.一种图像中的对象标识信息识别方法,其特征在于,所述方法包括:
获取待识别对象图像;
基于对象标识信息识别模型,对所述待识别对象图像进行对象标识信息识别处理,得到所述待识别对象图像所对应的对象标识信息;
其中,所述对象标识信息识别模型的训练方法包括:
构建预设机器学习模型,并将所述预设机器学习模型确定为当前机器学习模型;
将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集,所述图像特征集包括至少一类图像特征子集;
确定每类图像特征子集的样本中心,并将所述每类图像特征子集的样本中心作为所述每类图像特征子集的类中心;
基于所述每类图像特征子集的类中心,确定交叉熵损失值;
当所述交叉熵损失值大于预设阈值时,基于所述交叉熵损失值进行反向传播,对所述当前机器学习模型进行更新以得到更新后机器学习模型,将所述更新后机器学习模型重新确定为所述当前机器学习模型;重复步骤:将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集;
当所述交叉熵损失值小于或等于所述预设阈值时,将所述当前机器学习模型确定为所述对象标识信息识别模型。
2.根据权利要求1所述的方法,其特征在于,所述确定每类图像特征子集的样本中心的步骤之前,所述方法还包括:
确定所述图像特征集中每个图像特征对应的对象标识信息;
将所述图像特征集中的图像特征按照对象标识信息进行分类,得到至少一类图像特征子集;
相应的,所述确定每类图像特征子集的样本中心包括:
根据所述每类图像特征子集中各个图像特征对应的特征值,计算所述每类图像特征子集的图像特征平均值;
将所述每类图像特征子集的图像特征平均值作为所述每类图像特征子集的样本中心。
3.根据权利要求1所述的方法,其特征在于,所述基于所述每类图像特征子集的类中心,确定交叉熵损失值包括:
计算每个图像特征的特征值与所述每个图像特征所在图像特征子集的类中心的余弦相似度;
计算所述每个图像特征对应的余弦相似度与预设分类差值的差,得到所述每个图像特征对应的差值余弦相似度;
基于所述每个图像特征对应的类中心与差值余弦相似度,确定所述交叉熵损失值。
4.根据权利要求3所述的方法,其特征在于,所述基于所述每个图像特征对应的类中心与差值余弦相似度,确定所述交叉熵损失值的计算公式如下:
其中,L为交叉熵损失值,N为类的个数,S为预设放大常量,m为预设分类差值;f为当前样本的图像特征,i,j均表示类;yi为第i类样本对应的类标签,为第i类的样本中心。
5.根据权利要求1所述的方法,其特征在于,所述将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集的步骤之前,所述方法还包括:
对所述样本对象图像集中的每个样本对象图像进行预处理;
相应的,所述将标注有对象标识信息的样本对象图像集输入所述当前机器学习模型,确定每个样本对象图像的图像特征,得到图像特征集包括:
对预处理后样本对象图像集进行空间域卷积的降维处理;
对降维后特征图集中每个特征图进行池化处理,得到图像特征集。
6.根据权利要求1所述的方法,其特征在于,所述获取待识别对象图像包括:
从目标视频信息中获取至少两个待识别对象图像;
技术研发人员:宫毅非,蒋忻洋,孙星,郭晓威,余宗桥,彭湃,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。