图像处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:25523266 阅读:27 留言:0更新日期:2020-09-04 17:13
本申请公开了一种图像处理方法、装置、计算机设备和存储介质,该方法包括:获得标注有类别标签的图像及图像关联的描述文本;提取图像的图像特征;基于图像描述文本确定图像的文本特征;利用第一特征映射模型,将图像的图像特征转换为第一标签特征;基于第二特征映射模型,确定图像的文本特征对应的第二标签特征;如第一标签特征和第二标签特征的匹配度符合条件,则确定图像标注的类别标签正确。本申请的方案可以降低识别图像标注的标签类别是否准确的复杂度,减少人力资源耗费。

【技术实现步骤摘要】
图像处理方法、装置、计算机设备和存储介质
本申请涉及图像处理
,尤其涉及一种图像处理方法、装置、计算机设备和存储介质。
技术介绍
在图像识别场景中,需要获得标注有类别标签的大量图像,如,基于标注有类别标签的多个图像训练用于识别图像识别的识别模型等。由于受到各种因素影响,在标注有类别标签的图像中,可能会存在很多类别标签标注错误的图像(俗称的,类别标签标注错误的噪声图像)。如,由于人为原因,导致人工标注的类别标签错误;或者是,通过搜索引擎等收到的图像与图像对应的类别标签不相符等。这些类别标签标注错误的图像会大大影响到图像识别的识别性能,因此,在图像识别之前,需要识别出类别标签标注错误的噪声样本。目前较为通用的方式是采用人工清洗标注有类别标签的图像,即通过人工来依次确定各个图像的类别标签是否标注正确。然而,人工清洗的方式复杂度较高,需要耗费较多的人力资源。
技术实现思路
有鉴于此,本申请提供了一种图像处理方法、装置、计算机设备和存储介质,以降低识别图像标注的标签类别是否准确的复杂度,减少人力资源耗费。本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:/n获得待处理的图像以及所述图像关联的至少一种描述文本,所述图像标注有类别标签;/n提取所述图像的图像特征;/n基于所述图像的至少一种描述文本,确定所述图像的文本特征,所述文本特征为所述图像的至少一种描述文本中能够反映所述图像所属类别的特征信息;/n利用第一特征映射模型,将所述图像的图像特征转换为用于反映所述图像所属的类别标签的第一标签特征;/n基于第二特征映射模型,确定所述图像的文本特征对应的第二标签特征,所述第二标签特征表示所述图像的文本特征中表达出的用于反映所述图像所属的类别标签的特征,第一特征映射模型和第二特征映射模型为利用与所述图像具有相同的类...

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:
获得待处理的图像以及所述图像关联的至少一种描述文本,所述图像标注有类别标签;
提取所述图像的图像特征;
基于所述图像的至少一种描述文本,确定所述图像的文本特征,所述文本特征为所述图像的至少一种描述文本中能够反映所述图像所属类别的特征信息;
利用第一特征映射模型,将所述图像的图像特征转换为用于反映所述图像所属的类别标签的第一标签特征;
基于第二特征映射模型,确定所述图像的文本特征对应的第二标签特征,所述第二标签特征表示所述图像的文本特征中表达出的用于反映所述图像所属的类别标签的特征,第一特征映射模型和第二特征映射模型为利用与所述图像具有相同的类别标签的多个第一图像样本作为训练样本,并基于所述第一图像样本的图像特征和文本特征训练得到的,所述第一图像样本的文本特征为基于所述第一图像样本关联的描述文本确定的;
如所述第一标签特征和所述第二标签特征的匹配度符合条件,则确定所述图像标注的类别标签正确。


2.根据权利要求1所述的方法,其特征在于,所述基于所述图像的至少一种描述文本,确定所述图像的文本特征,包括:
确定所述图像关联的至少一种描述文本对应的文本向量;
将所述图像对应的文本向量输入到文本特征提取模型,并提取所述文本特征提取模型的中间层输出特征,将提取出的输出特征确定为所述图像的文本特征,所述文本特征提取模型为将标注有类别标签的多个第二图像样本作为训练样本,并基于所述第二图像样本关联的描述文本所对应的文本向量训练得到的。


3.根据权利要求1或2所述的方法,其特征在于,在确定出所述图像的文本特征之后,还包括:
利用文本分类模型确定所述图像的文本特征对应的目标图像类别,所述文本分类模型为将标注有类别标签的多个第三图像样本作为训练样本,并基于所述第三图像样本关联的描述文本对应的文本特征训练得到;
确定用于表示所述目标图像类别的文本类别特征;
所述基于第二特征映射模型,确定所述图像的文本特征对应的第二标签特征,包括:
利用第二特征映射模型,将所述文本类别特征转换为第二标签特征。


4.根据权利要求3所述的方法,其特征在于,所述确定用于表示所述目标图像类别的文本类别特征,包括:
按照不同图像类别与文本类别特征的对应关系,确定所述目标图像类别的文本类别特征,其中,图像类别对应的文本类别特征为依据属于所述目标图像类别的多个第四图像样本的文本特征,确定出的处于类别中心的第四图像样本的文本特征。


5.根据权利要求1所述的方法,其特征在于,所述第一特征映射模型和第二特征映射模型为至少利用类别标签标注正确的至少一个第一图像样本作为训练样本,并按照设定的训练目标,基于所述第一图像样本的图像特征和文本特征训练得到的;
所述训练目标为所述类别标签标注正确的第一图像样本对应的第三标签特征与第四标签特征的匹配度符合条件;
其中,所述第三标签特征为所述第一特征映射模型将第一图像样本的图像特征转换出的标签特征;所述第四标签特征为基于所述第二特征映射模型确定出的所述第一图像样本的文本特征对应的标签特征。


6.根据权利要求5所述的方法,其特征在于,所述第一特征映射模型和第二特征映射模型通过如下方式训练得到:
获得多个第一图像样本以...

【专利技术属性】
技术研发人员:郭卉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1