【技术实现步骤摘要】
图像识别方法、装置、设备、可读存储介质及程序产品
[0001]本申请涉及人工智能技术,具体涉及图像识别方法、图像识别装置、图像识别设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]随着互联网技术的发展,各种内容的发布量迅速增长,通过在平台浏览多媒体内容已经成为人们最常见的生活习惯之一。其中,由大量用户上传的内容质量参差不齐,可能涉及包含异常内容。所谓异常内容可以是指,包含特定类别的物品的内容。例如,特定类别的物品包括危害人身健康、安全或对财产造成损害的危险物品,如特定类别的物品包括刀具等。
[0003]目前,平台对上传的内容进行审核的过程中,通过人工智能(Artificial Int elligence,AI)算法对上传的内容中包括的图像进行识别,这种方式对预先训练时,训练集中包括的物品图像的识别效果较好,但是对训练集中未包括的物品识别效果不好,若在实际场景中,需要识别的物品不断的更新迭代,则目前的方式识别效果不好,无法适用于识别物品类别快速更新的场景。
[0004]因此,如何训练得到模型来提 ...
【技术保护点】
【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:调用图像识别模型的特征提取网络对待识别图像进行特征提取处理,得到所述待识别图像的图像特征;所述待识别图像中包含待识别对象;调用所述图像识别模型的第一识别网络和第二识别网络分别对所述图像特征进行识别处理,得到第一识别结果和第二识别结果;所述第一识别结果包括多个参考类别各自对应的预测概率,所述预测概率是预测的所述待识别对象的类别为相应参考类别的概率;所述第二识别结果用于指示所述待识别对象的类别属于所述多个参考类别的概率;基于所述第一识别结果和所述第二识别结果确定所述待识别图像的图像识别结果,或者基于所述第二识别结果确定所述待识别图像的图像识别结果,所述图像识别结果用于指示所述待识别对象的目标类别;其中,第一识别模型是利用标注数据集和未标注数据集对初始识别模型训练得到,所述标注数据集包括标注图像和所述标注图像的标注类别标签,所述未标注数据集包括未标注图像;所述第二识别模型是利用所述标注数据集、伪标注数据集和所述未标注数据集对所述第一识别模型训练得到,所述伪标注数据集中的样本图像为所述未标注图像,所述伪标注数据集还包括所述样本图像的伪类别标签,所述伪类别标签是基于选取阈值和所述第一识别模型对各个所述未标注图像的识别结果确定的,所述选取阈值是基于所述第一识别模型对第一验证数据集和第二验证数据集中的验证图像的识别结果确定的,所述第一验证数据集和所述标注数据集的图像数据分布相匹配,所述第二验证数据集和所述标注数据集的图像数据分布存在差异;所述图像识别模型是基于所述第二识别模型确定的。2.根据权利要求1所述的方法,其特征在于,所述第二识别模型包括特征提取网络和基础识别网络;基于所述第二识别模型确定的第三识别模型还包括分支识别网络,所述分支识别网络和所述基础识别网络的输入均与所述第二识别模型的特征提取网络的输出相连接;所述图像识别模型是利用第一差异数据对所述第三识别模型训练得到,所述第一差异数据是基于所述第三识别模型对数据集中的图像的目标识别结果确定的,所述数据集包括所述标注数据集、所述伪标注数据集和所述未标注数据集,所述目标识别结果包括所述基础识别网络确定的基础识别结果和所述分支识别网络确定的分支识别结果,所述分支识别结果用于指示图像中的样本对象的类别属于所述多个参考类别的概率;所述图像识别模型的第一识别网络为所述基础识别网络,所述图像识别模型的第二识别网络为所述分支识别网络。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述多个参考类别的类别数目,基于所述类别数目确定所述未标注数据集中的各个未标注图像的构造类别标签;调用所述初始识别模型对第一图像进行处理,得到所述第一图像的第一参考识别结果,所述第一图像为所述标注数据集和所述未标注数据集中的任意一个图像,所述第一图像中包含第一样本对象,所述第一参考识别结果包括所述多个参考类别各自对应的第一预测概率,所述第一预测概率是所述初始识别模型预测的所述第一样本对象的类别为相应参考类别的概率;基于所述标注数据集中的各个标注图像的第一参考识别结果和标注类别标签、所述未
标注数据集中的各个未标注图像的第一参考识别结果和构造类别标签,确定第二差异数据;利用所述第二差异数据对所述初始识别模型进行训练,并基于训练后的初始识别模型确定所述第一识别模型。4.根据权利要求1
‑
3中任一项所述的方法,其特征在于,所述方法还包括:获取所述伪标注数据集;调用所述第一识别模型对第二图像进行处理,得到所述第二图像的第二参考识别结果,所述第二图像为所述标注数据集、所述伪标注数据集和所述未标注数据集中的任意一个图像,所述第二图像中包含第二样本对象,所述第二参考识别结果包括所述多个参考类别各自对应的第二预测概率,所述第二预测概率是所述第一识别模型预测的所述第二样本对象的类别为相应参考类别的概率;基于所述标注数据集中的各个标注图像的第二参考识别结果和标注类别标签、所述伪标注数据集中的各个样本图像的第二参考识别结果和伪类别标签、所述未标注数据集中的各个未标注图像的第二参考识别结果和构造类别标签、温度系数,确定第三差异数据;利用所述第三差异数据对所述第一识别模型进行训练,并基于训练后的第一识别模型确定所述第二识别模型。5.根据权利要求4所述的方法,其特征在于,所述获取所述伪标注数据集,包括:获取所述第一验证数据集和第二验证数据集,所述第一验证数据集包括第一验证图像和所述第一验证图像的验证类别标签,所述第二验证数据集包括第二验证图像;调用所述第一识别模型对第三图像进行处理,得到所述第三图像的第三参考识别结果,所述第三图像为所述第一验证数据集和所述第二验证数据集中的任意一个图像,所述第三图像包含第三样本对象,所述第三参考结果包括所述多个参考类别各自对应的第三预测概率,所述第三预测概率是所述第一识别模型预测的所述第三样本对象的类别为相应参考类别的概率;基于所述第一验证数据集中的各个第一验证图像的第三参考识别结果和验证类别标签、所述第二验证数据集中的各个第二验证图像的第三参考识别结果,确定所述选取阈值;基于所述选取阈值、所述未标注数据集中的各个未标注图像的第二参考识别结果,从所述未标注数据集中选取未标注图像以及确定选取的未标注图像的伪类别标签;基于所述选取的未标注图像以及所述伪类别标签,确定所述伪标注数据集。6.根据权利要求5所述的方法,其特征在于,所述基于所述第一验证数据集中的各个第一验证图像的第三参考识别结果和验证类别标签、所述第二验证数据集中的各个第二验证图像的第三参考识别结果,确定所述选取阈值,包括:从所述第一验证数据集中确定目标参考类别对应的匹配第一验证图像,所述匹配第一验证图像所对应的验证类别标签与目标参考类别相匹配,所述目标参考类别为所述多个参考类别中的任意一个参考类别;基于各个所述匹配第一验证图像的第三参考识别结果确定所述目标参考类别的第一阈值,所述第一阈值使...
【专利技术属性】
技术研发人员:朱城,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。