样本图片的标签修正方法、装置、设备和存储介质制造方法及图纸

技术编号:24800648 阅读:50 留言:0更新日期:2020-07-07 21:13
本申请涉及一种样本图片的标签修正方法、装置、计算机设备和存储介质。所述方法包括:获取图片样本集;所述图片样本集包括训练图片和所述训练图片对应的标注文本标签;检测所述训练图片对应的标注文本标签是否为异常文本标签;若是,则采用预设的标签修正模型对所述异常文本标签进行修正,得到所述异常文本标签对应的修正文本标签;所述标签修正模型是基于标签样本集进行训练得到的,所述标签样本集包括异常文本标签和所述异常文本标签对应的标注修正文本标签。采用本方法能够节省人力和时间。

【技术实现步骤摘要】
样本图片的标签修正方法、装置、设备和存储介质
本申请涉及计算机
,特别是涉及一种样本图片的标签修正方法、装置、设备和存储介质。
技术介绍
在日常工作学习过程中,为了识别图片等上面的文字,通常会采用文本识别模型来进行识别,而文本识别模型通常是采用大量标注了文字标签的训练样本进行训练得到的。由于训练样本比较多,因此在标注标签的过程中难免会出现错误,从而也会导致利用错误标签训练的文本识别模型的精度不够,因此,对错误标签的检测就显得尤为重要。相关技术中,在检测错误标签时,通常是在训练文本识别模型之前,通过人工查看并核对各个标签的内容,从而将错误标签找出来并进行改正,之后再用训练样本对文本识别模型进行训练。然而上述技术存在耗费人力的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够节省人力和时间的样本图片的标签修正方法、装置、设备和存储介质。一种样本图片的标签修正方法,该方法包括:获取图片样本集;该图片样本集包括训练图片和训练图片对应的标注文本标签;r>检测训练图片对应本文档来自技高网...

【技术保护点】
1.一种样本图片的标签修正方法,其特征在于,所述方法包括:/n获取图片样本集;所述图片样本集包括训练图片和所述训练图片对应的标注文本标签;/n检测所述训练图片对应的标注文本标签是否为异常文本标签;/n若是,则采用预设的标签修正模型对所述异常文本标签进行修正,得到所述异常文本标签对应的修正文本标签;所述标签修正模型是基于标签样本集进行训练得到的,所述标签样本集包括异常文本标签和所述异常文本标签对应的标注修正文本标签。/n

【技术特征摘要】
1.一种样本图片的标签修正方法,其特征在于,所述方法包括:
获取图片样本集;所述图片样本集包括训练图片和所述训练图片对应的标注文本标签;
检测所述训练图片对应的标注文本标签是否为异常文本标签;
若是,则采用预设的标签修正模型对所述异常文本标签进行修正,得到所述异常文本标签对应的修正文本标签;所述标签修正模型是基于标签样本集进行训练得到的,所述标签样本集包括异常文本标签和所述异常文本标签对应的标注修正文本标签。


2.根据权利要求1所述的方法,其特征在于,在所述获取图片样本集之后,所述方法还包括:
利用所述图片样本集和初始文本识别模型,得到所述训练图片数据对应的预测文本标签;
相应的,所述检测所述训练图片对应的标注文本标签是否为异常文本标签,包括:
检测所述预测文本标签对应的标注文本标签是否为异常文本标签。


3.根据权利要求2所述的方法,其特征在于,若所述预测文本标签对应的标注文本标签是异常文本标签,所述方法还包括:
计算所述异常文本标签对应的修正文本标签和所述预测文本标签之间的第一损失;
将所述第一损失和预设的第一损失阈值进行对比;
若所述第一损失大于所述预设的第一损失阈值,则将所述第一损失乘以预设的权重,并根据得到的损失对所述初始文本识别模型进行训练,得到所述文本识别模型;或者,若所述第一损失不大于所述预设的第一损失阈值,则根据所述第一损失对所述初始文本识别模型进行训练,得到所述文本识别模型。


4.根据权利要求2所述的方法,其特征在于,所述检测所述训练图片对应的标注文本标签是否为异常文本标签,包括:
计算所述预测文本标签和所述预测文本标签对应的标注文本标签之间的第二损失;
将所述第二损失和预设的第二损失阈值进行对比;
若所述第二损失大于所述预设的第二损失阈值,则将所述预测文本标签对应的训练图片输入至预设的分类器中进行分类,得到所述训练图片对应的图片质量类别;其中,所述预设的分类器是基于第一图片样本集训练得到的,所述第一图片样本集包括第一训练图片和所述第一训练图片对应的标注图片质量类别;
根据所述训练图片对应的图片质量类别,确定所述预测文本标签对应的标注文本标签是否为异常文本标签。

【专利技术属性】
技术研发人员:周康明冯晓锐
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1