基于图像切片的标注方法及其装置、电子设备及存储介质制造方法及图纸

技术编号:36353385 阅读:13 留言:0更新日期:2023-01-14 18:09
本发明专利技术公开了一种基于图像切片的标注方法及其装置、电子设备及存储介质,涉及人工智能领域,其中,该标注方法包括:接收图像切片标注请求,采用第一识别模型识别图像切片集合中的每个图像切片,得到第一识别结果,并采用第二识别模型识别图像切片集合中的每个图像切片,得到第二识别结果,基于第一置信度、第一识别字符信息、第二置信度以及第二识别字符信息,建立筛选度模型,基于筛选度模型,确定每个图像切片的筛选度值,并基于筛选度值,筛选图像切片集合,得到目标图像切片集合,对目标图像切片集合中的每个目标图像切片进行标注。本发明专利技术解决了相关技术中仅依靠人工标注大量的图像切片的效率较低且成本较高的技术问题。图像切片的效率较低且成本较高的技术问题。图像切片的效率较低且成本较高的技术问题。

【技术实现步骤摘要】
基于图像切片的标注方法及其装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,具体而言,涉及一种基于图像切片的标注方法及其装置、电子设备及存储介质。

技术介绍

[0002]当前,对于图像文字识别领域的标注,可以分为两个部分:一部分是对图像中文字的定位信息的标注(即形成定位框),另一部分是对定位框内文字进行标注。对定位框内文字进行标注的过程可称为识别信息的过程。定位信息主要用于训练图像文字识别模型中的定位模型,识别信息主要用于训练识别模型,识别信息主要是通过对定位框定位出的带有文字内容的图像切片进行标注而获得。
[0003]图像文字识别模型的训练往往是先用定位信息训练定位模型,再用识别信息训练识别模型,以对定位框内的文字进行识别,训练定位模型和识别模型往往是分开的,训练识别模型使用的训练数据为对图像切片进行标注的数据。然而,训练识别模型,尤其是大型识别模型,往往需要涵盖足够多已标注字符量的训练数据,而对这些字符进行标注的工作量是很大的。
[0004]相关技术中,图像切片标注方法往往是使用人工方式进行标注,即使对于图像切片的识别信息标注虽然较其他标注简单,只是标注出图像切片上的文字即可,但是在图像切片量很多时,其标注工作仍然十分巨大。例如,对识别模型训练需要一千万的图像切片量时,其标注工作非常大,尤其是图像文字识别中需要训练字符增多时,需要的图像切片数据呈指数增长,当前人工标注很难满足其数据需求,存在人工标注效率低且需要花费的成本较高的问题。
[0005]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本专利技术实施例提供了一种基于图像切片的标注方法及其装置、电子设备及存储介质,以至少解决相关技术中仅依靠人工标注大量的图像切片的效率较低且成本较高的技术问题。
[0007]根据本专利技术实施例的一个方面,提供了一种基于图像切片的标注方法,包括:接收图像切片标注请求,其中,所述图像切片标注请求至少包括:图像切片集合;采用第一识别模型识别所述图像切片集合中的每个图像切片,得到第一识别结果,并采用第二识别模型识别所述图像切片集合中的每个所述图像切片,得到第二识别结果,其中,所述第一识别模型和所述第二识别模型都是预先训练好的识别模型,所述第一识别结果至少包括:第一置信度、第一识别字符信息,所述第二识别结果至少包括:第二置信度、第二识别字符信息;基于所述第一置信度、所述第一识别字符信息、所述第二置信度以及所述第二识别字符信息,建立筛选度模型;基于所述筛选度模型,确定每个所述图像切片的筛选度值,并基于所述筛选度值,筛选所述图像切片集合,得到目标图像切片集合;对所述目标图像切片集合中的每
个目标图像切片进行标注。
[0008]可选地,基于所述第一置信度、所述第一识别字符信息、所述第二置信度以及所述第二识别字符信息,建立筛选度模型的步骤,包括:基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第一识别模型输出的第一匹配度;基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第二识别模型输出的第二匹配度,其中,所述第一匹配度和所述第二匹配度用于度量所述第一识别结果和所述第二识别结果之间的一致性;确定预设第一参数和预设第二参数;基于所述第一置信度、所述第二置信度、所述第一匹配度、所述第二匹配度、所述预设第一参数以及所述预设第二参数,建立所述筛选度模型。
[0009]可选地,基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第一识别模型输出的第一匹配度的步骤,包括:匹配所述第一识别字符信息和所述第二识别字符信息,得到相同字符数量;基于所述第一识别字符信息,确定所述第一识别模型识别出的第一字符总数量;计算所述相同字符数量与所述第一字符总数量之间的第一比值;将所述第一比值表征为所述第一匹配度。
[0010]可选地,基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第二识别模型输出的第二匹配度的步骤,包括:匹配所述第一识别字符信息和所述第二识别字符信息,得到相同字符数量;基于所述第二识别字符信息,确定所述第二识别模型识别出的第二字符总数量;计算所述相同字符数量与所述第二字符总数量之间的第二比值;将所述第二比值表征为所述第二匹配度。
[0011]可选地,基于所述筛选度值,筛选所述图像切片集合,得到目标图像切片集合的步骤,包括:对所述筛选度值进行排序,得到排序结果;基于所述排序结果,筛选处于预设范围内的所述筛选度值指示的所述图像切片,得到所述目标图像切片集合,其中,所述预设范围内的所有所述筛选度值都大于筛选度阈值。
[0012]可选地,对所述目标图像切片集合中的每个目标图像切片进行标注的步骤,包括:基于所述第一识别字符信息以及所述第二识别字符信息,得到对每个所述目标图像切片进行标注的初始字符信息;依据每个所述目标图像切片,调整对应的所述初始字符信息,完成对所述目标图像切片的标注,其中,完成标注的每个所述目标图像切片对应有字符信息。
[0013]可选地,在对所述目标图像切片集合中的每个目标图像切片进行标注之后,还包括:对于所述筛选度值小于等于筛选度阈值的所述图像切片,将所述第一识别结果或所述第二识别结果中的字符信息作为所述图像切片的字符信息;将具有字符信息的所有所述图像切片和所有所述目标图像切片表征为训练样本集;采用所述训练样本集训练待训练识别模型,直到所述待训练识别模型的识别准确率大于预设准确率阈值。
[0014]根据本专利技术实施例的另一方面,还提供了一种基于图像切片的标注装置,包括:接收单元,用于接收图像切片标注请求,其中,所述图像切片标注请求至少包括:图像切片集合;识别单元,用于采用第一识别模型识别所述图像切片集合中的每个图像切片,得到第一识别结果,并采用第二识别模型识别所述图像切片集合中的每个所述图像切片,得到第二识别结果,其中,所述第一识别模型和所述第二识别模型都是预先训练好的识别模型,所述第一识别结果至少包括:第一置信度、第一识别字符信息,所述第二识别结果至少包括:第二置信度、第二识别字符信息;建立单元,用于基于所述第一置信度、所述第一识别字符信息、所述第二置信度以及所述第二识别字符信息,建立筛选度模型;筛选单元,用于基于所
述筛选度模型,确定每个所述图像切片的筛选度值,并基于所述筛选度值,筛选所述图像切片集合,得到目标图像切片集合;标注单元,用于对所述目标图像切片集合中的每个目标图像切片进行标注。
[0015]可选地,所述建立单元包括:第一确定模块,用于基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第一识别模型输出的第一匹配度;第二确定模块,用于基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第二识别模型输出的第二匹配度,其中,所述第一匹配度和所述第二匹配度用于度量所述第一识别结果和所述第二识别结果之间的一致性;第三确定模块,用于确定预设第一参数和预设第二参数;第一建立模块,用于基于所述第一置信度、所述第二置信度、所述第一匹配度、所述第二匹配度、所述预设第一参数以及所述预设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像切片的标注方法,其特征在于,包括:接收图像切片标注请求,其中,所述图像切片标注请求至少包括:图像切片集合;采用第一识别模型识别所述图像切片集合中的每个图像切片,得到第一识别结果,并采用第二识别模型识别所述图像切片集合中的每个所述图像切片,得到第二识别结果,其中,所述第一识别模型和所述第二识别模型都是预先训练好的识别模型,所述第一识别结果至少包括:第一置信度、第一识别字符信息,所述第二识别结果至少包括:第二置信度、第二识别字符信息;基于所述第一置信度、所述第一识别字符信息、所述第二置信度以及所述第二识别字符信息,建立筛选度模型;基于所述筛选度模型,确定每个所述图像切片的筛选度值,并基于所述筛选度值,筛选所述图像切片集合,得到目标图像切片集合;对所述目标图像切片集合中的每个目标图像切片进行标注。2.根据权利要求1所述的标注方法,其特征在于,基于所述第一置信度、所述第一识别字符信息、所述第二置信度以及所述第二识别字符信息,建立筛选度模型的步骤,包括:基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第一识别模型输出的第一匹配度;基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第二识别模型输出的第二匹配度,其中,所述第一匹配度和所述第二匹配度用于度量所述第一识别结果和所述第二识别结果之间的一致性;确定预设第一参数和预设第二参数;基于所述第一置信度、所述第二置信度、所述第一匹配度、所述第二匹配度、所述预设第一参数以及所述预设第二参数,建立所述筛选度模型。3.根据权利要求2所述的标注方法,其特征在于,基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第一识别模型输出的第一匹配度的步骤,包括:匹配所述第一识别字符信息和所述第二识别字符信息,得到相同字符数量;基于所述第一识别字符信息,确定所述第一识别模型识别出的第一字符总数量;计算所述相同字符数量与所述第一字符总数量之间的第一比值;将所述第一比值表征为所述第一匹配度。4.根据权利要求2所述的标注方法,其特征在于,基于所述第一识别字符信息以及所述第二识别字符信息,确定所述第二识别模型输出的第二匹配度的步骤,包括:匹配所述第一识别字符信息和所述第二识别字符信息,得到相同字符数量;基于所述第二识别字符信息,确定所述第二识别模型识别出的第二字符总数量;计算所述相同字符数量与所述第二字符总数量之间的第二比值;将所述第二比值表征为所述第二匹配度。5.根据权利要求1所述的标注方法,其特征在于,基于所述筛选度值,筛选所述图像切片集合,得到目标图像切片集合的步骤,包括:对所述筛选度...

【专利技术属性】
技术研发人员:杨家安张亚姜璐邓坤元
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1