基于图文识别置信度的标注数据质检方法、设备及介质技术

技术编号:37157086 阅读:21 留言:0更新日期:2023-04-06 22:19
本发明专利技术公开一种基于图文识别置信度的标注数据质检方法、设备及介质,方法包括:步骤1,用已标注数据训练得到正向解码模型;步骤2,将具有待质检标注数据的图像输入正向解码模型得出待质检标注数据的正向解码得分;步骤3,用已标注数据训练得到反向解码模型;步骤4,将具有相同待质检标注数据的图像输入反向解码模型得出反向解码得分;步骤5,将正向解码得分和反向解码得分加权融合得到标注质量得分作为待质检标注数据的置信度;步骤6,通过置信度与预设阈值比较对待质检标注数据质检,将置信度高于预设阈值为合格标注数据,否则为不合格标注数据。该方法考虑多维度的信息,仅对置信度较低的标注数据进行人工复核,极大减少人工成本。本。本。

【技术实现步骤摘要】
基于图文识别置信度的标注数据质检方法、设备及介质


[0001]本专利技术涉及图像文字识别领域,尤其涉及一种基于图文识别数据的标注数据质检方法、设备及介质。

技术介绍

[0002]随着科学技术的发展,基于深度学习的自动化提取图片上的文字信息取得了不错的效果,极大的方便了人们的日常生活。但是基于深度学习的图像文字识别技术需要大量含有标签的数据来进行文本识别模型的训练,随着应用范围的提升,不同场景不同语种的数据标注需求越来越广泛,数据标注的量级也在不断增长。数据标注的质量会很大影响到文本识别模型的能力,因此,在数据标注过程中,如何有效的检查数据标注的正确性也成为数据标注过程中一个重要的方面。
[0003]现有的针对图像文字数据标注的质检方法主要基于两种方案,第一种方案是利用人工进行抽检,从整体数据中随机选择一部分数据来校验数据标注的准确性;第二种方案是利用已有的文本识别模型进行文字识别,将文本识别模型解码的后验概率作为数据得分,通过阈值来判断数据标注质量是否合格。
[0004]对于第一种方案,采用人工抽检的方式需要大量专业的人员进行操本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图文识别置信度的标注数据质检方法,其特征在于,包括:步骤1,利用已标注数据训练得到一个正向解码模型;所述已标注数据是指合格的标注文本图像,包括文本区域图像和对应的文字标注内容;步骤2,将具有待质检标注数据的图像输入所述正向解码模型,利用teacher

force的方式进行正向解码,得出待质检标注数据的正向解码得分;步骤3,利用已标注数据训练得到一个反向解码模型;所述已标注数据是指合格的标注文本图像,包括文本区域图像和对应的文字标注内容;步骤4,将具有相同待质检标注数据的图像输入所述反向解码模型,利用teacher

forcing方式进行反向解码,得出待质检标注数据的反向解码得分;步骤5,将所述正向解码模型得出的待质检标注数据的正向解码得分和反向解码模型得出的待质检标注数据的反向解码得分加权融合得到标注质量得分,该标注质量得分作为待质检标注数据的置信度;步骤6,通过将待质检标注数据的置信度与预设阈值比较对待质检标注数据进行质检,将置信度高于预设阈值的待质检标注数据确定为合格标注数据,置信度低于预设阈值的待质检标注数据确定为不合格标注数据。2.根据权利要求1所述的基于图文识别置信度的标注数据质检方法,其特征在于,所述正向解码模型采用的是基于注意力机制attention的自回归序列解码的attention

ED框架。3.根据权利要求1或2所述的基于图文识别置信度的标注数据质检方法,其特征在于,所述步骤2中,所述正向解码模型得出的待质检标注数据的正向解码得分用score

来表示为:其中,N表示正向解码的字符总数;p
t
表示正向解码模型解码得到的第t个字符对应的识别概率。4.根据权利要求1所述的基于图文识别置信度的标注数据质检方法,其特征在于,所述反向解码模型采用的是基于注意力机制attention的自回归序列解码的attentio...

【专利技术属性】
技术研发人员:吴嘉嘉赵坤杜俊
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1