测试文本图片的生成方法、装置及标注质量的确定方法制造方法及图纸

技术编号:35530469 阅读:15 留言:0更新日期:2022-11-09 14:53
本说明书提供了测试文本图片的生成方法、装置及标注质量的确定方法。具体的,可以先对待标注的目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;再根据文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,从而可以高效地自动生成埋设有与原文本字符匹配度较高的埋点文本,且测试效果较好的测试文本图片,进而后续可以利用上述测试文本图片,通过相应测试,较为准确地确定出负责标注的目标对象的标注质量。质量。质量。

【技术实现步骤摘要】
测试文本图片的生成方法、装置及标注质量的确定方法


[0001]本说明书属于互联网
,尤其涉及测试文本图片的生成方法、装置及标注质量的确定方法。

技术介绍

[0002]在训练OCR(Optical Character Recognition,光学字符识别)识别模型时,往往需要先由标注员对样本图片进行标注,得到标注后的样本图片;再利用上述标注后的样本图片对模型进行具体训练。显然,标注员的标注质量会影响到标注后的样本图片的数据质量,进而会对OCR识别模型的训练产生影响。
[0003]目前,亟需一种能够较为准确地确定出标注员的标注质量的方法。

技术实现思路

[0004]本说明书提供了一种测试文本图片的生成方法、装置及标注质量的确定方法,能够自动生成埋设有与原有文本字符匹配度较高的埋点文本且测试效果较好的测试文本图片,进而能够利用上述测试文本图片,较为准确地确定出负责标注的目标对象的标注质量。
[0005]本说明书提供的测试文本图片的生成方法、装置及标注质量的确定方法是这样实现的:
[0006]一种测试文本图片的生成方法,包括:获取目标文本图片;其中,所述目标文本图片至少包含有待标注的文本字符;对目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;根据所述文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,以得到测试文本图片。
[0007]一种标注质量的确定方法,包括:根据目标文本图片,生成对应的测试文本图片;其中,所述测试文本图片中设置有埋点文本;所述埋点文本为根据目标文本图片中的文本字符数据生成的;利用所述测试文本图片,确定目标对象的标注质量。
[0008]一种测试文本图片的生成装置,包括:获取模块,用于获取目标文本图片;其中,所述目标文本图片至少包含有待标注的文本字符;预处理模块,用于对目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;设置模块,用于根据所述文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,以得到测试文本图片。
[0009]一种标注质量的确定装置,包括:生成模块,用于根据目标文本图片,生成对应的测试文本图片;其中,所述测试文本图片中设置有埋点文本;所述埋点文本为根据目标文本图片中的文本字符数据生成的;确定模块,用于利用所述测试文本图片,确定目标对象的标注质量。
[0010]一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述测试文本图片的生成方法或标注质量的确定方法的相关步骤。
[0011]一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述
测试文本图片的生成方法或标注质量的确定方法的相关步骤。
[0012]本说明书提供的测试文本图片的生成方法、装置及标注质量的确定方法,可以先对目标对象待标注的目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;再根据文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,从而可以高效地自动生成埋设有与原有文本字符匹配度较高的埋点文本,且测试效果较好的测试文本图片,进而后续可以利用上述测试文本图片,通过相应测试,较为准确地确定出负责标注的目标对象的标注质量。
附图说明
[0013]为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是应用本说明书实施例提供的标注质量的确定方法的系统的组成的一个实施例的示意图;
[0015]图2是在一个场景示例中,应用本说明书实施例提供的标注质量的确定方法的一种实施例的示意图;
[0016]图3是在一个场景示例中,应用本说明书实施例提供的标注质量的确定方法的一种实施例的示意图;
[0017]图4是在一个场景示例中,应用本说明书实施例提供的标注质量的确定方法的一种实施例的示意图;
[0018]图5是在一个场景示例中,应用本说明书实施例提供的标注质量的确定方法的一种实施例的示意图;
[0019]图6是本说明书的一个实施例提供的测试文本图片的生成方法的流程示意图;
[0020]图7是本说明书的一个实施例提供的标注质量的确定方法的流程示意图;
[0021]图8是本说明书的一个实施例提供的服务器的结构组成示意图;
[0022]图9是本说明书的一个实施例提供的测试文本图片的生成装置的结构组成示意图;
[0023]图10是本说明书的一个实施例提供的标注质量的确定装置的结构组成示意图。
具体实施方式
[0024]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0025]本说明书实施例提供的标注质量的确定方法具体可以应用于包含有服务器和客户端的系统中。具体可以参阅图1所示。服务器和客户端可以通过有线或无线的方式相连,以进行具体的数据交互。
[0026]在本实施例中,所述服务器具体可以包括一种应用于业务平台一侧,能够实现数
据传输、数据处理等功能的负责评价确定标注员的标注质量的服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
[0027]在本实施例中,所述客户端具体可以包括一种应用于标注员一侧,能够实现数据采集、数据传输等功能的前端电子设备。具体的,所述客户端例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等。或者,所述客户端也可以为能够运行于上述电子设备中的软件应用。例如,可以是在台式电脑上运行的某业务平台的标注端口界面等。
[0028]通常服务器会将待标注的文本图片通过客户端分发给标注员。标注员在接收到上述文本图片后,可以先找出文本图片中所包含的文本字符,再以文本数据的形式注出具体的文本字符,作为标注结果,并通过客户端反馈给服务器,实现对该文本图片标注。
[0029]当前业务平台想要以量化的方式确定该标注员的标注质量。
[0030]具体实施时,服务器可以先获取多个包含有待标注的文本字符的文本图片(可以记为目标文本图片);通过对上述多个目标文本图片进行相应的处理,得到对应的多个设置有埋点文本的、测试效果较好的测试文本图片。
[0031]下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种测试文本图片的生成方法,包括:获取目标文本图片;其中,所述目标文本图片至少包含有待标注的文本字符;对目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;根据所述文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,以得到测试文本图片。2.根据权利要求1所述的方法,对目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据,包括:对目标文本图片进行OCR识别,以获取目标文本图片中的文本字符数据;调用图像检测模型对目标文本图片进行空白图像检测,以获取目标文本图片中的空白区域数据。3.根据权利要求2所述的方法,对目标文本图片进行预处理,还包括:调用文本字符分类模型对目标文本图片中的文本字符进行图形分类识别,以获取目标文本图片中的文本字符的属性数据;其中,所述属性数据包括以下至少之一:字体、字号、倾斜角。4.根据权利要求3所述的方法,根据所述文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,包括:根据所述文本字符数据,生成与目标文本图片中的文本字符相匹配的埋点文本;根据所述空白区域数据,在目标文本图片中确定出符合要求的布设位置;在所述布设位置处设置埋点文本,并记录埋点文本的关联数据。5.根据权利要求4所述的方法,根据所述文本字符数据,生成与目标文本图片中的文本字符相匹配的埋点文本,包括:调用预设的文本生成模型处理所述文本字符数据,以生成与目标文本图片中的文本字符相匹配的埋点文本。6.根据权利要求4所述的方法,根据所述空白区域数据,在目标文本图片中确定出符合要求的布设位置,包括:根据所述空白区域数据,在目标文本图片中确定出多个空白区域;从所述多个空白区域中筛选出位于段尾,或位于相邻两段之间的空白区域,作为所述符合要求的布设位置。7.根据权利要求6所述的方法,在所述布设位置处设置埋点文本,所述方法包括:获取布设位置处的邻近范围内的文本字符的属性数据;根据所述布设位置处的邻近范围内的文本字符的属性数据,调整埋点文本中的文本字符的相关属性,得到调整后的埋点文本;在所述布设位置处设置所述调整后的埋点文本。8.根据权利要求4所述的方法,在得到测试文本图片之后,所述方法还包括:利用所述测试文本图片,确定目标对象的标注质量。9.根据权利要求8所述的方法,利用所述测试文本图片,确定目标对象的标注质量,包括:将所述测试文本图片发送至目标对象;其中,所述目标对象对所述测试文本图片中的
文本字符进行标注得到对应的标注结果;接收标注结果;根据所述标注结果和所述埋点文本的关联数据,确定目标对象的标注质量。10.一种标注质量的确定方法,包括:根据...

【专利技术属性】
技术研发人员:赖伟彬王志勇马泽祥池哲宇刘一
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1