图片样本集生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27977321 阅读:23 留言:0更新日期:2021-04-06 14:11
本申请涉及一种图片样本集生成方法、装置、计算机设备和存储介质。所述方法包括:基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;将符合预设条件的识别准确率所对应的对象,作为待强化对象;对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。采用本方法能够针对待强化对象进行强化,使用强化图片样本集对图片识别模型进行训练,可以提高图片识别模型对于待强化对象的识别能力,使图片识别模型的识别准确率得到显著提升。

【技术实现步骤摘要】
图片样本集生成方法、装置、计算机设备和存储介质
本申请涉及字符识别
,特别是涉及一种图片样本集生成方法、装置、计算机设备和存储介质。
技术介绍
随着图像识别技术的发展,出现了光学字符识别(OCR,OpticalCharacterRecognition)技术,光学字符识别可以使用预训练的图片识别模型对图片中的字符进行识别,通过使用字符图片作为训练样本对字符模型进行训练,图片识别模型可以对一定数量的字符图片进行训练得到,通常识别准确率的提升依赖于图片样本数量的增加,图片样本数量越多,识别准确率越高。目前图片识别模型图片样本数量的增加是通过随机增加字符图片来实现的。然而,随机增加字符图片容易导致在图片识别模型的训练过程中需要花费较多的计算资源,而且,由于需要识别的字符通常较多,当需要提升图片识别模型的识别准确率时,经常会出现即使增加了图片样本,花费了较多计算资源,也难以得到识别准确率的显著提升。因此,目前用于图片识别模型的图片样本生成技术存在难以显著提升识别准确率的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够显著提升识别准确率的图片样本集生成方法、装置、计算机设备和存储介质。一种图片样本集生成方法,所述方法应用于图片识别模型中,所述方法包括:基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;将符合预设条件的识别准确率所对应的对象,作为待强化对象;对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。在其中一个实施例中,所述基于对象生成测试样本集,包括:获取所述对象的至少一个图片生成参数;针对所述至少一个图片生成参数中的每一图片生成参数,生成与该图片生成参数对应的初始图片;对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述测试样本集。在其中一个实施例中,所述测试样本集中还包括至少一个图片信息,每一图片信息对应唯一的测试图片,所述图片信息用于描述测试图片的内容信息;所述根据识别结果确定所述对象的识别准确率,包括:基于所述图片信息,确定出所述对象的正确识别结果的总数,根据所述总数确定所述对象的识别准确率。在其中一个实施例中,所述将符合预设条件的识别准确率所对应的对象,作为待强化对象,包括:将至少一个识别准确率由低到高进行排序,将处于排序范围内的识别准确率所对应的对象作为目标对象。在其中一个实施例中,所述对至少一个待强化对象进行强化操作,得到强化样本集,包括:将所述待强化对象所对应的至少一个初始图片作为目标初始图片集;将所述待强化对象所对应的至少一个测试图片作为目标测试图片集;对所述目标初始图片集中的每一初始图片进行第二处理操作,得到所述待强化对象所对应的至少一个目标样本;将所述至少一个目标样本和所述目标测试图片集,作为所述强化样本集。在其中一个实施例中,所述第一处理操作包括至少一个图片处理操作,所述对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述测试样本集,包括:针对所述至少一个图片处理操作中的每一图片处理操作,根据该图片处理操作的操作占比,从所述至少一个初始图片中确定出至少一个目标初始图片;使用该图片处理操作对所述至少一个目标初始图片分别进行处理,得到至少一个处理后的目标初始图片;直至使用所述第一处理操作对所述至少一个初始图片完成所有操作后,得到所述测试样本集。一种图片样本集生成装置,所述装置包括图片识别模型,所述装置包括:测试样本集生成模块,用于基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;识别准确率确定模块,用于通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;待强化对象确定模块,用于将符合预设条件的识别准确率所对应的对象,作为待强化对象;强化模块,用于对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。在其中一个实施例中,所述测试样本集生成模块,还用于获取所述对象的至少一个图片生成参数,针对所述至少一个图片生成参数中的每一图片生成参数,生成与该图片生成参数对应的初始图片,并对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述测试样本集。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;将符合预设条件的识别准确率所对应的对象,作为待强化对象;对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;将符合预设条件的识别准确率所对应的对象,作为待强化对象;对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。上述图片样本集生成方法、装置、计算机设备和存储介质,基于对象生成测试样本集,通过图片识别模型对测试样本集中的至少一个测试样本进行识别操作,可以得到图片识别模型对测试样本进行识别的结果,根据识别结果确定对象的识别准确率,可以检测图片识别模型对于对象的识别准确率,将符合预设条件的识别准确率所对应的对象作为待强化对象,可以快速确定出待强化对象,对至少一个待强化对象进行强化操作,得到强化样本集,可以针对待强化对象进行强化,使用强化图片样本集对图片识别模型进行训练,可以提高图片识别模型对于待强化对象的识别能力,使图片识别模型的识别准确率得到显著提升。附图说明图1为一个实施例中图片样本集生成方法的流程示意图;图2为另一个实施例中图片样本集生成方法的流程示意图;图3为一个实施例中图片样本集生成装置的结构框图;图4为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在一个实施例中,如图1所示,提供了一种图片样本集生成方法,可以应用于终端或服务器中,其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备本文档来自技高网...

【技术保护点】
1.一种图片样本集生成方法,其特征在于,所述方法应用于图片识别模型中,所述方法包括:/n基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;/n通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;/n将符合预设条件的识别准确率所对应的对象,作为待强化对象;/n对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。/n

【技术特征摘要】
1.一种图片样本集生成方法,其特征在于,所述方法应用于图片识别模型中,所述方法包括:
基于对象生成测试样本集;所述测试样本集中包括至少一个测试样本;
通过所述图片识别模型对所述至少一个测试样本进行识别操作,根据识别结果确定所述对象的识别准确率;
将符合预设条件的识别准确率所对应的对象,作为待强化对象;
对至少一个待强化对象进行强化操作,得到强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。


2.根据权利要求1所述的方法,其特征在于,所述基于对象生成测试样本集,包括:
获取所述对象的至少一个图片生成参数;
针对所述至少一个图片生成参数中的每一图片生成参数,生成与该图片生成参数对应的初始图片;
对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述测试样本集。


3.根据权利要求1所述的方法,其特征在于,所述测试样本集中还包括至少一个图片信息,每一图片信息对应唯一的测试图片,所述图片信息用于描述测试图片的内容信息;所述根据识别结果确定所述对象的识别准确率,包括:
基于所述图片信息,确定出所述对象的正确识别结果的总数,根据所述总数确定所述对象的识别准确率。


4.根据权利要求1所述的方法,其特征在于,所述将符合预设条件的识别准确率所对应的对象,作为待强化对象,包括:
将至少一个识别准确率由低到高进行排序,将处于排序范围内的识别准确率所对应的对象作为目标对象。


5.根据权利要求1所述的方法,其特征在于,所述对至少一个待强化对象进行强化操作,得到强化样本集,包括:
将所述待强化对象所对应的至少一个初始图片作为目标初始图片集;
将所述待强化对象所对应的至少一个测试图片作为目标测试图片集;
对所述目标初始图片集中的每一初始图片进行第二处理操作,得到所述待强化对象所对应的至少一个目标样本;
将所述至少一个目标样本和所述目标...

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:中电金信软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1