签名识别模型训练方法、装置及电子设备制造方法及图纸

技术编号:32335052 阅读:11 留言:0更新日期:2022-02-16 18:42
本公开提供了签名识别模型训练方法、装置及电子设备,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域。具体方案为:从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;第一类样本为在基于该签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;获取待利用样本对应的文本行图片,其中,文本行图片为待利用样本中的签名区域;基于待利用样本对应的文本行图片和姓名标注信息,对签名识别模型进行更新训练。通过本方案,可以自动进行训练迭代签名识别模型,大大减少了迭代签名识别模型的人力成本。大减少了迭代签名识别模型的人力成本。大减少了迭代签名识别模型的人力成本。

【技术实现步骤摘要】
签名识别模型训练方法、装置及电子设备


[0001]本公开涉及人工智能
,尤其涉及深度学习、计算机视觉
,具体涉及签名识别模型训练方法、装置及电子设备。

技术介绍

[0002]对于数字化企业而言,对于手写签名的智能识别具有较高的需求。所谓的对于手写签名的智能识别即自动化地识别手写签名的签名内容。
[0003]利用签名识别模型,对包含有手写签名的签名图片进行识别,是一种常见的识别手段。为了保证签名识别模型的精度,需要对签名识别模型进行迭代,即对模型进行更新训练。相关技术中,通过人工方式更新训练模型,例如:人工选取新的签名图片作为样本,对样本中的签名区域以及姓名信息进行人工标注等。

技术实现思路

[0004]本公开提供了一种用于签名识别模型训练方法、装置及电子设备。
[0005]根据本公开的一方面,提供了一种签名识别模型训练方法,所述方法包括:
[0006]从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
[0007]获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;
[0008]基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
[0009]根据本公开的另一方面,提供了一种信息处理系统,包括:签名识别子系统和模型训练子系统;
[0010]签名识别子系统,用于当接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;其中,所述识别结果为基于预先训练完成的签名识别模型,对所述待识别图片进行识别,所得到的结果;
[0011]所述模型训练子系统,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;获取所述待利用样本对应的文本行图片;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
[0012]根据本公开的另一方面,提供了一种签名识别模型训练装置,所述装置包括:
[0013]第一获取模块,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库至少包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;
[0014]第二获取模块,用于获取所述待利用样本对应的文本行图片,其中,所述文本行图
片为所述待利用样本中的签名区域;
[0015]训练模块,用于基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。
[0016]根据本公开的另一方面,提供了一种电子设备,包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述签名识别模型训练方法。
[0020]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述签名识别模型训练方法的步骤。
[0021]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述签名识别模型训练方法的步骤。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0024]图1是本公开实施例所提供的签名识别模型训练方法的流程图;
[0025]图2(a)是本公开实施例中的待利用样本,图2(b)是本公开实施例中包含签名文字的最小外接矩形;
[0026]图3是本公开实施例所提供的信息处理系统的结构示意图;
[0027]图4是本公开实施例所提供的签名识别模型训练装置的结构示意图;
[0028]图5是用来实现本公开实施例的签名识别模型训练方法的电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]目前,在金融、政务、办公等各个领域的合同、确认文件上都需要办理人手写签名,之后,需要审核办理人手写签名与本人真实姓名是否一致。
[0031]相关技术中,采用人工审核方式进行签名识别,即识别办理人的手写签名是否与本人真实姓名一致。但是,对于产生大量签名的签名场景而言,需要大量的人工参与审核,效率低。并且,人工审核的方式中,需要频繁沟通、等待审核等,会影响签名用户的使用体验。
[0032]基于此,签名识别服务应运而生。签名识别服务可以实现识别手写签名的文字内容,并参与个人身份校验,能够节省90%以上的业务处理时间,例如合同签署时间。并且,减少人工指导,不仅可以节省工作人员的工作量;还能减少干扰,提升用户的签名体验。
[0033]针对签名识别服务而言,签名识别模型是实现服务的重要手段。针对签名识别模
型而言,在采集包含手写签名的签名图片后,可以对签名图片进行姓名标注,然后,有监督地训练签名识别模型,以通过训练完成的签名识别模型来识别签名图片中的文字内容,即手写签名。可以理解的是,每个人的笔迹风格不同,签名图片特征分布较分散,并且,识别精度受标注数据量的限制。这样使得模型训练时需要大量的签名图片,且签名图片还需要被一一标注,其中,该大量的签名图片覆盖多种类型的手写数据,该多种类型的手写数据即多种文字内容和笔迹风格。
[0034]然而,签名识别模型往往只对训练集中可以覆盖或相似的样本有精度保证。为了保证签名识别模型的精度,需要对签名识别模型进行迭代,即对模型进行更新训练。相关技术中,通过人工方式更新训练模型,例如:人工选取大量新的签名图片作为样本,对样本中的签名区域以及姓名信息进行人工标注等,来作为模型的新的训练集,不断地迭代模型。
[0035]可见,通过人工方式,更新训练签名识别模型,需要耗费大量人力成本。
[0036]为了解决上述问题,实现对签名识别模型的自动化地更新训练,本公开实施例提供了一种签名识别模型训练方法、系统、装置、设备及存储介质。
[0037]下面首先对本公开实施例所提供的一种签名识别模型训练方法进行介绍。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种签名识别模型训练方法,所述方法包括:从预定的样本库中,获取待利用样本以及对应的姓名标注信息;其中,所述样本库包括第一类样本和对应的姓名标注信息;所述第一类样本为在基于所述签名识别模型进行签名识别时,经反馈识别结果错误的签名图片;获取所述待利用样本对应的文本行图片,其中,所述文本行图片为所述待利用样本中的签名区域;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。2.根据权利要求1所述的方法,其中,所述样本库还包括第二类样本和对应的姓名标注信息;其中,所述第二类样本为在预定时间段内所生成的、关于预定签名场景的签名图片。3.根据权利要求1或2所述的方法,其中,获取所述待利用样本对应的文本行图片,包括:对所述待利用样本进行签名区域检测,得到检测结果;基于所述检测结果,从所述待利用样本中提取签名区域,作为所述待利用样本对应的文本行图片。4.根据权利要求3所述的方法,其中,所述对所述待利用样本进行签名区域检测,得到检测结果,包括:对所述待利用样本进行二值化处理,并确定二值化处理后的样本中,包含各个文字区域的最小外接矩形,得到签名区域的检测结果;或者,基于预先训练的用于检测签名区域的文字检测模型,检测所述待利用样本中的签名区域,得到检测结果。5.根据权利要求1或2所述的方法,其中,所述待利用样本的数量为多个;所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练之前,还包括:统计各个待利用样本相对应的姓名标注信息中,各个文字的出现频率;检测出现频率低于预定频率阈值的目标文字;确定所对应姓名标注信息中包含所述目标文字的待利用样本,作为待处理样本;将所述所述待处理样本对应的文本行图片,进行数据增强处理,得到目标样本;所述基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练,包括:基于所述待利用样本对应的文本行图片和姓名标注信息,以及所述目标样本和对应的姓名标注信息,对所述签名识别模型进行更新训练;其中,所述目标样本对应的姓名标注信息为:所述待处理样本对应的姓名标注信息。6.一种信息处理系统,包括:签名识别子系统和模型训练子系统;签名识别子系统,用于当接收到用户针对待识别图片反馈识别结果错误时,获取待识别图片的姓名,将所述待识别图片作为第一类样本,以及将所述姓名作为对应的姓名标注信息存储入预定的样本库中;其中,所述识别结果为基于预先训练完成的签名识别模型,对所述待识别图片进行识别,所得到的结果;
所述模型训练子系统,用于从预定的样本库中,获取待利用样本以及对应的姓名标注信息;获取所述待利用样本对应的文本行图片;基于所述待利用样本对应的文本行图片和姓名标注信息,对所述签名识别模型进行更新训练。7.一种签名识...

【专利技术属性】
技术研发人员:王晓燕黄聚钦夏孟范森吕鹏原章成全姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1