一种模型训练的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39043336 阅读:12 留言:0更新日期:2023-10-10 11:56
本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,获取用户发送的待识别证件图像,将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果,判断所述用户是否修改所述第一字符识别结果,若是,则获取所述修改后的字符识别结果,作为第二字符识别结果,根据所述第二字符识别结果,对所述字符识别模型进行训练。本方法通过用户修改后的识别结果对模型进行训练,提高了模型输出结果的准确性。输出结果的准确性。输出结果的准确性。

【技术实现步骤摘要】
一种模型训练的方法、装置、存储介质及电子设备


[0001]本说明书涉及机器学习,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。

技术介绍

[0002]随着智能识别技术的发展,人们可以通过机器学习训练出的各类文字提取模型提取图像中的文字,例如,利用用户手机拍摄的照片及文字提取模型,提取照片中包含的文字,其中,该文字可能包含用户的隐私。
[0003]在提取图像中的文字时,通常是将用户发送的图像输入训练好的文字提取模型中。但在进行模型训练时,使用的训练样本的可能存在图像模糊、关键文字遮挡等问题,例如,图像中关键信息的位置存在反光或被拍摄者手部遮挡。那么,由于训练样本的质量较低,因此,利用该训练样本训练出的模型得到的识别结果的准确性较低。此外,对模型进行训练时,需要花费大量时间及计算资源获取训练样本及训练样本的标签。
[0004]基于此,本说明书提供一种模型训练的方法。

技术实现思路

[0005]本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供一种模型训练的方法,包括:
[0008]获取用户发送的待识别证件图像;
[0009]将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果;
[0010]判断所述用户是否修改所述第一字符识别结果;
[0011]若是,则获取所述修改后的字符识别结果,作为第二字符识别结果;<br/>[0012]根据所述第二字符识别结果,对所述字符识别模型进行训练。
[0013]可选地,获取用户发送的待识别证件图像,具体包括:
[0014]响应于用户发送的业务请求,向所述用户返回用于输入用户信息的页面;
[0015]响应于所述用户在所述页面中执行的上传操作,获取所述用户发送的待识别证件图像。
[0016]可选地,判断所述用户是否修改所述第一字符识别结果,具体包括:
[0017]将所述第一字符识别结果添加至所述页面中用于输入所述用户信息的位置,并展示;
[0018]判断所述用户是否修改添加至所述位置的用户信息。
[0019]可选地,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:
[0020]确定当前时刻所在周期;
[0021]若当前周期的结束时刻到来,获取当前周期内的所有第二字符识别结果及与所述
第二字符识别结果对应的待识别证件图像;
[0022]将所述待识别证件图像作为训练样本,所述第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。
[0023]可选地,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:
[0024]确定未被用于模型训练的第二字符识别结果的数量;
[0025]当所述数量达到预设阈值时,将与所述未被用于模型训练的第二字符识别结果对应的待识别证件图像作为训练样本,所述未被用于模型训练的第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。
[0026]可选地,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:
[0027]将所述第二字符识别结果作为所述待识别证件图像的标签,并确定所述第一字符识别结果与所述标签的差异;
[0028]以减小所述差异为训练目标,对所述字符识别模型进行训练。
[0029]可选地,所述方法还包括:
[0030]若所述用户未修改所述第一字符识别结果,则根据所述第一字符识别结果,执行所述业务请求对应的业务;
[0031]若所述用户修改所述第一字符识别结果,则根据所述第二字符识别结果,执行所述业务请求对应的业务。
[0032]本说明书提供了一种模型训练的装置,所述装置包括:
[0033]图像获取模块,用于获取用户发送的待识别证件图像;
[0034]第一字符识别结果获取模块,用于将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果;
[0035]判断模块,用于判断所述用户是否修改所述第一字符识别结果;
[0036]第二字符识别结果获取模块,用于若是,则获取所述修改后的字符识别结果,作为第二字符识别结果;
[0037]训练模块,用于根据所述第二字符识别结果,对所述字符识别模型进行训练。
[0038]可选地,所述图像获取模块具体用于,响应于用户发送的业务请求,向所述用户返回用于输入用户信息的页面;响应于所述用户在所述页面中执行的上传操作,获取所述用户发送的待识别证件图像
[0039]可选地,所述判断模块具体用于,将所述第一字符识别结果添加至所述页面中用于输入所述用户信息的位置,并展示;判断所述用户是否修改添加至所述位置的用户信息。
[0040]可选地,所述训练模块具体用于,确定当前时刻所在周期;若当前周期的结束时刻到来,获取当前周期内的所有第二字符识别结果及与所述第二字符识别结果对应的待识别证件图像;将所述待识别证件图像作为训练样本,所述第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。
[0041]可选地,所述训练模块具体用于,确定未被用于模型训练的第二字符识别结果的数量;当所述数量达到预设阈值时,将与所述未被用于模型训练的第二字符识别结果对应的待识别证件图像作为训练样本,所述未被用于模型训练的第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。
[0042]可选地,所述训练模块具体用于,将所述第二字符识别结果作为所述待识别证件
图像的标签,并确定所述第一字符识别结果与所述标签的差异;以减小所述差异为训练目标,对所述字符识别模型进行训练。
[0043]可选地,所述装置还包括:
[0044]业务执行模块,用于若所述用户未修改所述第一字符识别结果,则根据所述第一字符识别结果,执行所述业务请求对应的业务;若所述用户修改所述第一字符识别结果,则根据所述第二字符识别结果,执行所述业务请求对应的业务。
[0045]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
[0046]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
[0047]本说明书采用的上述至少一个技术方案能够达到以下有益效果:
[0048]从本说明书提供的模型训练的方法可以看出,由于对模型进行训练时,需要花费大量时间及计算资源获取训练样本及训练样本的标签,且获取的训练样本的质量影响模型训练完成后输出的结果的准确性。因此,通过获取用户在请求执行业务时发送的图像,得到高质量的训练样本,即待识别证件图像。由于经用户修改后的识别结果的准确性比未本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,所述方法包括:获取用户发送的待识别证件图像;将所述待识别证件图像输入预先训练的字符识别模型,获得第一字符识别结果;判断所述用户是否修改所述第一字符识别结果;若是,则获取所述修改后的字符识别结果,作为第二字符识别结果;根据所述第二字符识别结果,对所述字符识别模型进行训练。2.如权利要求1所述的方法,获取用户发送的待识别证件图像,具体包括:响应于用户发送的业务请求,向所述用户返回用于输入用户信息的页面;响应于所述用户在所述页面中执行的上传操作,获取所述用户发送的待识别证件图像。3.如权利要求2所述的方法,判断所述用户是否修改所述第一字符识别结果,具体包括:将所述第一字符识别结果添加至所述页面中用于输入所述用户信息的位置,并展示;判断所述用户是否修改添加至所述位置的用户信息。4.如权利要求1所述的方法,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:确定当前时刻所在周期;若当前周期的结束时刻到来,获取当前周期内的所有第二字符识别结果及与所述第二字符识别结果对应的待识别证件图像;将所述待识别证件图像作为训练样本,所述第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。5.如权利要求1所述的方法,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:确定未被用于模型训练的第二字符识别结果的数量;当所述数量达到预设阈值时,将与所述未被用于模型训练的第二字符识别结果对应的待识别证件图像作为训练样本,所述未被用于模型训练的第二字符识别结果作为所述待识别证件图像的标签,对所述字符识别模型进行训练。6.如权利要求1所述的方法,根据所述第二字符识别结果,对所述字符识别模型进行训练,具体包括:将所述第二字符识别结果作为所述待识别证件图像的标签,并确定所述第一字符识别结果与所述标签的差异;以减小所述差异为训练目标,对所述字符识别模型进行训练。7.如权利要求3所述的方法,所述方法还包括:若所述用户未修改所述第一字符识别结果,则根据所述第一字符识别结果,执行所述业务请求对应的业务;若所述用户修改所述第一字符识别结果,则根据所述第二字符识别结果,执行所述业务请求对应的业务。8.一种模型训练的装置,所述装置包括:图像获取模块,用于获取用户发送的待识别证件图像;
第一字符识别结果获取模块,用于将所...

【专利技术属性】
技术研发人员:唐董琦李若愚刘健
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1