【技术实现步骤摘要】
模型训练方法、图像识别方法、装置、设备及存储介质
本申请涉及一种数据处理技术,尤其涉及一种模型训练方法、图像识别方法及装置、设备及存储介质。
技术介绍
在实际应用中,比如在拍照批改数学题,或拍照搜题等人工智能应用场景中,由于书写者的笔迹与标准体之间存在差距,因此,有效识别题目答案或有效搜题的难度被放大,因此,如何有效识别出书写者的笔记,尤其是被书写者涂改、勾划、涂抹等操作后的难以辨识的笔记,成为字符图像识别领域中亟待解决的问题。
技术实现思路
本申请实施例提供一种模型训练方法、图像识别方法、装置、设备及存储介质,以解决相关技术存在的问题,技术方案如下:第一方面,本申请实施例提供了一种模型训练方法,包括:获取第一训练样本,其中,所述第一训练样本包含有符合预设书写规则的第一手写字符图像;获取第二训练样本,其中,所述第二训练样本包含有不符合预设书写规则的第二手写字符图像;至少将字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,得到融合处理后的训练字符图像; ...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n获取第一训练样本,其中,所述第一训练样本包含有符合预设书写规则的第一手写字符图像;/n获取第二训练样本,其中,所述第二训练样本包含有不符合预设书写规则的第二手写字符图像;/n至少将字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,得到融合处理后的训练字符图像;/n利用融合处理后得到的所述训练字符图像对预设字符识别模型进行训练,以得到训练完成后的所述预设字符识别模型,其中,训练完成后的所述预设字符识别模型能够对不符合预设书写规则的手写字符图像进行字符内容识别。/n
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
获取第一训练样本,其中,所述第一训练样本包含有符合预设书写规则的第一手写字符图像;
获取第二训练样本,其中,所述第二训练样本包含有不符合预设书写规则的第二手写字符图像;
至少将字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,得到融合处理后的训练字符图像;
利用融合处理后得到的所述训练字符图像对预设字符识别模型进行训练,以得到训练完成后的所述预设字符识别模型,其中,训练完成后的所述预设字符识别模型能够对不符合预设书写规则的手写字符图像进行字符内容识别。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取所述第一训练样本中所述第一手写字符图像所对应的梯度图像;
其中,所述至少将字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,包括:
将字符内容相同的所述第一手写字符图像、所述第二手写字符图像,以及所述第一手写字符图像的梯度图像进行图像融合处理,得到融合处理后的训练字符图像。
3.根据权利要求1所述的方法,其特征在于,所述至少将字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,包括:
获取预先设置的超参数;
基于预先设置的超参数得到所述第一手写字符图像和所述第二手写字符图像各自对应的权重;
基于所述第一手写字符图像的像素特征、所述第二手写字符图像的像素特征,以及所述第一手写字符图像和第二手写字符图像各自对应的权重,对所述字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一手写字符图像的像素特征、所述第二手写字符图像的像素特征,以及所述第一手写字符图像和第二手写字符图像各自对应的权重,对所述字符内容相同的所述第一手写字符图像和所述第二手写字符图像进行图像融合处理,包括:
获取所述第一训练样本中所述第一手写字符图像所对应的梯度图像;
基于预先设置的超参数得到所述第一手写字符图像所对应的梯度图像的权重;
基于所述第一手写字符图像的像素特征、所述第二手写字符图像的像素特征、所述第一手写字符图像所对应的梯度图像的像素特征,以及所述第一手写字符图像、所述第二手写字符图像和所述第二手写字符图像的梯度图像各自对应的权重,将字符内容相同的所述第一手写字符图像、所述第二手写字符图像,以及所述第一手写字符图像的梯度图像进行图像融合处理。
5.根据权利要求3或4所述的方法,其特征在于,对所述预设字符识别模型进行训练的过程至少包括第一阶段和第二阶段,其中,所述第一阶段与所述第二阶段中超参数取值不同。
6.根据权利要求1所述的方法,其特征在于,所述利用融合处理后得到的所述训练字符图像对预设字符识别模型进行训练,包括:
获取所述训练字符图像的字符内容在所述第一训练样本和所述第二训练样本所对应的所有字符内容中的占比;
基于所述占比,确定出所述训练字符图像所对应的融合标签;
利用所述融合标签对所述训练字符图像进行标定,利用标定处理后的所述训练字符图像对所述预设字符识别模型进行训练。
7.根据权利要求6所述的方法,其特征在于,所述融合标签采用目标向量表征,其中,所述目标向量的数位能够表征所述训练字符图像的字符内容,不同的字符内容通过不同的数位来表征。
8.根据权利要求7所述的方法,其特征在于,所述基于所述占比,确定出所述训练字符图像所对应的融合标签,包括:
获取用于表征字符内容的数位的初始值;
将所述初始值与所述占比进行乘积处理后,得到所述目标向量中表征字符内容的数位的数值,以得到所述目标向量,其中,所述目标向量中表征字符内容的数位与未表征字符内容的数位的数值不同;
将得到的所述目标向量作为所述训练字符图像所对应的融合标签。
9.一种字符图像识别方法,其特征在于,包括:
获取待识别的目标字符图像,其中,所述目标字符图像为不符合预设书写规则的手写字符图像;
将所述目标字符图像输入至预设字符识别模型,以对所述目标字符图像的字符内容进行识别,并确定出所述目标字符图像的字符内容;
其中,所述预设字符识别模型为权利要求1至8任一项方法训练得到的模型。
10.一种模型训练装置,其特征在于,包括:
第一样本获取单元,用于获取第一训练样本,其中,所述第一训练样本包含有符合预设书写规则的第一手写字符图像;
第二样本获取单...
【专利技术属性】
技术研发人员:秦勇,
申请(专利权)人:北京易真学思教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。