【技术实现步骤摘要】
文本识别模型的训练方法、装置和电子设备
[0001]本公开涉及图像处理
,尤其涉及文本识别模型的训练方法、装置和电子设备。
技术介绍
[0002]在文本识别场景中,需要对文本图像中包含的文本(如字母、阿拉伯数字)进行识别,如对包含手写体的文本图像进行识别,或者对包含车牌的文本图像进行识别。相关技术中,文本图像由于相机焦距、目标移动以及拍摄者的微运动等因素,导致实际拍摄的文本图像出现模糊的情况。如此,在对模糊的文本图像进行文本识别时,会出现无法准确识别该模糊的文本图像中包含的文本内容,导致文本识别的准确率较低的情况,用户的体验较差。
技术实现思路
[0003]有鉴于此,本公开提供了文本识别模型的训练方法、装置和电子设备,用于解决现有技术在对模糊的文本图像进行文本识别时,会出现无法准确识别该模糊的文本图像中包含的文本,导致文本识别的准确率较低的问题。
[0004]为了实现上述目的,本公开提供技术方案如下:第一方面,本公开提供一种文本识别模型的训练方法,包括:将源域数据和目标域数据输入至预设识别模型中 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别模型的训练方法,其特征在于,包括:将源域数据和目标域数据输入至预设识别模型中进行识别,确定所述源域数据的第一识别结果、所述目标域数据的第二识别结果、所述源域数据对应的第一字符特征集合,和所述目标域数据对应的第二字符特征集合;其中,所述源域数据和所述目标域数据包括相同的文本内容,所述源域数据的分辨率大于所述目标域数据的分辨率;对所述源域数据对应的第一字符特征集合,和所述目标域数据对应的第二字符特征集合中同一类的字符特征进行特征域适应,确定最大均值差异损失值;对所述源域数据对应的第一字符特征集合,和所述目标域数据对应的第二字符特征集合中每个字符特征进行字符特征适应,确定相对熵散度;根据所述第一识别结果、所述第二识别结果、所述最大均值差异损失值和所述相对熵散度,对所述预设识别模型进行监督训练,直到所述预设识别模型收敛,得到所述文本识别模型。2.根据权利要求1所述的文本识别模型的训练方法,其特征在于,所述根据所述第一识别结果、所述第二识别结果、所述最大均值差异损失值和所述相对熵散度,对所述预设识别模型进行监督训练,直到所述预设识别模型收敛,得到所述文本识别模型,包括:根据所述第一识别结果和所述第二识别结果,确定所述预设识别模型的识别损失值;根据所述识别损失值、所述最大均值差异损失值和所述相对熵散度,确定所述预设识别模型的实际损失值;在所述实际损失值大于或等于损失阈值的情况下,返回执行将源域数据和目标域数据输入至预设识别模型中进行识别,得到实际损失值,直到所述实际损失值小于所述损失阈值的情况下,确定所述预设识别模型收敛,得到所述文本识别模型。3.根据权利要求1所述的文本识别模型的训练方法,其特征在于,一类字符特征包括一个或者多个字符特征;所述对所述源域数据对应的第一字符特征集合,和所述目标域数据对应的第二字符特征集合中同一类的字符特征进行特征域适应,确定最大均值差异损失值,包括:根据所述第一字符特征集合,确定所述第一字符特征集合中每一类字符特征对应的目标质心;根据所述第二字符特征集合,确定所述第二字符特征集合中每一类字符特征对应的目标质心;根据所述第一字符特征集合中每一类字符特征对应的目标质心和所述第二字符特征集合中每一类字符特征对应的目标质心,确定最大均值差异损失值。4.根据权利要求3所述的文本识别模型的训练方法,其特征在于,针对同一类字符特征,确定所述同一类字符特征的目标质心的步骤如下:获取所述同一类字符特征中每一个字符特征对应的字符矩阵;根据所述同一类字符特征中每一个字符特征对应的字符矩阵,确定所述同一类字符特征的目标质心。5.根据权利要求4所述的文本识别模型的训练方法,其特征在于,所述方法还包括:获取所述同一类字符特征在上一训练周期的目标质心,以及所述同一类字符特征在当前训练周期的候选质心;根据所述同一类字符特征在上一训练周期的目标质心和所述同一类字符特征在当前
训练周期的候选质心,确定所述同一类字符特征在当前训练周期目标质心。6.根据权利要求1所述的文本识别模型的训练方法,其特征在于,所述对所述源域数据对应的第一字符特征集合,和所述目标域数据对应的第二字符特征集合中每个字符...
【专利技术属性】
技术研发人员:潘贞汝,冀志龙,刘永强,白锦峰,
申请(专利权)人:北京世纪好未来教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。