一种字符识别的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39050821 阅读:10 留言:0更新日期:2023-10-12 19:43
本说明书公开了一种字符识别的方法、装置、存储介质和电子设备,先将待分割图像输入预先训练的字符分割模型,确定单字符图像,再输入特征提取模型,以确定该单字符图像的图像特征,对该待编码字符进行编码,得到对应的字符编码,并,建立该图像特征与该字符编码的编码对应关系,将该编码对应关系添加至预先建立的字符图像特征库中,当接收到用户发送的待识别字符图像时,在该字符图像特征库中,确定与待识别字符图像的图像特征匹配的图像特征,以确定对应的字符编码及识别待识别字符。本方法通过根据待编码字符的图像特征,对该待编码字符进行编码,以根据该图像特征识别待识别字符图像中所包含的字符,提高了字符识别的正确率。率。率。

【技术实现步骤摘要】
一种字符识别的方法、装置、存储介质及电子设备


[0001]本说明书涉及图像处理,尤其涉及一种字符识别的方法、装置、存储介质及电子设备。

技术介绍

[0002]随着智能识别技术的发展,人们可以通过各类电子设备提取图像中的文字,例如,用户利用手机拍摄照片,并提取照片中包含的文字,其中,该文字可能包含用户的隐私信息。由于现存的字符编码主要包括主流语种的字符编码,而非主流语种的字符编码较少,因此在提取图像中的文字时,当待识别文字的语种为主流语种时,如汉语、英语等,经识别提取的文字结果会比较准确,但当待识别文字为非主流语种时,经识别提取的文字的准确性就会比较低。
[0003]基于此,本说明书提供一种字符识别的方法,对字符进行编码,提高非主流语种的字符识别结果的准确率。

技术实现思路

[0004]本说明书提供一种字符识别的方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
[0005]本说明书采用下述技术方案:
[0006]本说明书提供一种字符识别的方法,包括:
[0007]获取包含待编码字符的待分割图像;
[0008]将所述待分割图像输入预先训练的字符分割模型,以根据所述字符分割模型输出的结果,确定所述待分割图像中的单字符图像;
[0009]针对每个单字符图像,将该单字符图像输入预先训练的特征提取模型,以根据所述特征提取模型输出的结果,确定该单字符图像的图像特征;
[0010]根据所述图像特征,对所述待编码字符进行编码,得到所述待编码字符对应的字符编码;并,建立所述图像特征与所述字符编码的编码对应关系;将所述编码对应关系添加至预先建立的字符图像特征库中;
[0011]当接收到用户发送的待识别字符图像时,确定所述待识别字符图像的图像特征,作为第一图像特征;
[0012]在所述字符图像特征库中,确定与所述第一图像特征匹配的图像特征,作为第二图像特征;并,根据所述第二图像特征,确定所述第二图像特征对应的字符编码,以识别所述待识别字符图像包含的字符。
[0013]可选地,将该单字符图像输入预先训练的特征提取模型,具体包括:
[0014]对该单字符图像进行二值化处理;
[0015]将二值化处理后的单字符图像输入预先训练的特征提取模型。
[0016]可选地,将所述编码对应关系添加至预先建立的字符图像特征库中,具体包括:
[0017]建立所述字符编码与所述待编码字符的字符对应关系;
[0018]将所述字符对应关系及所述编码对应关系添加至预先建立的字符图像特征库中。
[0019]可选地,确定与所述第一图像特征匹配的图像特征,具体包括:
[0020]根据所述第一图像特征,确定与所述第一图像特征的相似度大于预设相似度阈值的图像特征,作为相似图像特征;
[0021]在所述相似图像特征中,确定与所述第一图像特征相似度最高的图像特征。
[0022]可选地,识别所述待识别字符图像包含的字符,具体包括:
[0023]根据所述第二图像特征对应的字符编码及所述字符对应关系,确定所述待识别字符图像包含的字符。
[0024]可选地,所述方法还包括:
[0025]将若干个字符编码进行融合,得到字符串编码;并,将所述若干个字符编码对应的图像特征进行融合,得到字符串图像特征;
[0026]建立所述字符串图像特征与所述字符串编码的对应关系,作为字符串对应关系;
[0027]将所述字符串对应关系添加至预先建立的字符图像特征库中。
[0028]可选地,训练所述字符分割模型,具体包括:
[0029]获取文本行合成图像,并确定所述文本行合成图像中的真实单字符间距,作为第一标签;
[0030]将所述文本行合成图像输入字符分割模型,确定所述字符分割模型输出的待优化单字符间距;
[0031]根据所述第一标签及所述待优化单字符间距,对所述字符分割模型进行预训练。
[0032]可选地,获取文本行合成图像,具体包括:
[0033]获取若干个单字符;
[0034]按照预设排版规则,对所述若干个单字符进行排版,并渲染,得到文本行合成图像。
[0035]可选地,所述方法还包括:
[0036]获取样本文本行图像以及所述样本文本行图像对应的样本单字符图像,并将所述样本单字符图像作为第二标签;
[0037]将所述样本文本行图像输入所述字符分割模型,确定所述字符分割模型输出的待优化单字符图像;
[0038]确定所述第二标签及所述待优化单字符图像的差异;
[0039]根据所述差异,对所述字符分割模型进行调整训练。
[0040]本说明书提供了一种字符识别的装置,所述装置包括:
[0041]待分割图像获取模块,用于获取包含待编码字符的待分割图像;
[0042]单字符图像获取模块,用于将所述待分割图像输入预先训练的字符分割模型,以根据所述字符分割模型输出的结果,确定所述待分割图像中的单字符图像;
[0043]图像特征确定模块,用于针对每个单字符图像,将该单字符图像输入预先训练的特征提取模型,以根据所述特征提取模型输出的结果,确定该单字符图像的图像特征;
[0044]编码确定模块,用于根据所述图像特征,对所述待编码字符进行编码,得到所述待编码字符对应的字符编码;并,建立所述图像特征与所述字符编码的编码对应关系;将所述
编码对应关系添加至预先建立的字符图像特征库中;
[0045]待识别特征确定模块,用于当接收到用户发送的待识别字符图像时,确定所述待识别字符图像的图像特征,作为第一图像特征;
[0046]特征匹配模块,用于在所述字符图像特征库中,确定与所述第一图像特征匹配的图像特征,作为第二图像特征;并,根据所述第二图像特征,确定所述第二图像特征对应的字符编码,以识别所述待识别字符图像包含的字符。
[0047]可选地,所述图像特征确定模块具体用于,对该单字符图像进行二值化处理;将二值化处理后的单字符图像输入预先训练的特征提取模型。
[0048]可选地,所述编码确定模块具体用于,建立所述字符编码与所述待编码字符的字符对应关系;将所述字符对应关系及所述编码对应关系添加至预先建立的字符图像特征库中。
[0049]可选地,所述特征匹配模块具体用于,根据所述第一图像特征,确定与所述第一图像特征的相似度大于预设相似度阈值的图像特征,作为相似图像特征;在所述相似图像特征中,确定与所述第一图像特征相似度最高的图像特征。
[0050]可选地,所述特征匹配模块具体用于,根据所述第二图像特征对应的字符编码及所述字符对应关系,确定所述待识别字符图像包含的字符。
[0051]可选地,所述装置还包括:
[0052]字符串编码模块,用于将若干个字符编码进行融合,得到字符串编码;并,将所述若干个字符编码对应的图像特征进行融合,得到字符串图像特征;建立所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别的方法,所述方法包括:获取包含待编码字符的待分割图像;将所述待分割图像输入预先训练的字符分割模型,以根据所述字符分割模型输出的结果,确定所述待分割图像中的单字符图像;针对每个单字符图像,将该单字符图像输入预先训练的特征提取模型,以根据所述特征提取模型输出的结果,确定该单字符图像的图像特征;根据所述图像特征,对所述待编码字符进行编码,得到所述待编码字符对应的字符编码;并,建立所述图像特征与所述字符编码的编码对应关系;将所述编码对应关系添加至预先建立的字符图像特征库中;当接收到用户发送的待识别字符图像时,确定所述待识别字符图像的图像特征,作为第一图像特征;在所述字符图像特征库中,确定与所述第一图像特征匹配的图像特征,作为第二图像特征;并,根据所述第二图像特征,确定所述第二图像特征对应的字符编码,以识别所述待识别字符图像包含的字符。2.如权利要求1所述的方法,将该单字符图像输入预先训练的特征提取模型,具体包括:对该单字符图像进行二值化处理;将二值化处理后的单字符图像输入预先训练的特征提取模型。3.如权利要求1所述的方法,将所述编码对应关系添加至预先建立的字符图像特征库中,具体包括:建立所述字符编码与所述待编码字符的字符对应关系;将所述字符对应关系及所述编码对应关系添加至预先建立的字符图像特征库中。4.如权利要求1所述的方法,确定与所述第一图像特征匹配的图像特征,具体包括:根据所述第一图像特征,确定与所述第一图像特征的相似度大于预设相似度阈值的图像特征,作为相似图像特征;在所述相似图像特征中,确定与所述第一图像特征相似度最高的图像特征。5.如权利要求3所述的方法,识别所述待识别字符图像包含的字符,具体包括:根据所述第二图像特征对应的字符编码及所述字符对应关系,确定所述待识别字符图像包含的字符。6.如权利要求1所述的方法,所述方法还包括:将若干个字符编码进行融合,得到字符串编码;并,将所述若干个字符编码对应的图像特征进行融合,得到字符串图像特征;建立所述字符串图像特征与所述字符串编码的对应关系,作为字符串对应关系;将所述字符串对应关系添加至预先建立的字符图像特征库中。7.如权利要求1所述的方法,训练所述字符分割模型,具体包括:获取文本行合成图像,并确定所述文本行合成图像中的真实单字符间距,作为第一标签;将所述文本行合成图像输入字符分割模型,确定所述字符分割模型输出的待优化单字符间距;
根据所述第一标签及所述待优化单字符间距,对所述字符分割模型进行预训练。8.如权利要求7所述的方法,获取文本行合成图像,具体包括:获取若干个单字符;按照预设排版规则,对所述若干个单字符进行排版,并渲染,得到文本行合成图像。9.如权利要求7所述的方法,所述方法还包括:获取样本文本行图像以及所述样本文本行图像对应的样本单字符图像,并将所述样本单字符图像作为第二标签;将所述样本文本行图像输入所述字符分割模型,确定所述字符分割模型输出的待优化单字符图像;确定所述第二标签及所述待优化单字符图像的差异;根据所述差异,对所述字符分割模型进行调整训练。10.一种字符识别的装置,所述装置包括:待分割图像获取模块,用于获取包含待编码字符的待分割图像;单字符图像获取模块,用于将所述待分割图像输入预先训练的字符分割模型,以根据所述字符分割模型输出的结果,确定所述待分割...

【专利技术属性】
技术研发人员:曾凡伟刘健
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1