System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本识别方法、装置、存储介质及电子设备制造方法及图纸_技高网

一种文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:41236991 阅读:3 留言:0更新日期:2024-05-09 23:50
本说明书公开了一种文本识别方法、装置、存储介质及电子设备。在本说明书提供的文本识别方法中,获取待识别的文本图像,并按照预设的划分规则对所述文本图像进行划分,得到所述文本图像的分块图像;针对所述文本图像的每个分块图像,将该分块图像输入预先训练的识别模型;通过所述识别模型的特征提取子网,提取该分块图像的图像特征;通过所述识别模型的特征处理子网,根据所述图像特征,确定该分块图像的文本特征;通过所述识别模型的输出子网,根据所述文本特征,输出该分块图像的识别结果;根据所述识别结果,确定该分块图像中包含的字符;根据各分块图像中包含的字符,确定并输出所述文本图像中包含的文本内容。

【技术实现步骤摘要】

本说明书涉及图像处理,尤其涉及一种文本识别方法、装置、存储介质及电子设备


技术介绍

1、光学字符识别(optical character recognition,ocr)技术是一种较为常见的文本识别技术,通过采集包含文本的图像,识别图像中的文本。如今,随着深度学习技术的不断发展,ocr技术已经在诸多场景中有着较为成熟的应用。

2、但目前,现有的基于ocr实现的文本识别技术仅能够快速有效地识别规则文本,当识别对象中存在不规则文本,例如弯曲、变形、模糊、残缺的文本时,现有的文本识别技术所识别出的结果并不够准确,常常会出现误识别的情况。

3、因此,如何较为准确地识别不规则文本是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种文本识别方法、装置、存储介质及电子设备,以至少部分地解决现有技术存在的上述问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种文本识别方法,包括:

4、获取待识别的文本图像,并按照预设的划分规则对所述文本图像进行划分,得到所述文本图像的分块图像;

5、针对所述文本图像的每个分块图像,将该分块图像输入预先训练的识别模型;

6、通过所述识别模型的特征提取子网,提取该分块图像的图像特征;

7、通过所述识别模型的特征处理子网,根据所述图像特征,确定该分块图像的文本特征;

8、通过所述识别模型的输出子网,根据所述文本特征,输出该分块图像的识别结果;p>

9、根据所述识别结果,确定该分块图像中包含的字符;

10、根据各分块图像中包含的字符,确定并输出所述文本图像中包含的文本内容。

11、可选地,所述特征提取子网中包含提取层、下采样层、上采样层;

12、通过所述识别模型的特征提取子网,提取该分块图像的图像特征,包括:

13、通过所述特征提取子网中的提取层,提取该分块图像的原始特征;

14、通过所述特征提取子网中的下采样层,对该分块图像的原始特征进行下采样,得到该分块图像的下采样特征;

15、通过所述特征提取子网中的上采样层,对该分块图像的下采样特征进行上采样,得到该分块图像的图像特征。

16、可选地,输出该分块图像的识别结果,包括:

17、输出该分块图像中包含的字符属于各预设的标准字符的概率,其中,所述标准字符包括完整字符和残缺字符。

18、可选地,预设标准字符,包括:

19、确定字符库中各字符的完整字符和残缺字符,作为标准字符,每个字符的完整字符和残缺字符相对应;

20、预设标准特征,包括:

21、针对所述字符库中的每个字符,将该字符的完整字符的字符图像输入所述识别模型,以通过所述识别模型的特征提取子网,提取该字符的完整字符的字符图像的图像特征,作为标准特征。

22、可选地,分块图像中包含的字符为完整字符或残缺字符;

23、根据各分块图像中包含的字符,确定并输出所述文本图像中包含的文本内容,包括:

24、当该分块图像中包含残缺字符时,根据该分块图像的图像特征,以及预设的标准特征,确定该分块图像中包含的残缺字符的残缺程度;

25、根据各分块图像中包含的字符以及所述残缺程度,确定并输出所述文本图像中包含的文本内容。

26、可选地,根据该分块图像的图像特征,以及预设的标准特征,确定该分块图像中包含的残缺字符的残缺程度,包括:

27、确定该分块图像中包含的残缺字符所对应的完整字符;

28、确定该分块图像中包含的残缺字符所对应的完整字符的图像特征与该分块图像的图像特征之间的距离,作为该分块图像中包含的残缺字符的残缺程度。

29、可选地,根据各分块图像中包含的字符以及所述残缺程度,确定并输出所述文本图像中包含的文本内容,包括:

30、根据各分块图像中包含的字符,确定所述文本图像中包含的文本内容;

31、输出所述文本内容,并输出所述文本内容中的每个残缺字符的残缺程度。

32、可选地,预先训练识别模型,包括:

33、获取样本图像,并按照预设的划分规则对所述样本图像进行划分,得到所述样本图像的样本分块图像;

34、根据各样本分块图像中包含的真实字符,确定各样本分块图像的标注,所述真实字符包含完整真实字符和残缺真实字符;

35、针对所述样本图像的每个样本分块图像,将该样本分块图像输入待训练的识别模型;

36、通过所述识别模型的特征提取子网,提取该样本分块图像的待优化图像特征;

37、通过所述识别模型的特征处理子网,根据所述待优化图像特征,确定该样本分块图像的待优化文本特征;

38、通过所述识别模型的输出子网,根据所述待优化文本特征,输出该样本分块图像的待优化识别结果;

39、以所述待优化识别结果与所述标注之间的差异最小为优化目标,对所述识别模型进行训练。

40、可选地,所述特征提取子网中至少包含二值化网络层;所述方法还包括:

41、获取该样本分块图像的标注二值化图像;

42、将所述待优化图像特征输入所述二值化网络层,得到所述二值化网络层输出的待优化二值化特征;

43、根据所述待优化二值化特征确定该样本分块图像的待优化二值化图像;

44、以所述待优化识别结果与所述标注之间的差异最小为优化目标,对所述识别模型进行训练,包括:

45、以所述待优化识别结果与所述标注之间的差异最小,以及所述待优化二值化图像与所述标注二值化图像之间的差异最小为优化目标,对所述识别模型进行训练。

46、可选地,所述特征提取子网中还包含提取层、下采样层、上采样层;

47、通过所述识别模型的特征提取子网,提取该样本分块图像的待优化图像特征,包括:

48、通过所述提取层,提取该样本分块图像的待优化原始特征;

49、通过所述下采样层,对所述待优化原始特征进行下采样,得到该样本分块图像的待优化下采样特征;

50、通过所述上采样层,对所述待优化下采样特征进行上采样,得到该样本分块图像的待优化图像特征;

51、根据所述待优化二值化特征确定该样本分块图像的待优化二值化图像,包括:

52、对所述待优化二值化特征与所述待优化下采样特征进行融合,得到融合二值化特征;

53、根据所述融合二值化特征确定该样本分块图像的待优化二值化图像。

54、本说明书提供的一种文本识别的装置,所述装置包括:

55、获取模块,用于获取待识别的文本图像,并按照预设的划分规则对所述文本图像进行划分,得到所述文本图像的分块图像;

56、输入模块,用于针对所述文本图像的每个分块图像,将该分块图像输入预先训练的识别模型;<本文档来自技高网...

【技术保护点】

1.一种文本识别方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述特征提取子网中包含提取层、下采样层、上采样层;

3.如权利要求1所述的方法,其特征在于,输出该分块图像的识别结果,包括:

4.如权利要求3所述的方法,其特征在于,预设标准字符,包括:

5.如权利要求4所述的方法,其特征在于,分块图像中包含的字符为完整字符或残缺字符;

6.如权利要求5所述的方法,其特征在于,根据该分块图像的图像特征,以及预设的标准特征,确定该分块图像中包含的残缺字符的残缺程度,包括:

7.如权利要求5所述的方法,其特征在于,根据各分块图像中包含的字符以及所述残缺程度,确定并输出所述文本图像中包含的文本内容,包括:

8.如权利要求1所述的方法,其特征在于,预先训练识别模型,包括:

9.如权利要求8所述的方法,其特征在于,所述特征提取子网中至少包含二值化网络层;所述方法还包括:

10.如权利要求9所述的方法,其特征在于,所述特征提取子网中还包含提取层、下采样层、上采样层;>

11.一种文本识别装置,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~10任一项所述的方法。

13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~10任一项所述的方法。

...

【技术特征摘要】

1.一种文本识别方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述特征提取子网中包含提取层、下采样层、上采样层;

3.如权利要求1所述的方法,其特征在于,输出该分块图像的识别结果,包括:

4.如权利要求3所述的方法,其特征在于,预设标准字符,包括:

5.如权利要求4所述的方法,其特征在于,分块图像中包含的字符为完整字符或残缺字符;

6.如权利要求5所述的方法,其特征在于,根据该分块图像的图像特征,以及预设的标准特征,确定该分块图像中包含的残缺字符的残缺程度,包括:

7.如权利要求5所述的方法,其特征在于,根据各分块图像中包含的字符以及所述残缺程度,确定并输出所述文本图像中包含的文本内容,包括...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:摩尔线程智能科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1