图片文字识别方法及装置制造方法及图纸

技术编号:39742230 阅读:7 留言:0更新日期:2023-12-17 23:42
本公开是关于一种图片文字识别方法及装置

【技术实现步骤摘要】
图片文字识别方法及装置、电子设备、存储介质


[0001]本公开涉及图像识别
,具体而言,涉及一种图片文字识别方法及装置

电子设备

存储介质


技术介绍

[0002]在电子设备或者网络中,文字数据往往以文本形式或者图片形式存在

文本形式的文字在处理和传输中具有方便快捷的优势,而图片形式的文字在进一步的编辑

处理和传输等过程中存在诸多的不便

目前,为了对图片文字进行编辑和处理时,往往需要通过扫描等方式将图片文字转换为文本文字,该方式存在识别准确率较低的问题

[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息


技术实现思路

[0004]本公开的目的在于提供一种图片文字识别方法及装置

电子设备

存储介质,进而至少一定程度上提升文字识别的准确率

[0005]根据本公开的第一方面,提供一种图片文字识别方法,所述图片文字识别方法包括:
[0006]获取初始图像,所述初始图像中具有文字;
[0007]基于基准坐标系对所述初始图像进行配准,得到配准图像;
[0008]根据所述配准图像中的纹理,确定所述配准图像中文字的行间距及列间距;
[0009]利用所述行间距及列间距,将所述配准图像分割为至少一个文字子块,所述文字子块中包括一个文字;
[0010]对比文字子块中的文字和文字库中的文字,以实现对文字子块中文字的识别

[0011]在本公开一可行的实施方式中,基于基准坐标系对所述初始图像进行配准,包括:
[0012]根据所述基准坐标系和所述初始图像确定基准图像,并获取所述基准图像的一维矩阵;
[0013]将所述初始图像二值化,并获取所述初始图像的一维矩阵

[0014]根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数;
[0015]利用所述配准参数对所述初始图像进行配准

[0016]在本公开一可行的实施方式中,根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数,包括:
[0017]在所述初始图像中选取至少一个第一特征点;
[0018]在所述基准图像中选取和所述第一特征点匹配的第二特征点;
[0019]根据所述第一特征点的坐标和所述第二特征点的坐标确定所述配准参数

[0020]在本公开一可行的实施方式中,根据所述配准图像中的行间纹理,确定所述配准图像中文字的行间距,包括:
[0021]根据所述配准图像中每个像素行中背景像素的数量,确定所述像素行为背景像素行或者文字像素行;
[0022]获取所述配准图像中连续的所述文字像素行的数量;
[0023]根据所述配准图像中连续的所述文字像素行的数量确定所述行间距

[0024]在本公开一可行的实施方式中,确定所述配准图像中文字的列间距,包括:
[0025]将所述行间距设置为所述列间距

[0026]在本公开一可行的实施方式中,确定所述配准图像中文字的列间距,包括:
[0027]根据所述配准图像中每个像素列中背景像素的数量,确定所述像素列为背景像素列或者文字像素列;
[0028]获取所述配准图像中连续的所述文字像素列的数量;
[0029]根据所述配准图像中连续的所述文字像素列的数量确定所述列间距

[0030]在本公开一可行的实施方式中,所述对比文字子块中的文字和文字库中的文字,包括:
[0031]对所述文字子块中的图像进行聚类分割;
[0032]将文字子块的聚类分割结果和文字库中的图像进行相似度对比

[0033]根据本公开的第二方面,提供一种图片文字识别装置,所述图片文字识别装置包括:
[0034]获取模块,用于获取初始图像,所述初始图像中具有文字;
[0035]配准模块,用于基于基准坐标系对所述初始图像进行配准,得到配准图像;
[0036]确定模块,用于根据所述配准图像中的行间纹理,确定所述配准图像中文字的行间距及列间距;
[0037]分隔模块,用于利用所述行间距及列间距,将所述配准图像分割为至少一个文字子块,所述文字子块中包括一个文字;
[0038]对比模块,用于对比文字子块中的文字和文字库中的文字,以实现对文字子块中文字的识别

[0039]根据本公开的第三方面,提供一种电子设备,包括
[0040]处理器;以及
[0041]存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的方法

[0042]根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的方法

[0043]本公开实施例提供的图片文字识别方法,基于基准坐标系对初始图像进行配准,得到配准图像,根据配准图像中的纹理确定配准图像中文字的行间距和列间距,根据行间距及列间距将配准图像分割为文字子块,对比文字子块中的文字图像和文字库中的文字图像,实现了对文字块中的文字的识别

通过将图像文字分割为多个文字子块,对比文字子块中的图像和文字库,能够提升文字识别的准确性

[0044]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开

附图说明
[0045]通过参照附图来详细描述其示例实施例,本公开的上述和其它特征及优点将变得更加明显

[0046]图1为本公开示例性实施例提供的一种图片文字识别方法的流程图;
[0047]图
2A
为本公开示例性实施例提供的一种初始图像的示意图;
[0048]图
2B
为本公开示例性实施例提供的一种基准图像的示意图;
[0049]图
2C
为本公开示例性实施例提供的一种特征点匹配的示意图;
[0050]图
2D
为本公开示例性实施例提供的一种配准图像的示意图;
[0051]图
2E
为本公开示例性实施例提供的一种背景像素数量统计图;
[0052]图3为本公开示例性实施例提供的一种图片文字识别装置的示意图;
[0053]图4为本公开示例性实施例提供的一种电子设备的示意图;
[0054]图5为本公开示例性实施例提供的一种存储介质的示意图

具体实施方式
[0055]现在将参考附图更全面地描述示例实施例...

【技术保护点】

【技术特征摘要】
1.
一种图片文字识别方法,其特征在于,所述图片文字识别方法包括:获取初始图像,所述初始图像中具有文字;基于基准坐标系对所述初始图像进行配准,得到配准图像;根据所述配准图像中的纹理,确定所述配准图像中文字的行间距及列间距;利用所述行间距及列间距,将所述配准图像分割为至少一个文字子块,所述文字子块中包括一个文字;对比文字子块中的文字图像和文字库中的文字图像,以实现对文字子块中文字的识别
。2.
如权利要求1所述的图片文字识别方法,其特征在于,基于基准坐标系对所述初始图像进行配准,包括:根据所述基准坐标系和所述初始图像确定基准图像,并获取所述基准图像的一维矩阵;将所述初始图像二值化,并获取所述初始图像的一维矩阵根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数;利用所述配准参数对所述初始图像进行配准
。3.
如权利要求2所述的图片文字识别方法,其特征在于,根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数,包括:在所述初始图像中选取至少一个第一特征点;在所述基准图像中选取和所述第一特征点匹配的第二特征点;根据所述第一特征点的坐标和所述第二特征点的坐标确定所述配准参数
。4.
如权利要求1所述的图片文字识别方法,其特征在于,根据所述配准图像中的行间纹理,确定所述配准图像中文字的行间距,包括:根据所述配准图像中每个像素行中背景像素的数量,确定所述像素行为背景像素行或者文字像素行;获取所述配准图像中连续的所述文字像素行的数量;根据所述配准图像中连续的所述文字像素行的数量确定所述行间距
。5.
如权利要求4所述的图片文字识别方法,其...

【专利技术属性】
技术研发人员:杨杰李波白月许驰程蕾
申请(专利权)人:西安雷通科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1