图片文字识别方法及装置制造方法及图纸

技术编号：39742230 阅读：7 留言：0更新日期：2023-12-17 23:42

本公开是关于一种图片文字识别方法及装置

全部详细技术资料下载

【技术实现步骤摘要】
图片文字识别方法及装置、电子设备、存储介质

[0001]本公开涉及图像识别
，具体而言，涉及一种图片文字识别方法及装置
、
电子设备
、
存储介质
。

技术介绍

[0002]在电子设备或者网络中，文字数据往往以文本形式或者图片形式存在
。
文本形式的文字在处理和传输中具有方便快捷的优势，而图片形式的文字在进一步的编辑
、
处理和传输等过程中存在诸多的不便
。
目前，为了对图片文字进行编辑和处理时，往往需要通过扫描等方式将图片文字转换为文本文字，该方式存在识别准确率较低的问题
。
[0003]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息
。

技术实现思路

[0004]本公开的目的在于提供一种图片文字识别方法及装置
、
电子设备
、
存储介质，进而至少一定程度上提升文字识别的准确率
。
[0005]根据本公开的第一方面，提供一种图片文字识别方法，所述图片文字识别方法包括：
[0006]获取初始图像，所述初始图像中具有文字；
[0007]基于基准坐标系对所述初始图像进行配准，得到配准图像；
[0008]根据所述配准图像中的纹理，确定所述配准图像中文字的行间距及列间距；
[0009]利用所述行间距及列间距，将所述配准图像分割为至

【技术保护点】

【技术特征摘要】
1.
一种图片文字识别方法，其特征在于，所述图片文字识别方法包括：获取初始图像，所述初始图像中具有文字；基于基准坐标系对所述初始图像进行配准，得到配准图像；根据所述配准图像中的纹理，确定所述配准图像中文字的行间距及列间距；利用所述行间距及列间距，将所述配准图像分割为至少一个文字子块，所述文字子块中包括一个文字；对比文字子块中的文字图像和文字库中的文字图像，以实现对文字子块中文字的识别
。2.
如权利要求1所述的图片文字识别方法，其特征在于，基于基准坐标系对所述初始图像进行配准，包括：根据所述基准坐标系和所述初始图像确定基准图像，并获取所述基准图像的一维矩阵；将所述初始图像二值化，并获取所述初始图像的一维矩阵根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数；利用所述配准参数对所述初始图像进行配准
。3.
如权利要求2所述的图片文字识别方法，其特征在于，根据所述初始图像的一维矩阵和所述基准图像的一维矩阵确定配准参数，包括：在所述初始图像中选取至少一个第一特征点；在所述基准图像中选取和所述第一特征点匹配的第二特征点；根据所述第一特征点的坐标和所述第二特征点的坐标确定所述配准参数
。4.
如权利要求1所述的图片文字识别方法，其特征在于，根据所述配准图像中的行间纹理，确定所述配准图像中文字的行间距，包括：根据所述配准图像中每个像素行中背景像素的数量，确定所述像素行为背景像素行或者文字像素行；获取所述配准图像中连续的所述文字像素行的数量；根据所述配准图像中连续的所述文字像素行的数量确定所述行间距
。5.
如权利要求4所述的图片文字识别方法，其...

【专利技术属性】
技术研发人员：杨杰，李波，白月，许驰，程蕾，
申请(专利权)人：西安雷通科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人