图片的文字识别方法、设备及存储介质技术

技术编号：40219093 阅读：8 留言：0更新日期：2024-02-02 22:25

本发明专利技术涉及图像识别领域，公开了一种图片的文字识别方法、设备及存储介质。该方法包括：接收目标图片；对目标图片进行灰度化处理，生成灰度图片；根据预置灰度值切割算法，对灰度图片进行切割处理，得到切割图集和切割图集与灰度图片的切割映射关系；对切割图集进行尺寸归一化处理，得到每个图形尺寸一致的归一化切割图集；根据预置识别神经网络，对归一化切割图集进行字符识别处理，生成识别字符集和识别字符集与归一化切割图集的识别映射关系；基于切割映射关系和识别映射关系，对识别字符集进行排序组合处理，生成目标图片对应的识别文字。在本发明专利技术实施例中，解决了现有技术对图像字符识别的准确性不高处理数据消耗时长过大的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像识别领域，尤其涉及一种图片的文字识别方法、设备及存储介质。

技术介绍

1、近年来，随着多媒体时代的蓬勃发展，拍照设备的普及程度越来越高，我们可以在生活和工作中随时随地拍照保存图片。然而，想要将图片中的文本信息提取出来，却并没有那么方便。

2、目前，已有的光学字符识别(optical character recognition，ocr)技术主要基于模板匹配和特征提取两种方法。模板匹配是一种比较简单粗暴的方法，它通过将输入的图像与预先设定好的模板进行比对，从而寻找匹配的字符。特征提取则是通过分析图像中的像素点和排列方式等特征，来识别出字符。然而，现有的ocr技术存在一些限制。首先，它们缺乏自主识别图片中字符的能力，需要事先设置模板或特征来进行匹配，这就限制了其在处理复杂场景图片时的准确性。例如，当图片中存在倾斜、模糊、扭曲或低对比度等情况时，传统ocr技术的识别效果往往不理想。其次，ocr技术在处理大量数据时，往往需要较长的时间。因为它需要逐个字符地进行识别和比对，处理复杂场景图片时准确性不高，整个过程可能会非常耗时，给用户带来不好的体验感。因此，针对现有技术对图像字符识别的准确性不高处理数据消耗时长过大的技术问题，需要一种新的技术来解决当前的问题。

技术实现思路

1、本专利技术的主要目的在于解决现有技术对图像字符识别的准确性不高处理数据消耗时长过大的技术问题。

2、本专利技术第一方面提供了一种图片的文字识别方法，包括步骤：

3、接收目标图片；

4、对所述目标图片进行灰度化处理，生成灰度图片；

5、根据预置灰度值切割算法，对所述灰度图片进行切割处理，得到切割图集和所述切割图集与所述灰度图片的切割映射关系；

6、对所述切割图集进行尺寸归一化处理，得到每个图形尺寸一致的归一化切割图集；

7、根据预置识别神经网络，对所述归一化切割图集进行字符识别处理，生成识别字符集和所述识别字符集与所述归一化切割图集的识别映射关系；

8、基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字。

9、可选的，在本专利技术第一方面的第一种实现方式中，所述根据预置灰度值切割算法，对所述灰度图片进行切割处理，得到切割图集和所述切割图集与所述灰度图片的切割映射关系包括：

10、读取所述灰度图片的所有像素的灰度值；

11、遍历读取所述灰度图片中的像素为目标像素，计算所述目标像素与周围像素的灰度差值，得到目标像素对应的灰度差值集；

12、判断所述灰度差值集中是否存在超过预置差值阈值的灰度差值；

13、若存在超过预置差值阈值的灰度差值，则将所述目标像素写入预置切割像素集中；

14、当所述灰度图片的像素均被读取判断时，则基于所述切割像素集，对所述灰度图片进行拆分处理，生成切割图集和所述切割图集与所述灰度图片的切割映射关系。

15、可选的，在本专利技术第一方面的第二种实现方式中，所述根据预置识别神经网络，对所述归一化切割图集进行字符识别处理，生成识别字符集和所述识别字符集与所述归一化切割图集的识别映射关系包括：

16、遍历读取所述归一化切割图集中的归一化切割图为目标识别图；

17、对所述目标识别图进行矩阵化处理，生成目标识别矩阵；

18、根据预置卷积核集，对所述目标识别矩阵进行多通道卷积处理，生成卷积矩阵集；

19、根据预置池化矩阵，对所述卷积矩阵集每个元素进行池化处理，生成池化降维矩阵集；

20、对所述池化降维矩阵集进行非线性拼接处理，生成激活矩阵；

21、根据预置激活函数，对所述激活矩阵进行激活运算处理，生成所述目标识别图对应的识别字符、所述识别字符与所述归一化切割图集的映射子关系，以及将所述识别字符写入预置识别字符集中，将所述映射子关系写入预置映射关系集中；

22、当所述归一化切割图集中的元素均被识别时，则输出所述识别字符集，以及将所述映射关系集确定为识别映射关系，并输出所述识别映射关系。

23、可选的，在本专利技术第一方面的第三种实现方式中，所述接收目标图片包括：

24、接收互联网传输的目标图片。

25、可选的，在本专利技术第一方面的第四种实现方式中，所述基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字包括：

26、基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字。

27、可选的，在本专利技术第一方面的第五种实现方式中，所述基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字包括：

28、基于所述灰度图片和所述切割映射关系，对所述切割图集进行顺序标记处理，生成排序坐标表；

29、基于所述切割图集与所述归一化切割图集的对应关系，对所述排序坐标表进行调整处理，生成调整排序坐标表；

30、基于所述识别映射关系和所述调整排序坐标表，对所述识别字符集进行排序标记处理，生成所述识别字符集对应的灰度图片排序表；

31、基于所述灰度图片排序表，对所述识别字符集进行拼接组合处理，生成所述目标图片对应的识别文字。

32、可选的，在本专利技术第一方面的第六种实现方式中，所述对所述目标图片进行灰度化处理，生成灰度图片包括：

33、读取所述目标图片中每个像素的rgb通道值；

34、基于所述rgb通道值，对所述目标图片中每个像素进行灰度值计算处理，得到所述目标图片中每个像素对应的灰度值；

35、根据所述目标图片中每个像素对应的灰度值，生成灰度图片。

36、可选的，在本专利技术第一方面的第七种实现方式中，在所述接收目标图片之后，在所述对所述目标图片进行灰度化处理，生成灰度图片之前，还包括：

37、对所述目标图片进行降噪处理，生成降噪的目标图片。

38、本专利技术第二方面提供了一种图片的文字识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述图片的文字识别设备执行上述的图片的文字识别方法。

39、本专利技术的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的图片的文字识别方法。

40、在本专利技术实施例中，通过对图像首先进行灰度化得到灰度图，然后对灰度图进行拆解处理，对拆解后的图像可以并行gpu和cpu运算识别得到对应的字符，再基于原有图像与字符的映射关系，拼接生成的文字组合，采用该处理方式可以识别各类符号，提高识别准确性并加速识别结果生成，解决了现有技术本文档来自技高网...

【技术保护点】

1.一种图片的文字识别方法，其特征在于，包括步骤：

2.根据权利要求1所述的图片的文字识别方法，其特征在于，所述根据预置灰度值切割算法，对所述灰度图片进行切割处理，得到切割图集和所述切割图集与所述灰度图片的切割映射关系包括：

3.根据权利要求1所述的图片的文字识别方法，其特征在于，所述根据预置识别神经网络，对所述归一化切割图集进行字符识别处理，生成识别字符集和所述识别字符集与所述归一化切割图集的识别映射关系包括：

4.根据权利要求1所述的图片的文字识别方法，其特征在于，所述接收目标图片包括：

5.根据权利要求1所述的图片的文字识别方法，其特征在于，所述基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字包括：

6.根据权利要求1所述的图片的文字识别方法，其特征在于，所述基于所述切割映射关系和所述识别映射关系，对所述识别字符集进行排序组合处理，生成所述目标图片对应的识别文字还包括：

7.根据权利要求1所述的图片的文字识别方法，其特征在于，所述对所述目标图片进行

8.根据权利要求1所述的图片的文字识别方法，其特征在于，在所述接收目标图片之后，在所述对所述目标图片进行灰度化处理，生成灰度图片之前，还包括：

9.一种图片的文字识别设备，其特征在于，所述图片的文字识别设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的图片的文字识别方法。

...

【技术特征摘要】

1.一种图片的文字识别方法，其特征在于，包括步骤：

4.根据权利要求1所述的图片的文字识别方法，其特征在于，所述接收目标图片包括：

6.根据权利要求1所述的图片的文字识别...

【专利技术属性】
技术研发人员：易小文，黄德安，陈子文，
申请(专利权)人：深圳麦风科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人