字符识别的方法及电子设备技术

技术编号：36035828 阅读：30 留言：0更新日期：2022-12-21 10:39

本申请属于计算机视觉技术领域，公开了字符识别的方法及电子设备，该方法包括，基于切分长度阈值以及交叠长度预设值，将待识别的目标文本图片进行切分，获得多个文本子图片；采用字符识别模型，对各文本子图片进行字符识别，获得各文本子图片各自对应的字符识别信息；分别将每两个相邻文本子图片的重叠字符进行匹配，获得匹配结果；两个相邻文本子图片的重叠字符是从两个相邻文本子图片的重叠区域中分别识别出的字符；根据匹配结果，将各字符识别信息进行拼接处理，获得目标文本图片的字符识别信息。这样，解决了字符识别模型难以准确识别包含较长文本的图片的问题。确识别包含较长文本的图片的问题。确识别包含较长文本的图片的问题。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别的方法及电子设备

[0001]本申请涉及计算机视觉
，具体而言，涉及字符识别的方法及电子设备。

技术介绍

[0002]针对文本图像(即包含文本的图片)的字符识别技术是计算机视觉中的一种常用技术，通常应用于文档信息提取、证照识别以及资质审核等场景。
[0003]现有技术下，通常采用字符识别模型，对文本图片进行字符识别，获得字符识别信息。
[0004]但是，受设备的内存或显存限制，字符识别模型通常无法支持较长的文字行图片，适用范围较小，且文本图片的文本长度较长时，字符识别的准确率通常较低。因此，在对包含较长文本的文本图片进行识别时，如何提高字符识别的准确率以及适用范围是一个需要解决的问题。

技术实现思路

[0005]本申请实施例的目的在于提供字符识别的方法及电子设备，用以在对包含较长文本的文本图片进行识别时，提高字符识别的准确率以及适用范围。
[0006]一方面，提供一种字符识别的方法，包括：
[0007]基于切分长度阈值以及交叠长度预设值，将待识别的目标文本图片进行...

【技术保护点】

【技术特征摘要】
1.一种字符识别的方法，其特征在于，包括：基于切分长度阈值以及交叠长度预设值，将待识别的目标文本图片进行切分，获得多个文本子图片；所述交叠长度预设值为任意两个相邻文本子图片之间重叠区域的长度；所述文本子图片的长度大于所述交叠长度预设值且不大于所述切分长度阈值；采用字符识别模型，对各文本子图片进行字符识别，获得各文本子图片各自对应的字符识别信息；分别将每两个相邻文本子图片的重叠字符进行匹配，获得匹配结果；两个相邻文本子图片的重叠字符是从所述两个相邻文本子图片的重叠区域中分别识别出的字符；根据所述匹配结果，将各字符识别信息进行拼接处理，获得所述目标文本图片的字符识别信息。2.如权利要求1所述的方法，其特征在于，在所述基于切分长度阈值以及交叠长度预设值，将待识别的目标文本图片进行切分，获得多个文本子图片之前，所述方法还包括：对原始图片进行文本行检测，获得文本行区域；从所述原始图片中划分出包含所述文本行区域的文本行图片；根据所述文本行图片的高度，以及图片高度预设值，获得缩放比例；按照所述缩放比例，分别对所述文本行图片的高度和长度进行缩放，获得所述目标文本图片。3.如权利要求1所述的方法，其特征在于，所述基于切分长度阈值以及交叠长度预设值，将待识别的目标文本图片进行切分，获得多个文本子图片，包括：基于所述切分长度阈值以及所述交叠长度预设值，将所述目标文本图片进行划分，获得至少一个长度为所述切分长度阈值的文本子图片，以及至少一个长度大于所述交叠长度预设值且小于所述切分长度阈值的文本子图片；或者，基于所述切分长度阈值以及所述交叠长度预设值，将所述目标文本图片进行等长划分，获得多个长度相同的文本子图片。4.如权利要求1
‑
3任一项所述的方法，其特征在于，所述采用字符识别模型，对各文本子图片进行字符识别，获得各文本子图片各自对应的字符识别信息，包括：将各文本子图片输入所述字符识别模型，分别获得每一文本子图片中的各字符以及每一字符对应的置信度；其中，所述字符识别信息包括字符及其对应的置信度，所述置信度为字符识别的可信度。5.如权利要求4所述的方法，其特征在于，所述分别将每两个相邻文本子图片的重叠字符进行匹配，获得匹配结果，包括：针对各文本子图片中的第一目标文本子图片和第二目标文本子图片，将所述第一目标文本子图片的第一字符识别信息中的后n个字符与所述第二目标文本子图片中的第二字符识别信息中的前n个字符进行匹配，获得所述匹配结果；其中，所述第一目标文本子图片和所述第二目标文本子图片为各文本子图片中任意相邻的两个文本子图片，且所述第一目标文本子图片为所述第二目标文本子图片的前一个文本子图片，n为最大重叠字符数，n为正整数。6.如权利要求5所述的方法，其特征在于，所述根据所述匹配结果，将各字符识别信息
进行拼接处理，获得所述目标文本图片的字符识别信息，包括：针对各文本子图片中的第一目标文本子图片和第二目标文本子图片，基于重叠区域字符数以及所述匹配结果，对所述第一目标文本子图片的第一字符识别信息和所述第二目标文本子图片的第二字符识别信息进行字符筛选处理；所述重叠区域字符数用于指示一个文本子图片的一个重叠区域中包含的重叠字符的数量；将...

【专利技术属性】
技术研发人员：宋祺，卫虎乐，张睿，
申请(专利权)人：上海弘玑信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人