图片预处理方法、文字识别模型训练方法和文字识别方法技术

技术编号:27977207 阅读:47 留言:0更新日期:2021-04-06 14:11
本申请提供了一种图片预处理方法、文字识别模型训练方法和文字识别方法,其中,该方法包括:获取待处理图片,该待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,该卷积循环神经网络模型使用的损失函数为CTC损失函数;根据该卷积循环网络模型确定出每一输出值对应的输入像素数量,根据该输入像素数量对该待处理图片进行像素扩充,以得到扩充图片。能够使得基于处理后的图像训练得到的图像识别模型对图片的识别准确度更高、泛化能力更好。

【技术实现步骤摘要】
图片预处理方法、文字识别模型训练方法和文字识别方法
本申请涉及图像处理
,具体而言,涉及一种图片预处理方法、文字识别模型训练方法和文字识别方法。
技术介绍
目前较多领域中都采用了计算机自动识别的方式对采集到的图片中的文字进行识别。例如,在车库管理系统,则通过采集到的车牌的图片实现对车牌号码的提取。但是针对不同的识别场景,对图片文字的要求不同,目前相机采集到的图片是随机尺寸,可能导致采集到的图片不能够满足文字识别模型的处理需求。
技术实现思路
本申请的目的在于提供一种图片预处理方法、文字识别模型训练方法和文字识别方法,能够解决各异的图片不能够满足图像识别模型的处理需求的问题。第一方面,本专利技术提供一种图片预处理方法,包括:获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。在可选的实施方式中,所述根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片,包括:根据所述输入像素数量确定出第一目标扩充列数,所述第一目标扩充列数小于所述输入像素数量;以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。在可选的实施方式中,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的背景的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。在可选的实施方式中,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的第一边缘的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。在上述实施方式中,使用背景的像素点或边缘像素点对图片进行扩充,可以减少针对扩充像素的选取处理,也使扩充图片能够更符合待处理图片的原始状态。在可选的实施方式中,所述根据所述输入像素数量对所述待处理图片进行像素扩充,包括:根据预设的图片剪切方式,确定出对所述待处理图片的剪切起点;根据所述剪切起点和所述输入像素数量确定出第二目标扩充列数,所述第二目标扩充列数小于所述输入像素数量;以所述待处理图片的剪切起点为扩充起点,向所述待处理图片的第一边扩充第二目标扩充列数的列像素,以得到所述扩充图片,所述第二目标扩充列数小于所述输入像素数量。在上述实施方式中,根据不同的切割起点,可以采用不同的扩充方式,从而可以适应待处理图片以及不同图片识别模型的需求。在可选的实施方式中,所述根据所述剪切起点和所述输入像素数量确定出第二目标扩充列数,包括:根据所述剪切起点确定出所述待处理图片的有效像素列数;根据所述有效像素列数以及所述输入像素数量,确定出所述第二目标扩充列数。在上述实施方式中,通过剪切点的不同,确定出待处理图片中需要处理区域中的有效像素列数,以基于该有效像素列数进行扩充,从而可以使确定出的扩充图片能够满足切割需求。第二方面,本专利技术提供一种文字识别模型训练方法,包括:使用前述实施方式任意一项所述的图片预处理方法对训练数据集中的各个图片进行处理,得到的扩充训练图片集;使用所述扩充训练图片集对初始识别模型进行训练,以得到文字识别模型,所述初始识别模型为一卷积循环神经网络模型。第三方面,本专利技术提供一种文字识别方法,包括:使用前述实施方式任意一项所述的图片预处理方法对待识别图片进行处理,得到的扩充识别图片;将所述扩充识别图片输入前述实施方式所述的文字识别模型训练方法训练得到的文字识别模型进行识别,以得到文字识别结果。第四方面,本专利技术提供一种图片预处理装置,包括:第一确定模块,用于获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;第二确定模块,用于根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;第一扩充模块,用于根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。第五方面,本专利技术提供一种文字识别模型训练装置,包括:第二扩充模块,用于使用前述实施方式任意一项所述的图片预处理方法对训练数据集中的各个图片进行处理,得到的扩充训练图片集;训练模块,用于使用所述扩充训练图片集对初始识别模型进行训练,以得到文字识别模型,所述初始识别模型为一卷积循环神经网络模型。第六方面,本专利技术提供一种文字识别装置,包括:第三扩充模块,用于使用前述实施方式任意一项所述的图片预处理方法对待识别图片进行处理,得到的扩充识别图片;识别模块,用于将所述扩充识别图片输入前述实施方式所述的文字识别模型训练方法训练得到的文字识别模型进行识别,以得到文字识别结果。第七方面,本专利技术提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如前述实施方式任一所述的方法的步骤。第八方面,本专利技术提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如前述实施方式任一所述的方法的步骤。本申请实施例的有益效果是:通过将待处理图片按照需求进行扩充,从而可以使扩充后的图片能够使基于卷积循环神经网络模型对图片的切分结果可以更多样,以满足具体的文字识别场景的模型训练的训练集中的图片需求。能够使基于处理后的图像训练得到的图像识别模型对图片的识别准确度更高和泛化能力更好。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的电子设备的方框示意图。图2为本申请实施例提供的图片预处理方法的流程图。图3为本申请实施例提供的图片预处理装置的功能模块示意图。图4为本申请实施例提供的文字识别模型训练方法的流程图。图5为本申请实施例提供的文字识别模型训练装置的功能模块示意图。图6为本申请实施例提供的文字识别方法的流程图。图7为本申请实施例提供的文字识别装置的功能模块示意图。具体实施方式下面将结合本申请实施例中本文档来自技高网...

【技术保护点】
1.一种图片预处理方法,其特征在于,包括:/n获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;/n根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;/n根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。/n

【技术特征摘要】
1.一种图片预处理方法,其特征在于,包括:
获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;
根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;
根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。


2.根据权利要求1所述的方法,其特征在于,所述根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片,包括:
根据所述输入像素数量确定出第一目标扩充列数,所述第一目标扩充列数小于所述输入像素数量;
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。


3.根据权利要求2所述的方法,其特征在于,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的背景的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。


4.根据权利要求2所述的方法,其特征在于,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的第一边缘的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。


5.根据权利要求1所述的方法,其特征在于,所述根据所述输入像素数量对所述待处理图片进行像素扩充,包括:
根据预设的图片剪切方式,确定出对所述待处理图片的剪切起点;
根据所述剪切起点和所述输入像素数量确定出第二目标扩充列数,...

【专利技术属性】
技术研发人员:张发恩张建伟
申请(专利权)人:创新奇智青岛科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1