字符识别方法及装置制造方法及图纸

技术编号：23892201 阅读：41 留言：0更新日期：2020-04-22 06:56

本申请提供一种字符识别方法及装置，方法包括：将待识别图像输入到字符识别模型，由本字符识别模型通过字符定位网络在待识别图像中定位字符关键点，输出到本字符识别模型中的字符矫正网络，由字符矫正网络在待识别图像中利用字符关键点和预设位置点的对应关系确定待识别图像中的字符区域对应的矫正图像，并输出矫正图像给本字符识别模型中的字符识别网络识别矫正图像中的字符。由于字符矫正网络可对存在倾斜、旋转、形变等问题的图像矫正，因此识别结果稳定性好且识别准确率高，且本字符识别模型通过字符定位网络定位字符关键点并通过字符矫正网络和字符识别网络可得到结果，无需从图像中检测精确字符框，也无需进行分割，因此识别准确率高。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法及装置
本申请涉及图像处理
，尤其涉及一种字符识别方法及装置。
技术介绍
目前的字符识别技术通常包括字符区域定位和字符分割两个模块。在基于深度学习方法中，字符识别技术需要通过多个深度学习模型来实现，即先将图像输入特征提取模型提取图像的特征，然后再将特征提取模型输出的特征输入目标检测模型检测字符框，最后再将目标检测模型输出的字符框和特征提取模型输出的特征输入字符分割模型进行字符分割。然而，这种多个深度学习模型独立存在，每个深度学习模型之间均有数据交互，因此会存在冗余计算，占用内存空间，导致字符识别速度低。
技术实现思路
有鉴于此，本申请提供一种字符识别方法及装置，以解决相关技术中的字符识别方式识别速度低的问题。根据本申请实施例的第一方面，提供一种字符识别方法，所述方法包括：将待识别图像输入到已训练的字符识别模型，以由本字符识别模型通过字符定位网络在所述待识别图像中定位字符关键点，并输出到本字符识别模型中的字符矫正网络，以由所述字符矫正网络在所述待识别图像中利用所述字符关键点和预设位...

【技术保护点】
1.一种字符识别方法，其特征在于，所述方法包括：/n将待识别图像输入到已训练的字符识别模型，以由本字符识别模型通过字符定位网络在所述待识别图像中定位字符关键点，并输出到本字符识别模型中的字符矫正网络，以由所述字符矫正网络在所述待识别图像中利用所述字符关键点和预设位置点的对应关系确定所述待识别图像中的字符区域对应的矫正图像，并输出所述矫正图像给本字符识别模型中的字符识别网络识别所述矫正图像中的字符；/n获取所述字符识别模型输出的字符识别结果。/n

【技术特征摘要】
1.一种字符识别方法，其特征在于，所述方法包括：
将待识别图像输入到已训练的字符识别模型，以由本字符识别模型通过字符定位网络在所述待识别图像中定位字符关键点，并输出到本字符识别模型中的字符矫正网络，以由所述字符矫正网络在所述待识别图像中利用所述字符关键点和预设位置点的对应关系确定所述待识别图像中的字符区域对应的矫正图像，并输出所述矫正图像给本字符识别模型中的字符识别网络识别所述矫正图像中的字符；
获取所述字符识别模型输出的字符识别结果。

2.根据权利要求1所述的方法，其特征在于，字符定位网络在所述待识别图像中定位字符关键点，包括：
通过本字符定位网络中的特征提取网络提取所述待识别图像的特征，并输出给本字符定位网络中的关键点回归网络；
所述关键点回归网络利用提取的特征进行字符关键点提取。

3.根据权利要求1所述的方法，其特征在于，所述字符矫正网络在所述待识别图像中利用所述字符关键点和预设位置点的对应关系确定所述待识别图像中的字符区域对应的矫正图像，包括：
依据所述字符关键点和预设位置点的对应关系确定对应的薄板样条函数TPS变换矩阵，所述字符关键点的个数与所述预设位置点的个数一致；
创建一个空白的矫正图像；
针对所述矫正图像中的每个位置点，利用所述TPS变换矩阵确定该位置点在所述待识别图像中对应的坐标点，并利用所述坐标点附近像素点的像素值插值得到矫正像素值，并将所述矫正像素值填充到所述矫正图像中的该位置点上。

4.根据权利要求1所述的方法，其特征在于，所述字符识别网络识别所述矫正图像中的字符，包括：
通过本字符识别网络中的卷积神经网络提取所述矫正图像的特征，并输出给本字符识别网络中的循环神经网络；
所述循环神经网络对所述特征进行加权编码，并输出加权编码后的特征给本字符识别网络中的解码网络；
所述解码网络对所述加权编码后的特征解码得到至少一个特征序列，并输出所述至少一个特征序列给本字符识别网络中的分类层；
所述分类层对每个特征序列进行分类，以得到每个特征序列对应的字符内容。

5.根据权利要求1所述的方法，其特征在于，所述字符识别模型通过如下方式训练：
获取包含字符的训练样本；
利用所述训练样本训练对所述字符识别模型进行端到端训练，直至训练次数达到预设次数，停止训练。

6.一种字符识别装置，其特征在于，所述装置包括：
字符识别模块，用于将待识别图像输入到已训练的字符识别模型，以由本字符识别模型通过字符定位网络在所述待识别图像中定位字符关键点，并输出到本字符识别模型中的字符矫正网络，以由所述字符矫正网络在所述待识别图像中利...

【专利技术属性】
技术研发人员：朱尧，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人